Introdução geral ao Pix2Text
O Pix2Text (P2T) é uma ferramenta gratuita e de código aberto projetada para substituir o Mathpix, fornecendo reconhecimento de texto em imagens e fórmulas matemáticas. Os usuários podem usar a ferramenta gratuitamente por meio da versão da Web, reconhecendo até 10.000 caracteres por dia. O P2T é compatível com o reconhecimento e a conversão de texto, tabelas, fórmulas matemáticas etc. de imagens em formato LaTeX ou Markdown para facilitar a edição e o uso.
Lista de recursos do Pix2Text
- Reconhecimento de texto em imagens: reconhece textos em chinês e inglês em imagens e os converte em texto editável.
- Reconhecimento de fórmulas matemáticas: reconheça fórmulas matemáticas em imagens e converta-as em uma representação LaTeX.
- Reconhecimento de tabelas: reconhece tabelas em imagens e as converte para o formato Markdown.
- Conversão de PDF: Converta o conteúdo de um arquivo PDF para o formato Markdown.
- Uso gratuito: até 10.000 caracteres por dia.
Ajuda do Pix2Text
Instalação e uso
O Pix2Text está disponível em uma versão baseada na Web que não exige que o usuário instale nenhum software. Basta acessar Site da Pix2Text e carregar a imagem ou o arquivo PDF que precisa ser reconhecido, você poderá obter o resultado do reconhecimento.
Função Fluxo de operação
- Acesso ao siteAbra seu navegador e acesse Site da Pix2Text.
- Carregamento de arquivosClique no botão "Upload file" (Carregar arquivo) na página e selecione a imagem ou o arquivo PDF a ser reconhecido.
- Seleção do tipo de identificaçãoReconhecimento de texto, fórmulas matemáticas ou tabelas, conforme necessário.
- Exibir resultadosClique no botão "Start Recognition" (Iniciar reconhecimento) e aguarde alguns segundos para que o resultado do reconhecimento seja exibido.
- Resultados do downloadResultados do reconhecimento: os resultados do reconhecimento podem ser copiados diretamente ou baixados como um arquivo LaTeX ou Markdown.
Funções detalhadas
- Reconhecimento de texto e imagemSuporte ao reconhecimento de texto em chinês e inglês para vários documentos, livros, anotações manuscritas e outras imagens.
- Reconhecimento de fórmulas matemáticasEle adota um modelo avançado de detecção e reconhecimento de fórmulas matemáticas, que pode identificar com precisão fórmulas matemáticas em imagens e convertê-las em representações LaTeX, facilitando a pesquisa acadêmica e a elaboração de teses.
- reconhecimento de formuláriosReconhece estruturas de tabelas em imagens e as converte para o formato Markdown para facilitar o uso em documentos.
- Conversão de PDFConverta arquivos PDF para o formato Markdown para usuários que precisam editar e organizar o conteúdo do PDF.
- Uso gratuitoO Pix2Text é de uso gratuito e reconhece até 10.000 caracteres por dia, o que o torna adequado para indivíduos e pequenas equipes.
Dicas e truques
- Imagens de alta qualidade: O upload de imagens nítidas pode melhorar a precisão do reconhecimento.
- identificação de segmentosPara documentos mais longos, as imagens podem ser carregadas para reconhecimento em segmentos para garantir que cada segmento seja reconhecido com precisão.
- Resultados da inspeção: Os resultados do reconhecimento podem conter um pequeno número de erros e os usuários são aconselhados a verificar e revisar antes de usar.
Implantação do projeto Pix2Text
montagem
- Endereço de código aberto:https://github.com/breezedeus/Pix2Text
- Preparação do ambiente PythonVerifique se o Python 3.6 ou superior está instalado.
- Instalar o Pix2Text::
pip install pix2text
Se você precisar reconhecer texto em vários idiomas, use o seguinte comando para instalar pacotes adicionais:
pip install pix2text[multilingual]
Se a instalação estiver lenta, você poderá especificar uma fonte de instalação doméstica, como usar a fonte de instalação do AliCloud:
pip install pix2text -i https://mirrors.aliyun.com/pypi/simple
fazer uso de
- ferramenta de linha de comando::
- Reconhecer texto em imagens:
pix2text image.jpg
- Reconhecer arquivos PDF:
pix2text document.pdf
- Reconhecer texto em imagens:
- Serviço HTTP::
- Inicie o serviço HTTP:
pix2text serve
- Reconhecer imagens por meio de solicitações HTTP:
curl -F "file=@image.jpg" http://localhost:5000/ocr
- Inicie o serviço HTTP:
- Uso da versão web::
- Visite a versão on-line do site do Pix2Text e arraste e solte a imagem na área designada para obter o resultado do reconhecimento.
exemplo típico
- Reconhecimento de texto e imagemImagem de entrada: !example Texto de saída:
这是一个示例文本。
- Reconhecimento de fórmulas matemáticasImagem de entrada: !exemplo Fórmula de saída:
$$E=mc^2$$
- reconhecimento de formuláriosImagem de entrada: !exemplo Tabela de saída:
| Header1 | Header2 | |---------|---------| | Data1 | Data2 |