Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

Pix2Text: ferramenta de reconhecimento de texto de imagem gratuita e de código aberto

Introdução geral ao Pix2Text

O Pix2Text (P2T) é uma ferramenta gratuita e de código aberto projetada para substituir o Mathpix, fornecendo reconhecimento de texto em imagens e fórmulas matemáticas. Os usuários podem usar a ferramenta gratuitamente por meio da versão da Web, reconhecendo até 10.000 caracteres por dia. O P2T é compatível com o reconhecimento e a conversão de texto, tabelas, fórmulas matemáticas etc. de imagens em formato LaTeX ou Markdown para facilitar a edição e o uso.

 


Pix2Text:开源免费图片文字识别工具-1

 

 

Lista de recursos do Pix2Text

  • Reconhecimento de texto em imagens: reconhece textos em chinês e inglês em imagens e os converte em texto editável.
  • Reconhecimento de fórmulas matemáticas: reconheça fórmulas matemáticas em imagens e converta-as em uma representação LaTeX.
  • Reconhecimento de tabelas: reconhece tabelas em imagens e as converte para o formato Markdown.
  • Conversão de PDF: Converta o conteúdo de um arquivo PDF para o formato Markdown.
  • Uso gratuito: até 10.000 caracteres por dia.

 

Ajuda do Pix2Text

Instalação e uso

O Pix2Text está disponível em uma versão baseada na Web que não exige que o usuário instale nenhum software. Basta acessar Site da Pix2Text e carregar a imagem ou o arquivo PDF que precisa ser reconhecido, você poderá obter o resultado do reconhecimento.

Função Fluxo de operação

  1. Acesso ao siteAbra seu navegador e acesse Site da Pix2Text.
  2. Carregamento de arquivosClique no botão "Upload file" (Carregar arquivo) na página e selecione a imagem ou o arquivo PDF a ser reconhecido.
  3. Seleção do tipo de identificaçãoReconhecimento de texto, fórmulas matemáticas ou tabelas, conforme necessário.
  4. Exibir resultadosClique no botão "Start Recognition" (Iniciar reconhecimento) e aguarde alguns segundos para que o resultado do reconhecimento seja exibido.
  5. Resultados do downloadResultados do reconhecimento: os resultados do reconhecimento podem ser copiados diretamente ou baixados como um arquivo LaTeX ou Markdown.

 

Funções detalhadas

  • Reconhecimento de texto e imagemSuporte ao reconhecimento de texto em chinês e inglês para vários documentos, livros, anotações manuscritas e outras imagens.
  • Reconhecimento de fórmulas matemáticasEle adota um modelo avançado de detecção e reconhecimento de fórmulas matemáticas, que pode identificar com precisão fórmulas matemáticas em imagens e convertê-las em representações LaTeX, facilitando a pesquisa acadêmica e a elaboração de teses.
  • reconhecimento de formuláriosReconhece estruturas de tabelas em imagens e as converte para o formato Markdown para facilitar o uso em documentos.
  • Conversão de PDFConverta arquivos PDF para o formato Markdown para usuários que precisam editar e organizar o conteúdo do PDF.
  • Uso gratuitoO Pix2Text é de uso gratuito e reconhece até 10.000 caracteres por dia, o que o torna adequado para indivíduos e pequenas equipes.

 

Dicas e truques

  • Imagens de alta qualidade: O upload de imagens nítidas pode melhorar a precisão do reconhecimento.
  • identificação de segmentosPara documentos mais longos, as imagens podem ser carregadas para reconhecimento em segmentos para garantir que cada segmento seja reconhecido com precisão.
  • Resultados da inspeção: Os resultados do reconhecimento podem conter um pequeno número de erros e os usuários são aconselhados a verificar e revisar antes de usar.

 

 

Implantação do projeto Pix2Text

montagem

  1. Endereço de código aberto:https://github.com/breezedeus/Pix2Text
  2. Preparação do ambiente PythonVerifique se o Python 3.6 ou superior está instalado.
  3. Instalar o Pix2Text::
    pip install pix2text
    

    Se você precisar reconhecer texto em vários idiomas, use o seguinte comando para instalar pacotes adicionais:

    pip install pix2text[multilingual]
    

    Se a instalação estiver lenta, você poderá especificar uma fonte de instalação doméstica, como usar a fonte de instalação do AliCloud:

    pip install pix2text -i https://mirrors.aliyun.com/pypi/simple
    

     

fazer uso de

  1. ferramenta de linha de comando::
    • Reconhecer texto em imagens:
      pix2text image.jpg
      

       

    • Reconhecer arquivos PDF:
      pix2text document.pdf
      

       

  2. Serviço HTTP::
    • Inicie o serviço HTTP:
      pix2text serve
      

       

    • Reconhecer imagens por meio de solicitações HTTP:
      curl -F "file=@image.jpg" http://localhost:5000/ocr
      

       

  3. Uso da versão web::
    • Visite a versão on-line do site do Pix2Text e arraste e solte a imagem na área designada para obter o resultado do reconhecimento.

exemplo típico

  • Reconhecimento de texto e imagemImagem de entrada: !example Texto de saída:
    这是一个示例文本。
    

     

  • Reconhecimento de fórmulas matemáticasImagem de entrada: !exemplo Fórmula de saída:
    $$E=mc^2$$
    

     

  • reconhecimento de formuláriosImagem de entrada: !exemplo Tabela de saída:
    | Header1 | Header2 |
    |---------|---------|
    | Data1   | Data2   |
    
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Pix2Text: ferramenta de reconhecimento de texto de imagem gratuita e de código aberto
pt_BRPortuguês do Brasil