Aprendizagem pessoal com IA
e orientação prática

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução geral

O Surya é um kit de ferramentas de OCR de código aberto para documentos multilíngues que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele é capaz não apenas de detectar texto linha por linha, mas também de analisar o layout, detectar a ordem de leitura e reconhecer tabelas. O desempenho do Surya rivaliza com o dos serviços baseados em nuvem para uma ampla variedade de tipos de documentos, incluindo PDFs, imagens, documentos do Word e PPTs. O kit de ferramentas foi projetado para oferecer aos usuários uma solução abrangente de análise de documentos.

API de hospedagem: https://www.datalab.to/

Para PDFs, imagens, documentos do Word e PowerPoint

Surya: Ferramenta profissional de OCR de documentos multilíngues-1


 

Lista de funções

  • OCR: reconhecimento de texto em mais de 90 idiomas
  • Detecção de texto linha a linha: identifica automaticamente a posição de cada linha de texto em um documento
  • Análise de layout: detecção de tabelas, imagens, cabeçalhos e outros elementos no documento
  • Detecção de ordem de leitura: identificação da ordem de leitura em um documento
  • Reconhecimento de tabelas: detecção de linhas e colunas em uma tabela

 

Usando a Ajuda

Processo de instalação

  1. Certifique-se de que o Python 3.9+ e o PyTorch estejam instalados.
  2. Se você não estiver usando um Mac ou uma máquina com GPU, talvez seja necessário instalar primeiro a versão do torch para CPU.
  3. Use o seguinte comando para instalar o Surya:
    pip install surya-ocr
    
  4. Na primeira vez que você executa o Surya, os pesos do modelo são baixados automaticamente.

Processo de uso

  1. Verificar e configurarsurya/settings.pyna variável de ambiente, você pode substituir qualquer configuração com a variável de ambiente.
  2. A Surya detecta automaticamente os dispositivos de lanterna, mas eles podem ser substituídos manualmente. Exemplo:
    TORCH_DEVICE=cuda
    
  3. Use o seguinte comando para executar o aplicativo OCR:
    python run_ocr_app.py
    
  4. Ao processar um documento, você pode escolher entre diferentes módulos funcionais, como detecção de texto, análise de layout, etc.

Função Fluxo de operação

  1. Função OCR::
    • Carregar documentos (PDFs, imagens, etc.).
    • Selecione o idioma (há suporte para mais de 90 idiomas).
    • Execute o reconhecimento de OCR para extrair o conteúdo do texto.
  2. Detecção de texto linha a linha::
    • Carregue o documento.
    • Execute a detecção de texto linha por linha para obter a posição de cada linha de texto.
    • Exportar resultados de testes.
  3. Análise de layout::
    • Carregue o documento.
    • Execute uma análise de layout para detectar elementos como tabelas, imagens, cabeçalhos, etc. em um documento.
    • Exportar os resultados da análise.
  4. Teste de sequência de leitura::
    • Carregue o documento.
    • Execute a detecção da ordem de leitura para identificar a ordem de leitura em um documento.
    • Exportar resultados de testes.
  5. reconhecimento de formulários::
    • Carregue o documento.
    • Execute o Reconhecimento de tabela para detectar linhas e colunas em uma tabela.
    • Exportar os resultados do reconhecimento.

A Surya oferece funções avançadas de análise de documentos, e os usuários podem escolher diferentes módulos de função para operar de acordo com suas necessidades. Você pode consultar a documentação oficial e o código de amostra para obter procedimentos de operação detalhados e instruções de configuração.

Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil