Introdução geral
O Surya é um kit de ferramentas de OCR de código aberto para documentos multilíngues que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele é capaz não apenas de detectar texto linha por linha, mas também de analisar o layout, detectar a ordem de leitura e reconhecer tabelas. O desempenho do Surya rivaliza com o dos serviços baseados em nuvem para uma ampla variedade de tipos de documentos, incluindo PDFs, imagens, documentos do Word e PPTs. O kit de ferramentas foi projetado para oferecer aos usuários uma solução abrangente de análise de documentos.
API de hospedagem: https://www.datalab.to/
Para PDFs, imagens, documentos do Word e PowerPoint
Lista de funções
- OCR: reconhecimento de texto em mais de 90 idiomas
- Detecção de texto linha a linha: identifica automaticamente a posição de cada linha de texto em um documento
- Análise de layout: detecção de tabelas, imagens, cabeçalhos e outros elementos no documento
- Detecção de ordem de leitura: identificação da ordem de leitura em um documento
- Reconhecimento de tabelas: detecção de linhas e colunas em uma tabela
Usando a Ajuda
Processo de instalação
- Certifique-se de que o Python 3.9+ e o PyTorch estejam instalados.
- Se você não estiver usando um Mac ou uma máquina com GPU, talvez seja necessário instalar primeiro a versão do torch para CPU.
- Use o seguinte comando para instalar o Surya:
pip install surya-ocr
- Na primeira vez que você executa o Surya, os pesos do modelo são baixados automaticamente.
Processo de uso
- Verificar e configurar
surya/settings.py
na variável de ambiente, você pode substituir qualquer configuração com a variável de ambiente. - A Surya detecta automaticamente os dispositivos de lanterna, mas eles podem ser substituídos manualmente. Exemplo:
TORCH_DEVICE=cuda
- Use o seguinte comando para executar o aplicativo OCR:
python run_ocr_app.py
- Ao processar um documento, você pode escolher entre diferentes módulos funcionais, como detecção de texto, análise de layout, etc.
Função Fluxo de operação
- Função OCR::
- Carregar documentos (PDFs, imagens, etc.).
- Selecione o idioma (há suporte para mais de 90 idiomas).
- Execute o reconhecimento de OCR para extrair o conteúdo do texto.
- Detecção de texto linha a linha::
- Carregue o documento.
- Execute a detecção de texto linha por linha para obter a posição de cada linha de texto.
- Exportar resultados de testes.
- Análise de layout::
- Carregue o documento.
- Execute uma análise de layout para detectar elementos como tabelas, imagens, cabeçalhos, etc. em um documento.
- Exportar os resultados da análise.
- Teste de sequência de leitura::
- Carregue o documento.
- Execute a detecção da ordem de leitura para identificar a ordem de leitura em um documento.
- Exportar resultados de testes.
- reconhecimento de formulários::
- Carregue o documento.
- Execute o Reconhecimento de tabela para detectar linhas e colunas em uma tabela.
- Exportar os resultados do reconhecimento.
A Surya oferece funções avançadas de análise de documentos, e os usuários podem escolher diferentes módulos de função para operar de acordo com suas necessidades. Você pode consultar a documentação oficial e o código de amostra para obter procedimentos de operação detalhados e instruções de configuração.