Introdução geral
O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. O modelo Marker da plataforma pode converter PDF em Markdown de forma rápida e precisa, incluindo tabelas e fórmulas. O modelo Surya oferece suporte a OCR em mais de 90 idiomas, detectando linhas de texto em vários idiomas e reconhecendo blocos de layout, como cabeçalhos, imagens e fórmulas em um documento. Os usuários podem usar essas ferramentas com segurança em seu próprio ambiente.
Apresentado Projeto de análise de dados de código aberto marcador e surya, autores de código aberto, para detectar e extrair formulários.
Lista de funções
- MarcadorConverta PDF para Markdown de forma rápida e precisa, incluindo tabelas e fórmulas.
- SuryaSuporte a OCR para mais de 90 idiomas, detecção de linhas de texto e reconhecimento de blocos de layout de documentos.
- TexifyFórmulas reconhecidas por OCR: Converta fórmulas reconhecidas por OCR para o formato LaTeX.
- Uso seguro:: Os usuários podem usar essas ferramentas com segurança em seus próprios ambientes.
Usando a Ajuda
Marcador
- montagemDownload e instalação das dependências relevantes para o modelo do Marcador.
- fazer uso deFaça upload de arquivos PDF para o Marker, clique no botão Convert (Converter) e aguarde alguns segundos para obter os arquivos no formato Markdown.
- advertênciaVerifique se os arquivos PDF estão claros para aumentar a precisão da conversão.
Surya
- montagemDownload e instalação das dependências relevantes para o modelo Surya.
- fazer uso deCarregue o documento a ser submetido ao OCR, selecione o idioma, clique no botão Iniciar e aguarde o resultado do OCR.
- funcionalidadeSuporte para OCR em vários idiomas, detecção de linhas de texto e reconhecimento de layout de documentos.
- advertência: Para documentos complexos, a segmentação é recomendada para melhorar a precisão do reconhecimento.
Texify
- montagemDownload e instalação das dependências relevantes para o modelo Texify.
- fazer uso deCarregue um documento que contenha fórmulas, clique no botão Convert (Converter) e aguarde alguns segundos para obter as fórmulas no formato LaTeX.
- advertência:: Certifique-se de que as fórmulas sejam claras para aumentar a precisão da conversão.