Total de 20 artigos
Tags: OCR
Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece uma interface de aplicativo da Web Streamlit fácil de usar. Ele oferece suporte a vários ...
Introdução geral O STranslate é uma ferramenta de tradução e OCR pronta para uso desenvolvida pela WPF. A ferramenta foi projetada para fornecer tradução eficiente e conveniente e funcionalidade de reconhecimento óptico de caracteres (OCR) para uma ampla variedade de idiomas e tipos de texto.
Descrição geral O VisionParser é uma ferramenta de OCR (reconhecimento óptico de caracteres) projetada para processar recibos e faturas. Por meio da avançada tecnologia de IA generativa, o VisionParser é capaz de converter com rapidez e precisão todos os tipos de recibos e faturas em dados estruturados para uma ampla gama de setores, como varejo, catering, serviços B2B...
Introdução abrangente O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). Ela foi desenvolvida pela Lumina AI Inc. e usa modelos visuais avançados para a ingestão de documentos...
Introdução geral O Llama OCR é uma biblioteca de OCR (reconhecimento óptico de caracteres) baseada no Llama 3.2 Vision que converte documentos para o formato Markdown. Desenvolvida pela Nutlope, a biblioteca usa a interface gratuita do Llama 3.2 fornecida pela Together AI para analisar imagens e retornar documentos em formato Markdown...
Introdução abrangente O Docling é uma ferramenta avançada de análise e exportação de documentos que suporta uma ampla gama de formatos de documentos, incluindo PDF, DOCX, PPTX, XLSX, Imagem, HTML, AsciiDoc e Markdown. Ele pode analisar e exportar esses documentos para os formatos HTML, Markdown e JSON, com suporte para incorporação e...
Introdução abrangente O ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) é um projeto de código aberto que visa aprimorar o processamento de inteligência de documentos por meio de modelos de pré-treinamento de layout de texto generativo guiados visualmente. O projeto foi desenvolvido pela Veason-silverbul...
Introdução geral O ScreenPipe é um assistente de IA desenvolvido pela mediar-ai que se concentra na gravação do conteúdo da tela, capturando capturas de tela e áudio 24 horas por dia, 7 dias por semana. Ele combina a tecnologia do rewind.ai e do cursor.com para armazenar dados gravados em um banco de dados local e é compatível com o idioma chinês ...
Descrição geral A API de extração de texto (text-extract-api) é uma ferramenta avançada projetada para extrair e analisar o conteúdo de uma variedade de formatos de documentos (por exemplo, PDF, Word, PPTX etc.). A API utiliza a tecnologia de reconhecimento óptico de caracteres (OCR) de última geração e modelos compatíveis com Ollama para poder pegar qualquer documento ou imagem...
Descrição geral O Picture to Excel Free Tool é uma ferramenta on-line eficiente que pode identificar e converter, de forma rápida e precisa, dados tabulares de imagens em arquivos do Excel. A ferramenta é compatível com uma ampla variedade de formatos de imagem, como JPG e PNG, e pode ser usada em páginas da Web, aplicativos iOS e aplicativos Android. Por meio da avançada tecnologia de IA...