OCR

Total de 27 artigos

organizar em ordem

VOP: ferramenta de OCR para extração de diagramas complexos e fórmulas matemáticas

Introdução abrangente O Versatile OCR Program é uma ferramenta de reconhecimento óptico de caracteres (OCR) de código aberto projetada para trabalhar com documentos acadêmicos e educacionais complexos. Ele pode extrair texto, tabelas, fórmulas matemáticas, diagramas e esquemas de PDFs, imagens e outros documentos e gerar...

5 meses atrás

016.7K

Analise automaticamente o conteúdo do PDF e extraia texto e tabelas de serviços de código aberto

Introdução abrangente Analisa automaticamente o layout de documentos PDF, identifica texto, títulos, imagens, tabelas, fórmulas e outros elementos na página e determina sua ordem correta. A ferramenta oferece suporte à funcionalidade de OCR e pode converter PDFs digitalizados em texto pesquisável. Ela é executada no Docker e oferece dois modelos...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

5 meses atrás

019.1K

RolmOCR: modelo de OCR de documentos para reconhecimento de caracteres manuscritos e inclinados

Introdução geral O RolmOCR é uma ferramenta de reconhecimento óptico de caracteres (OCR) de código aberto desenvolvida pela equipe Reducto AI, com base no modelo de linguagem visual Qwen2.5-VL-7B. Ela pode extrair texto de imagens e arquivos PDF mais rapidamente do que ferramentas semelhantes...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR

6 meses atrás

020.9K

uniOCR: ferramenta de reconhecimento de texto de código aberto multiplataforma

Introdução geral O uniOCR é uma ferramenta de reconhecimento de texto de código aberto desenvolvida pela equipe mediar-ai. Ela é baseada na linguagem Rust e é compatível com os sistemas macOS, Windows e Linux. Os usuários podem usá-la para extrair texto de imagens...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR

6 meses atrás

017.1K

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Introdução geral O PDF Craft é uma ferramenta de código aberto projetada para digitalizar PDFs de livros e convertê-los para o formato Markdown. Ela foi desenvolvida pelo oomol-lab e está hospedada no GitHub para usuários que gostam de organizar seus livros eletrônicos. A ferramenta funciona por meio desta ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

6 meses atrás

021.3K

SmolDocling: um modelo de linguagem visual para o processamento eficiente de documentos em um pequeno volume

Introdução abrangente O SmolDocling é um Modelo de Linguagem Visual (VLM) desenvolvido pela equipe do ds4sd em colaboração com a IBM, desenvolvido com base no SmolVLM-256M e hospedado na plataforma Hugging Face. Seu tamanho é pequeno, apenas ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

6 meses atrás

017.6K

Mistral OCR: 94,89% Precisão geral, 1000 páginas/30 segundos, apenas US$ 1

Na longa história da civilização humana, cada salto na forma como as informações são adquiridas e analisadas contribuiu profundamente para o progresso social. Desde os antigos hieróglifos, passando pelo papiro portátil, até o surgimento posterior da prensa tipográfica e a atual onda digital, cada inovação tecnológica expandiu enormemente o paradigma da disseminação do conhecimento humano...

Recursos mais recentes de IA # Serviços abertos de IA # OCR # Extração e limpeza de documentos

7 meses atrás

021K

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama

Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece um software Strea...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

8 meses atrás

028.6K

STranslate: uma ferramenta de tradução leve com várias interfaces de tradução e funcionalidade de OCR

Introdução geral O STranslate é uma ferramenta de tradução e OCR pronta para uso, desenvolvida pela WPF. A ferramenta foi projetada para fornecer tradução eficiente e conveniente e funcionalidade de reconhecimento óptico de caracteres (OCR) para uma ampla variedade de idiomas e tipos de texto.

Recursos mais recentes de IA Tradução de IA ## OCR

9 meses atrás

018.8K

VisionParser: ferramenta de OCR para processamento de alta precisão de recibos e faturas, API disponível

Descrição geral O VisionParser é uma ferramenta de OCR (reconhecimento óptico de caracteres) projetada para processar recibos e faturas. Com a avançada tecnologia de IA generativa, o VisionParser é capaz de converter com rapidez e precisão todos os tipos de recibos e faturas em dados estruturados para...

Recursos mais recentes de IA # OCR

9 meses atrás

018.5K

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução geral O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). O projeto foi desenvolvido pela Lumina...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

9 meses atrás

021.3K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR: biblioteca de OCR que converte imagens em Markdown em três linhas de código usando a interface Llama 3.2 Vision gratuita

Introdução geral O Llama OCR é uma biblioteca de OCR (reconhecimento óptico de caracteres) baseada no Llama 3.2 Vision, capaz de converter documentos para o formato Markdown. A biblioteca foi desenvolvida pela Nutlope e usa o Together...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Modelo grande e gratuito de API

9 meses atrás

021.8K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: suporte a uma variedade de formatos, análise de documentos e exportação para Markdown e JSON, suporte a PDF, OCR

Introdução abrangente O Docling é uma poderosa ferramenta de análise e exportação de documentos que suporta uma ampla gama de formatos de documentos, incluindo PDF, DOCX, PPTX, XLSX, Imagem, HTML, AsciiDoc e Markdown.

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

9 meses atrás

028.9K

ViTLP: extração de dados estruturados de documentos PDF tipograficamente complexos e geração visualmente orientada de modelos pré-treinados para layout de texto

Introdução abrangente O ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) é um projeto de código aberto desenvolvido para passar...

Recursos mais recentes de IA # OCR # Extração e limpeza de documentos

10 meses atrás

018.2K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

ScreenPipe: coleta de 24 horas de informações de operação e tela gravadas e convertidas em uma base de conhecimento local, por meio do diálogo, resumo e revisão do conhecimento do assistente de IA

Descrição geral O ScreenPipe é uma ferramenta de assistente de IA desenvolvida pela mediar-ai que se concentra na gravação de conteúdo de tela, capturando capturas de tela e áudio 24 horas por dia, 7 dias por semana. Ele combina os recursos do rewind.ai e do cursor.com...

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA Notas de IA do ## OCR

10 meses atrás

021.3K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

API de extração de texto (text-extract-api): extração visual de informações de texto, ferramenta de extração de PDF anônimo

Introdução abrangente A API de extração de texto (text-extract-api) é uma ferramenta avançada projetada para extrair e analisar o conteúdo de vários formatos de documentos (por exemplo, PDF, Word, PPTX etc.). A API utiliza tecnologia de ponta de reconhecimento óptico de caracteres (OCR) e Ol...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

8 meses atrás

017.9K

Ferramenta gratuita Picture to Excel: Identifique com eficiência tabelas com formatação complexa em imagens e converta-as em arquivos do Excel

Descrição geral O Picture to Excel Free Tool é uma ferramenta on-line eficiente para identificar e converter, com rapidez e precisão, dados tabulares de imagens em arquivos do Excel. A ferramenta é compatível com uma ampla variedade de formatos de imagem, como JPG e PNG, e pode ser usada em páginas da Web, aplicativos iOS e aplicativos Android...

Recursos mais recentes de IA # OCR

11 meses atrás

019.1K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)

Introdução abrangente O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. Os modelos Marker da plataforma podem ser usados com rapidez e precisão...

Recursos mais recentes de IA # Serviços abertos de IA # Projeto de código aberto AI Java # OCR

11 meses atrás

021.3K

eSearch: ferramenta multifuncional de OCR para várias plataformas, pesquisa integrada, tradução, mapa de pesquisa, gravação de tela e outras funções

Introdução geral O eSearch é uma ferramenta de captura de tela multiplataforma de código aberto desenvolvida por xushengfeng, compatível com os sistemas Windows, macOS e Linux. Ele integra uma variedade de recursos, incluindo captura de tela, reconhecimento de OCR, pesquisa, tradução, mapeamento...

Recursos mais recentes de IA # OCR

11 meses atrás

016.5K

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução abrangente O Surya é um kit de ferramentas de OCR de documentos multilíngues de código aberto que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele executa não apenas a detecção de texto linha por linha, mas também a análise de layout, a detecção da ordem de leitura e o reconhecimento de tabelas.

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR

11 meses atrás

037K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele é capaz de obter PDFs multimodais contendo imagens, fórmulas, tabelas e outros elementos...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

12 meses atrás

037K

PixPin: capturas de tela longas e dinâmicas, reconhecimento de texto nativo (OCR) integrado

Introdução geral O PixPin é uma poderosa ferramenta de captura de tela e postagem projetada para aumentar a produtividade dos usuários. Seja para necessidades diárias de escritório ou profissionais, o PixPin oferece funções convenientes de captura de tela, colagem, captura de tela longa, reconhecimento de texto (OCR) e captura de tela dinâmica. Sua interface simples e...

Recursos mais recentes de IA # OCR

1 ano atrás

024.6K

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B

Introdução abrangente O GOT-OCR2.0 é um modelo de reconhecimento óptico de caracteres (OCR) de código aberto co-proposto pela StepStar, cujo objetivo é impulsionar a tecnologia de OCR em direção ao OCR-2.0 por meio de um modelo unificado de ponta a ponta. O modelo oferece suporte a uma ampla variedade de tarefas de OCR, incluindo reconhecimento de texto normal, gr...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR

1 ano atrás

020.6K

PaddleOCR: uma biblioteca de ferramentas de OCR multilíngue baseada no Flying Paddle, com suporte ao reconhecimento de mais de 80 idiomas

Introdução abrangente O PaddleOCR é um kit de ferramentas de OCR multilíngue baseado no PaddlePaddle, projetado para fornecer um sistema de OCR prático e ultraleve. Ele é compatível com o reconhecimento de mais de 80 idiomas e oferece ferramentas de anotação e síntese de dados para...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR

9 meses atrás

022.5K

Pix2Text: ferramenta de reconhecimento de texto de imagem gratuita e de código aberto

Pix2Text Introdução geral O Pix2Text (P2T) é uma ferramenta gratuita de código aberto projetada para substituir o Mathpix, fornecendo texto de imagem e reconhecimento de fórmulas matemáticas. Os usuários podem usar a ferramenta gratuitamente por meio da versão da Web, reconhecendo até 10.000 por dia...

Recursos mais recentes de IA # OCR

1 ano atrás

022.4K

Umi-OCR: software de OCR off-line de código aberto, reconhecimento de imagens em lote e reconhecimento de PDF

Umi-OCR Introdução geral O Umi-OCR é um software de OCR off-line gratuito e de código aberto que suporta captura de tela, importação de imagens em lote, reconhecimento de documentos PDF, exclusão de marcas d'água e cabeçalhos e rodapés, digitalização e geração de códigos QR. O software tem uma biblioteca integrada em vários idiomas para Windows e Linux.

Recursos mais recentes de IA # OCR

1 ano atrás

024.6K

TTime: Imagine seu software de reconhecimento de texto e tradução de texto

TTime Introdução geral O TTime é um projeto publicado pela InkTimeRecord no GitHub e é um software de tradução simples e eficiente. Ele fornece principalmente funções de tradução de entrada, captura de tela, traço e hoverball, suporta várias fontes de tradução e serviços de reconhecimento de texto...

Recursos mais recentes de IA Tradução de IA ## OCR

1 ano atrás

019.9K

Não é isso.