OCR

Total de 27 artigos
VOP:提取复杂图表与数学公式的OCR工具

VOP: ferramenta de OCR para extração de diagramas complexos e fórmulas matemáticas

Introdução abrangente O Versatile OCR Program é uma ferramenta de reconhecimento óptico de caracteres (OCR) de código aberto projetada para trabalhar com documentos acadêmicos e educacionais complexos. Ele pode extrair texto, tabelas, fórmulas matemáticas, diagramas e esquemas de PDFs, imagens e outros documentos e gerar...
4 meses atrás
01.4K
自动解析PDF内容并提取文字与表格的开源服务

Analise automaticamente o conteúdo do PDF e extraia texto e tabelas de serviços de código aberto

Introdução abrangente Analisa automaticamente o layout de documentos PDF, identifica texto, títulos, imagens, tabelas, fórmulas e outros elementos na página e determina sua ordem correta. A ferramenta oferece suporte à funcionalidade de OCR e pode converter PDFs digitalizados em texto pesquisável. Ela é executada no Docker e oferece dois modelos...
4 meses atrás
01.1K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Introdução geral O PDF Craft é uma ferramenta de código aberto projetada para digitalizar PDFs de livros e convertê-los para o formato Markdown. Ela foi desenvolvida pelo oomol-lab e está hospedada no GitHub para usuários que gostam de organizar seus livros eletrônicos. A ferramenta funciona por meio desta ...
5 meses atrás
01.3K
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

Mistral OCR: 94,89% Precisão geral, 1000 páginas/30 segundos, apenas US$ 1

Na longa história da civilização humana, cada salto na forma como as informações são adquiridas e analisadas contribuiu profundamente para o progresso social. Desde os antigos hieróglifos, passando pelo papiro portátil, até o surgimento posterior da prensa tipográfica e a atual onda digital, cada inovação tecnológica expandiu enormemente o paradigma da disseminação do conhecimento humano...
5 meses atrás
01.4K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama

Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece um software Strea...
7 meses atrás
02.9K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução geral O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). O projeto foi desenvolvido pela Lumina...
8 meses atrás
02.7K
ScreenPipe:24小时收集录屏和操作信息并转换为本地知识库,通过AI助手对话、总结、回顾知识

ScreenPipe: coleta de 24 horas de informações de operação e tela gravadas e convertidas em uma base de conhecimento local, por meio do diálogo, resumo e revisão do conhecimento do assistente de IA

Descrição geral O ScreenPipe é uma ferramenta de assistente de IA desenvolvida pela mediar-ai que se concentra na gravação de conteúdo de tela, capturando capturas de tela e áudio 24 horas por dia, 7 dias por semana. Ele combina os recursos do rewind.ai e do cursor.com...
9 meses atrás
02.3K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API de extração de texto (text-extract-api): extração visual de informações de texto, ferramenta de extração de PDF anônimo

Introdução abrangente A API de extração de texto (text-extract-api) é uma ferramenta avançada projetada para extrair e analisar o conteúdo de vários formatos de documentos (por exemplo, PDF, Word, PPTX etc.). A API utiliza tecnologia de ponta de reconhecimento óptico de caracteres (OCR) e Ol...
7 meses atrás
02K
图片转Excel免费工具:高效识别图片中复杂格式的表格并转换为Excel文件

Ferramenta gratuita Picture to Excel: Identifique com eficiência tabelas com formatação complexa em imagens e converta-as em arquivos do Excel

Descrição geral O Picture to Excel Free Tool é uma ferramenta on-line eficiente para identificar e converter, com rapidez e precisão, dados tabulares de imagens em arquivos do Excel. A ferramenta é compatível com uma ampla variedade de formatos de imagem, como JPG e PNG, e pode ser usada em páginas da Web, aplicativos iOS e aplicativos Android...
9 meses atrás
01.9K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)

Introdução abrangente O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. Os modelos Marker da plataforma podem ser usados com rapidez e precisão...
9 meses atrás
02.1K
eSearch:多功能跨平台OCR工具,集成搜索|翻译|搜图|录屏等功能

eSearch: ferramenta multifuncional de OCR para várias plataformas, pesquisa integrada, tradução, mapa de pesquisa, gravação de tela e outras funções

Introdução geral O eSearch é uma ferramenta de captura de tela multiplataforma de código aberto desenvolvida por xushengfeng, compatível com os sistemas Windows, macOS e Linux. Ele integra uma variedade de recursos, incluindo captura de tela, reconhecimento de OCR, pesquisa, tradução, mapeamento...
10 meses atrás
01.7K
Surya:专业多语言文档OCR工具,开源本地部署

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução abrangente O Surya é um kit de ferramentas de OCR de documentos multilíngues de código aberto que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele executa não apenas a detecção de texto linha por linha, mas também a análise de layout, a detecção da ordem de leitura e o reconhecimento de tabelas.
10 meses atrás
02.6K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele é capaz de obter PDFs multimodais contendo imagens, fórmulas, tabelas e outros elementos...
10 meses atrás
02.6K
PixPin:长截图和动态截图,内置本地文字识别(OCR)

PixPin: capturas de tela longas e dinâmicas, reconhecimento de texto nativo (OCR) integrado

Introdução geral O PixPin é uma poderosa ferramenta de captura de tela e postagem projetada para aumentar a produtividade dos usuários. Seja para necessidades diárias de escritório ou profissionais, o PixPin oferece funções convenientes de captura de tela, colagem, captura de tela longa, reconhecimento de texto (OCR) e captura de tela dinâmica. Sua interface simples e...
11 meses atrás
02.1K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B

Introdução abrangente O GOT-OCR2.0 é um modelo de reconhecimento óptico de caracteres (OCR) de código aberto co-proposto pela StepStar, cujo objetivo é impulsionar a tecnologia de OCR em direção ao OCR-2.0 por meio de um modelo unificado de ponta a ponta. O modelo oferece suporte a uma ampla variedade de tarefas de OCR, incluindo reconhecimento de texto normal, gr...
11 meses atrás
02.1K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: uma biblioteca de ferramentas de OCR multilíngue baseada no Flying Paddle, com suporte ao reconhecimento de mais de 80 idiomas

Introdução abrangente O PaddleOCR é um kit de ferramentas de OCR multilíngue baseado no PaddlePaddle, projetado para fornecer um sistema de OCR prático e ultraleve. Ele é compatível com o reconhecimento de mais de 80 idiomas e oferece ferramentas de anotação e síntese de dados para...
8 meses atrás
02.3K
Umi-OCR:开源离线OCR软件,批量图片识别和PDF识别

Umi-OCR: software de OCR off-line de código aberto, reconhecimento de imagens em lote e reconhecimento de PDF

Umi-OCR Introdução geral O Umi-OCR é um software de OCR off-line gratuito e de código aberto que suporta captura de tela, importação de imagens em lote, reconhecimento de documentos PDF, exclusão de marcas d'água e cabeçalhos e rodapés, digitalização e geração de códigos QR. O software tem uma biblioteca integrada em vários idiomas para Windows e Linux.
11 meses atrás
02.4K