OCR

Total 27 artículos
VOP:提取复杂图表与数学公式的OCR工具

VOP: herramienta de OCR para extraer diagramas complejos y fórmulas matemáticas

Introducción completa Versatile OCR Program es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto diseñada para trabajar con documentos académicos y educativos complejos. Puede extraer texto, tablas, fórmulas matemáticas, diagramas y esquemas de PDF, imágenes y otros documentos y generar...
hace 4 meses
01.4K
自动解析PDF内容并提取文字与表格的开源服务

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...
hace 4 meses
01.1K
RolmOCR:识别手写和倾斜字符的文档OCR模型

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...
hace 4 meses
01.8K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...
hace 5 meses
01.4K
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

Mistral OCR: 94,89% Precisión global, 1.000 páginas/30 segundos, sólo 1 $.

En la larga historia de la civilización humana, cada salto en la forma de adquirir y analizar la información ha contribuido profundamente al progreso social. Desde los antiguos jeroglíficos hasta el papiro portátil, pasando por la posterior aparición de la imprenta y la actual ola digital, cada innovación tecnológica ha ampliado enormemente el paradigma de la difusión del conocimiento humano...
hace 5 meses
01.4K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: Extracción de texto de imágenes mediante modelos visuales en Ollama

Introducción general Ollama OCR es un potente kit de herramientas de reconocimiento óptico de caracteres (OCR) que utiliza el modelo de lenguaje visual de última generación proporcionado por la plataforma Ollama para extraer texto de imágenes. El proyecto está disponible como paquete Python y proporciona una interfaz Strea...
hace 7 meses
02.9K
STranslate:集成多种翻译接口和OCR功能的轻便翻译工具

STranslate: una herramienta de traducción ligera con múltiples interfaces de traducción y funciones de reconocimiento óptico de caracteres.

Introducción general STranslate es una herramienta de traducción y OCR lista para usar desarrollada por WPF. La herramienta está diseñada para proporcionar traducción eficiente y conveniente y la funcionalidad de Reconocimiento Óptico de Caracteres (OCR) para una amplia gama de idiomas y tipos de texto.STranslate es abierto...
hace 8 meses
01.5K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

Introducción general Chunkr es una API autoalojada dedicada a convertir archivos PDF, PPTX, DOCX y Excel en datos aptos para su uso en RAG (Retrieval Augmented Generation) y LLM (Large Language Modelling). El proyecto fue desarrollado por Lumina...
hace 8 meses
02.7K
ScreenPipe:24小时收集录屏和操作信息并转换为本地知识库,通过AI助手对话、总结、回顾知识

ScreenPipe: recopilación las 24 horas del día de información grabada sobre la pantalla y el funcionamiento y convertida en una base de conocimientos local, mediante el diálogo, el resumen y la revisión de conocimientos del asistente de IA.

Descripción general ScreenPipe es una herramienta de AI asistente desarrollado por mediar-ai que se centra en la grabación de contenido de la pantalla, la captura de capturas de pantalla y audio 24/7. Combina rewind.ai y cursor.com de...
hace 9 meses
02.3K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API de extracción de texto (text-extract-api): extracción visual de información textual, herramienta de extracción anónima de PDF

Introducción general La API de extracción de texto (text-extract-api) es una potente herramienta diseñada para extraer y analizar el contenido de diversos formatos de documento (por ejemplo, PDF, Word, PPTX, etc.). La API utiliza tecnología punta de reconocimiento óptico de caracteres (OCR) y Ol...
hace 7 meses
02K
图片转Excel免费工具:高效识别图片中复杂格式的表格并转换为Excel文件

Picture to Excel Free Tool: Identifique eficazmente tablas con formato complejo en imágenes y conviértalas a archivos Excel.

Descripción general Picture to Excel Free Tool es una eficaz herramienta en línea para identificar y convertir de forma rápida y precisa datos tabulares de imágenes a archivos Excel. La herramienta es compatible con una amplia gama de formatos de imagen, como JPG y PNG, y puede utilizarse en páginas web, aplicaciones iOS y aplicaciones Android....
hace 9 meses
01.9K
eSearch:多功能跨平台OCR工具,集成搜索|翻译|搜图|录屏等功能

eSearch: herramienta OCR multifuncional y multiplataforma, búsqueda integrada | traducción | mapa de búsqueda | grabación de pantalla y otras funciones.

Introducción general eSearch es una herramienta de captura de pantalla multiplataforma de código abierto desarrollada por xushengfeng compatible con sistemas Windows, macOS y Linux. Integra una variedad de características, incluyendo captura de pantalla, reconocimiento OCR, búsqueda, traducción, mapeo...
hace 10 meses
01.7K
Surya:专业多语言文档OCR工具,开源本地部署

Surya: Herramienta profesional de OCR de documentos multilingües, de código abierto y despliegue nativo

Introducción completa Surya es un conjunto de herramientas de OCR de documentos multilingües de código abierto que admite el reconocimiento de texto en más de 90 idiomas. No sólo realiza la detección de texto línea por línea, sino también el análisis de diseño, la detección del orden de lectura y el reconocimiento de tablas.El rendimiento de Surya es comparable al de los servicios en la nube para todo tipo de...
hace 10 meses
02.6K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: extracción de documentos PDF y conversión a formato Markdown multimodal, compatibilidad con escaneado OCR de libros electrónicos

Introducción exhaustiva MinerU es una herramienta de extracción de datos de código abierto desarrollada por el equipo OpenDataLab del Laboratorio de Inteligencia Artificial de Shanghai, centrada en la extracción eficiente de contenido de documentos PDF, páginas web y libros electrónicos complejos. Es capaz de tomar PDF multimodales que contengan imágenes, fórmulas, tablas y otros elementos...
hace 10 meses
02.6K
PixPin:长截图和动态截图,内置本地文字识别(OCR)

PixPin: capturas de pantalla largas y dinámicas, reconocimiento de texto nativo integrado (OCR)

Introducción general PixPin es una potente herramienta de captura y publicación de pantallas diseñada para mejorar la productividad de los usuarios. Ya sea para la oficina diaria o para necesidades profesionales, PixPin proporciona cómodas funciones de captura de pantalla, pegado, captura de pantalla larga, reconocimiento de texto (OCR) y captura de pantalla dinámica. Su sencilla interfaz y...
hace 11 meses
02.1K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0: basado en el modelo OCR multimodal de extremo a extremo QWen2 0.5B

Introducción exhaustiva GOT-OCR2.0 es un modelo de reconocimiento óptico de caracteres (OCR) de código abierto co-propuesto por StepStar, cuyo objetivo es impulsar la tecnología OCR hacia OCR-2.0 mediante un modelo unificado de extremo a extremo. El modelo soporta una amplia gama de tareas de OCR, incluyendo el reconocimiento de texto normal, gr...
hace 11 meses
02.1K
PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别

PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Introducción completa PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Admite el reconocimiento de más de 80 idiomas y proporciona herramientas de anotación y síntesis de datos para...
hace 8 meses
02.3K
Umi-OCR:开源离线OCR软件,批量图片识别和PDF识别

Umi-OCR: software OCR offline de código abierto, reconocimiento de imágenes por lotes y reconocimiento de PDF

Umi-OCR Introducción general Umi-OCR es un software OCR offline gratuito y de código abierto que permite realizar capturas de pantalla, importar imágenes por lotes, reconocer documentos PDF, excluir marcas de agua y encabezados y pies de página, escanear y generar códigos QR. El software incorpora una biblioteca multilingüe para Windows y Li...
hace 11 meses
02.5K