OCR

Total 27 artículos

ordenar

VOP: herramienta de OCR para extraer diagramas complejos y fórmulas matemáticas

Introducción completa Versatile OCR Program es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto diseñada para trabajar con documentos académicos y educativos complejos. Puede extraer texto, tablas, fórmulas matemáticas, diagramas y esquemas de PDF, imágenes y otros documentos y generar...

hace 12 meses

050.2K

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 12 meses

057.1K

RolmOCR: modelo de reconocimiento óptico de caracteres (OCR) de documentos para reconocer caracteres manuscritos e inclinados

Introducción general RolmOCR es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto desarrollada por el equipo Reducto AI, basada en el modelo de lenguaje visual Qwen2.5-VL-7B. Puede extraer texto de imágenes y archivos PDF más rápidamente que otras herramientas similares...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 12 meses

061.9K

uniOCR: herramienta de reconocimiento de texto multiplataforma y de código abierto

Introducción general uniOCR es una herramienta de reconocimiento de texto de código abierto desarrollada por el equipo mediar-ai. Está basada en el lenguaje Rust y es compatible con los sistemas macOS, Windows y Linux. Los usuarios pueden utilizarla para extraer texto de imágenes...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 12 meses

078.2K

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 1 año

078.1K

SmolDocling: un modelo de lenguaje visual para el tratamiento eficaz de documentos de pequeño volumen

Introducción completa SmolDocling es un Modelo de Lenguaje Visual (VLM) desarrollado por el equipo ds4sd en colaboración con IBM, construido sobre SmolVLM-256M y alojado en la plataforma Hugging Face. Es de pequeño tamaño, sólo ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 1 año

051.1K

Mistral OCR: 94,89% Precisión global, 1.000 páginas/30 segundos, sólo 1 $.

En la larga historia de la civilización humana, cada salto en la forma de adquirir y analizar la información ha contribuido profundamente al progreso social. Desde los antiguos jeroglíficos hasta el papiro portátil, pasando por la posterior aparición de la imprenta y la actual ola digital, cada innovación tecnológica ha ampliado enormemente el paradigma de la difusión del conocimiento humano...

Últimos recursos sobre IA # AI Servicios abiertos # OCR # Extracción y limpieza de documentos

hace 1 año

059K

Ollama OCR: Extracción de texto de imágenes mediante modelos visuales en Ollama

Introducción general Ollama OCR es un potente kit de herramientas de reconocimiento óptico de caracteres (OCR) que utiliza el modelo de lenguaje visual de última generación proporcionado por la plataforma Ollama para extraer texto de imágenes. El proyecto está disponible como paquete Python y proporciona una interfaz Strea...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 1 año

0102.3K

STranslate: una herramienta de traducción ligera con múltiples interfaces de traducción y funciones de reconocimiento óptico de caracteres.

Introducción general STranslate es una herramienta de traducción y OCR lista para usar desarrollada por WPF. La herramienta está diseñada para proporcionar traducción eficiente y conveniente y la funcionalidad de Reconocimiento Óptico de Caracteres (OCR) para una amplia gama de idiomas y tipos de texto.STranslate es abierto...

Últimos recursos sobre IA # AI Traducción # OCR

hace 1 año

059.8K

VisionParser: herramienta OCR para el procesamiento de alta precisión de recibos y facturas, API disponible

Descripción general VisionParser es una herramienta de OCR (Reconocimiento Óptico de Caracteres) diseñada para procesar recibos y facturas. Con una avanzada tecnología de IA generativa, VisionParser es capaz de convertir con rapidez y precisión todo tipo de recibos y facturas en datos estructurados para...

Últimos recursos sobre IA # OCR

hace 1 año

056.1K

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

Introducción general Chunkr es una API autoalojada dedicada a convertir archivos PDF, PPTX, DOCX y Excel en datos aptos para su uso en RAG (Retrieval Augmented Generation) y LLM (Large Language Modelling). El proyecto fue desarrollado por Lumina...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 1 año

053K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR: biblioteca OCR que convierte imágenes a Markdown en tres líneas de código utilizando la interfaz gratuita Llama 3.2 Vision.

Introducción general Llama OCR es una biblioteca OCR (Optical Character Recognition) basada en Llama 3.2 Vision, capaz de convertir documentos al formato Markdown. La biblioteca fue desarrollada por Nutlope y utiliza Together...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Libre Modelo Grande API

hace 1 año

060.7K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: soporte para una variedad de formatos de análisis sintáctico de documentos y exportación como Markdown y JSON, soporte PDF OCR

Introducción Docling es una potente herramienta de análisis y exportación de documentos compatible con una amplia gama de formatos, como PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc y Markdown, que puede analizar y exportar...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 1 año

0104.5K

ViTLP: extracción de datos estructurados de documentos PDF tipográficamente complejos y generación guiada visualmente de modelos preentrenados para el diseño de textos

Introducción general ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) es un proyecto de código abierto diseñado para pasar...

Últimos recursos sobre IA # OCR # Extracción y limpieza de documentos

hace 1 año

052.4K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

ScreenPipe: recopilación las 24 horas del día de información grabada sobre la pantalla y el funcionamiento y convertida en una base de conocimientos local, mediante el diálogo, el resumen y la revisión de conocimientos del asistente de IA.

Descripción general ScreenPipe es una herramienta de AI asistente desarrollado por mediar-ai que se centra en la grabación de contenido de la pantalla, la captura de capturas de pantalla y audio 24/7. Combina rewind.ai y cursor.com de...

Últimos recursos sobre IA # Herramienta AI de resumen de texto y audio/vídeo # AI Notas # OCR

hace 1 año

064.5K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

API de extracción de texto (text-extract-api): extracción visual de información textual, herramienta de extracción anónima de PDF

Introducción general La API de extracción de texto (text-extract-api) es una potente herramienta diseñada para extraer y analizar el contenido de diversos formatos de documento (por ejemplo, PDF, Word, PPTX, etc.). La API utiliza tecnología punta de reconocimiento óptico de caracteres (OCR) y Ol...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 1 año

054.9K

Picture to Excel Free Tool: Identifique eficazmente tablas con formato complejo en imágenes y conviértalas a archivos Excel.

Descripción general Picture to Excel Free Tool es una eficaz herramienta en línea para identificar y convertir de forma rápida y precisa datos tabulares de imágenes a archivos Excel. La herramienta es compatible con una amplia gama de formatos de imagen, como JPG y PNG, y puede utilizarse en páginas web, aplicaciones iOS y aplicaciones Android....

Últimos recursos sobre IA # OCR

hace 1 año

075.6K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: modelo AI dedicado al reconocimiento OCR, PDF a Markdown (código abierto/API)

Introducción completa Datalab ofrece una gama de modelos avanzados de IA centrados en OCR, análisis de diseño, conversión de PDF a Markdown y mucho más. Estos modelos no sólo son de alto rendimiento, sino también fáciles de usar y de código abierto. Los modelos Marker de la plataforma pueden...

Últimos recursos sobre IA # AI Servicios abiertos # AI Java Proyecto de código abierto # OCR

hace 1 año

063K

eSearch: herramienta OCR multifuncional y multiplataforma, búsqueda integrada | traducción | mapa de búsqueda | grabación de pantalla y otras funciones.

Introducción general eSearch es una herramienta de captura de pantalla multiplataforma de código abierto desarrollada por xushengfeng compatible con sistemas Windows, macOS y Linux. Integra una variedad de características, incluyendo captura de pantalla, reconocimiento OCR, búsqueda, traducción, mapeo...

Últimos recursos sobre IA # OCR

hace 1 año

056.1K

Surya: Herramienta profesional de OCR de documentos multilingües, de código abierto y despliegue nativo

Introducción completa Surya es un conjunto de herramientas de OCR de documentos multilingües de código abierto que admite el reconocimiento de texto en más de 90 idiomas. No sólo realiza la detección de texto línea por línea, sino también el análisis de diseño, la detección del orden de lectura y el reconocimiento de tablas.El rendimiento de Surya es comparable al de los servicios en la nube para todo tipo de...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 1 año

0116.2K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: extracción de documentos PDF y conversión a formato Markdown multimodal, compatibilidad con escaneado OCR de libros electrónicos

Introducción exhaustiva MinerU es una herramienta de extracción de datos de código abierto desarrollada por el equipo OpenDataLab del Laboratorio de Inteligencia Artificial de Shanghai, centrada en la extracción eficiente de contenido de documentos PDF, páginas web y libros electrónicos complejos. Es capaz de tomar PDF multimodales que contengan imágenes, fórmulas, tablas y otros elementos...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 2 años

0135.5K

PixPin: capturas de pantalla largas y dinámicas, reconocimiento de texto nativo integrado (OCR)

Introducción general PixPin es una potente herramienta de captura y publicación de pantallas diseñada para mejorar la productividad de los usuarios. Ya sea para la oficina diaria o para necesidades profesionales, PixPin proporciona cómodas funciones de captura de pantalla, pegado, captura de pantalla larga, reconocimiento de texto (OCR) y captura de pantalla dinámica. Su sencilla interfaz y...

Últimos recursos sobre IA # OCR

hace 2 años

0106.9K

GOT-OCR2.0: basado en el modelo OCR multimodal de extremo a extremo QWen2 0.5B

Introducción exhaustiva GOT-OCR2.0 es un modelo de reconocimiento óptico de caracteres (OCR) de código abierto co-propuesto por StepStar, cuyo objetivo es impulsar la tecnología OCR hacia OCR-2.0 mediante un modelo unificado de extremo a extremo. El modelo soporta una amplia gama de tareas de OCR, incluyendo el reconocimiento de texto normal, gr...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 2 años

063.2K

PaddleOCR: biblioteca de herramientas OCR multilingüe basada en Flying Paddle, que permite el reconocimiento de más de 80 idiomas.

Introducción completa PaddleOCR es un conjunto de herramientas OCR multilingüe basado en PaddlePaddle, diseñado para proporcionar un sistema OCR práctico y ultraligero. Admite el reconocimiento de más de 80 idiomas y proporciona herramientas de anotación y síntesis de datos para...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # OCR

hace 1 año

086.2K

Pix2Text: herramienta gratuita de código abierto para el reconocimiento de texto en imágenes

Pix2Text Introducción general Pix2Text (P2T) es una herramienta gratuita de código abierto diseñada para sustituir a Mathpix, que proporciona reconocimiento de texto de imágenes y fórmulas matemáticas. Los usuarios pueden utilizar la herramienta gratuitamente a través de la versión web, reconociendo hasta 10.000 por día...

Últimos recursos sobre IA # OCR

hace 2 años

068.4K

Umi-OCR: software OCR offline de código abierto, reconocimiento de imágenes por lotes y reconocimiento de PDF

Umi-OCR Introducción general Umi-OCR es un software OCR offline gratuito y de código abierto que permite realizar capturas de pantalla, importar imágenes por lotes, reconocer documentos PDF, excluir marcas de agua y encabezados y pies de página, escanear y generar códigos QR. El software incorpora una biblioteca multilingüe para Windows y Li...

Últimos recursos sobre IA # OCR

hace 2 años

097.5K

TTime: software de reconocimiento y traducción de textos con imágenes

TTime Introducción general TTime es un proyecto publicado por InkTimeRecord en GitHub, es un software de traducción simple y eficiente. Proporciona principalmente funciones de traducción de entrada, captura de pantalla, trazo y hoverball, soporta múltiples fuentes de traducción y servicios de reconocimiento de texto....

Últimos recursos sobre IA # AI Traducción # OCR

hace 2 años

051.9K

No es eso.