OCR

Total 27 articles
VOP:提取复杂图表与数学公式的OCR工具

VOP : outil d'OCR pour l'extraction de diagrammes complexes et de formules mathématiques

Introduction complète Versatile OCR Program est un outil de reconnaissance optique de caractères (OCR) open source conçu pour travailler avec des documents académiques et éducatifs complexes. Il peut extraire du texte, des tableaux, des formules mathématiques, des diagrammes et des schémas à partir de PDF, d'images et d'autres documents et générer...
Il y a 4 mois
01.4K
自动解析PDF内容并提取文字与表格的开源服务

Analyse automatique du contenu des PDF et extraction du texte et des tableaux des services open source

Introduction complète Il analyse automatiquement la mise en page des documents PDF, identifie le texte, les titres, les images, les tableaux, les formules et autres éléments de la page, et détermine leur ordre correct. L'outil prend en charge la fonctionnalité OCR et peut convertir les PDF numérisés en texte consultable. Il fonctionne sur Docker et fournit deux modèles...
Il y a 4 mois
01.2K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft : outils open source de conversion de documents PDF numérisés en Markdown

Introduction générale PDF Craft est un outil open source conçu pour scanner des PDF de livres et les convertir au format Markdown. Il a été développé par oomol-lab et est hébergé sur GitHub pour les utilisateurs qui souhaitent organiser leurs livres électroniques. L'outil fonctionne à travers ce ...
il y a 5 mois
01.4K
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

Mistral OCR : 94.89% Précision globale, 1000 pages/30 secondes, seulement $1

Dans la longue histoire de la civilisation humaine, chaque progrès dans la manière d'acquérir et d'analyser l'information a profondément contribué au progrès social. Des hiéroglyphes antiques au papyrus portable, en passant par l'apparition de l'imprimerie et de la vague numérique actuelle, chaque innovation technologique a considérablement élargi le paradigme de la diffusion des connaissances humaines...
il y a 5 mois
01.4K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR : Extraction de texte à partir d'images à l'aide de modèles visuels dans Ollama

Introduction Ollama OCR est une puissante boîte à outils de reconnaissance optique de caractères (OCR) qui utilise le modèle de langage visuel de pointe fourni par la plate-forme Ollama pour extraire du texte à partir d'images. Le projet est disponible sous la forme d'un paquetage Python et fournit des...
Il y a 7 mois
02.9K
STranslate:集成多种翻译接口和OCR功能的轻便翻译工具

STranslate : un outil de traduction léger avec plusieurs interfaces de traduction et une fonctionnalité OCR

Introduction générale STranslate est un outil de traduction et de reconnaissance optique de caractères (OCR) prêt à l'emploi développé par WPF. L'outil est conçu pour fournir des fonctionnalités de traduction et de reconnaissance optique de caractères (OCR) efficaces et pratiques pour un large éventail de langues et de types de textes....
Il y a 8 mois
01.6K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr : un service tout-en-un qui utilise des modèles visuels pour l'ingestion de documents et le découpage intelligent basé sur la hiérarchie des paragraphes du texte.

Introduction générale Chunkr est une API auto-hébergée dédiée à la conversion de fichiers PDF, PPTX, DOCX et Excel en données utilisables dans RAG (Retrieval Augmented Generation) et LLM (Large Language Modelling). Le projet a été développé par Lumina...
Il y a 8 mois
02.7K
ScreenPipe:24小时收集录屏和操作信息并转换为本地知识库,通过AI助手对话、总结、回顾知识

ScreenPipe : collecte 24 heures sur 24 d'informations enregistrées sur les écrans et les opérations et converties en une base de connaissances locale, grâce à l'assistant IA qui dialogue, résume et révise les connaissances.

Description générale ScreenPipe est un outil d'assistant IA développé par mediar-ai qui se concentre sur l'enregistrement du contenu de l'écran, la capture de captures d'écran et d'audio 24 heures sur 24, 7 jours sur 7. Il combine les fonctions de rewind.ai et de cursor.com...
Il y a 9 mois
02.3K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API d'extraction de texte (text-extract-api) : extraction visuelle d'informations textuelles, outil d'extraction de PDF anonymes

Introduction complète L'API d'extraction de texte (text-extract-api) est un outil puissant conçu pour extraire et analyser le contenu d'une variété de formats de documents (par exemple PDF, Word, PPTX, etc.). L'API utilise la technologie de pointe de la reconnaissance optique de caractères (OCR) et Ol...
Il y a 7 mois
02K
图片转Excel免费工具:高效识别图片中复杂格式的表格并转换为Excel文件

Picture to Excel Free Tool : Identifier efficacement les tableaux avec un formatage complexe dans les images et les convertir en fichiers Excel

Description générale Picture to Excel Free Tool est un outil en ligne efficace pour identifier et convertir rapidement et précisément les données tabulaires des images en fichiers Excel. L'outil prend en charge un large éventail de formats d'image, tels que JPG et PNG, et peut être utilisé sur des pages web, des applications iOS et des applications Android....
Il y a 9 mois
02K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)

Datalab : modèle d'IA dédié à la reconnaissance OCR, PDF to Markdown (open source/API)

Introduction complète Datalab propose une gamme de modèles d'IA avancés axés sur l'OCR, l'analyse de la mise en page, la conversion de PDF en Markdown et bien plus encore. Ces modèles sont non seulement très performants, mais aussi faciles à utiliser et open source. Les modèles Marker de la plateforme peuvent rapidement et précisément...
Il y a 9 mois
02.1K
Surya:专业多语言文档OCR工具,开源本地部署

Surya : Outil professionnel d'OCR de documents multilingues, Déploiement natif Open Source

Introduction complète Surya est une boîte à outils d'OCR de documents multilingues open source qui prend en charge la reconnaissance de texte dans plus de 90 langues. Il effectue non seulement la détection de texte ligne par ligne, mais aussi l'analyse de la mise en page, la détection de l'ordre de lecture et la reconnaissance de tableaux....
Il y a 10 mois
02.6K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU : extraction de documents PDF et conversion au format Markdown multimodal, prise en charge de la numérisation OCR des livres électroniques

Introduction complète MinerU est un outil d'extraction de données open source développé par l'équipe OpenDataLab du Shanghai Artificial Intelligence Laboratory, qui se concentre sur l'extraction efficace du contenu de documents PDF complexes, de pages web et de livres électroniques. Il est capable de prendre des PDF multimodaux contenant des images, des formules, des tableaux et d'autres éléments...
Il y a 10 mois
02.6K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0 : basé sur le modèle d'OCR multimodal de bout en bout QWen2 0.5B

Introduction complète GOT-OCR2.0 est un modèle de reconnaissance optique de caractères (OCR) Open Source co-proposé par StepStar, qui vise à faire évoluer la technologie OCR vers OCR-2.0 grâce à un modèle unifié de bout en bout. Le modèle prend en charge un large éventail de tâches d'OCR, y compris la reconnaissance de textes normaux, de gr...
Il y a 11 mois
02.1K
TTime:图片你文字识别和文字翻译软件

TTime : Picture Your Text Recognition and Text Translation Software (logiciel de reconnaissance et de traduction de texte)

TTime Introduction générale TTime est un projet publié par InkTimeRecord sur GitHub, c'est un logiciel de traduction simple et efficace. Il fournit principalement des fonctions de traduction d'entrées, de captures d'écran, de traits et de hoverball, supporte de multiples sources de traduction et des services de reconnaissance de texte...
Il y a 12 mois
01.8K