OCR

Total 27 articles

mettre en ordre

VOP : outil d'OCR pour l'extraction de diagrammes complexes et de formules mathématiques

Introduction complète Versatile OCR Program est un outil de reconnaissance optique de caractères (OCR) open source conçu pour travailler avec des documents académiques et éducatifs complexes. Il peut extraire du texte, des tableaux, des formules mathématiques, des diagrammes et des schémas à partir de PDF, d'images et d'autres documents et générer...

il y a 5 mois

09.6K

Analyse automatique du contenu des PDF et extraction du texte et des tableaux des services open source

Introduction complète Il analyse automatiquement la mise en page des documents PDF, identifie le texte, les titres, les images, les tableaux, les formules et autres éléments de la page, et détermine leur ordre correct. L'outil prend en charge la fonctionnalité OCR et peut convertir les PDF numérisés en texte consultable. Il fonctionne sur Docker et fournit deux modèles...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

il y a 5 mois

011.1K

RolmOCR : Modèle d'OCR de documents pour la reconnaissance de caractères manuscrits et obliques

Introduction générale RolmOCR est un outil de reconnaissance optique de caractères (OCR) open source développé par l'équipe Reducto AI, basé sur le modèle de langage visuel Qwen2.5-VL-7B. Il peut extraire du texte à partir d'images et de fichiers PDF plus rapidement que des outils similaires...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR

il y a 5 mois

012.7K

uniOCR : outil de reconnaissance de texte open source multiplateforme

Introduction générale uniOCR est un outil de reconnaissance de texte open source développé par l'équipe mediar-ai. Il est basé sur le langage Rust et supporte les systèmes macOS, Windows et Linux. Les utilisateurs peuvent l'utiliser pour extraire du texte à partir d'images...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR

il y a 5 mois

010.5K

PDF Craft : outils open source de conversion de documents PDF numérisés en Markdown

Introduction générale PDF Craft est un outil open source conçu pour scanner des PDF de livres et les convertir au format Markdown. Il a été développé par oomol-lab et est hébergé sur GitHub pour les utilisateurs qui souhaitent organiser leurs livres électroniques. L'outil fonctionne à travers ce ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

il y a 5 mois

012.7K

SmolDocling : un modèle de langage visuel pour le traitement efficace de documents en petit volume

Introduction complète SmolDocling est un modèle de langage visuel (VLM) développé par l'équipe ds4sd en collaboration avec IBM, construit sur SmolVLM-256M et hébergé sur la plateforme Hugging Face. Il est de petite taille, seulement ...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

Il y a 6 mois

010.1K

Mistral OCR : 94.89% Précision globale, 1000 pages/30 secondes, seulement $1

Dans la longue histoire de la civilisation humaine, chaque progrès dans la manière d'acquérir et d'analyser l'information a profondément contribué au progrès social. Des hiéroglyphes antiques au papyrus portable, en passant par l'apparition de l'imprimerie et de la vague numérique actuelle, chaque innovation technologique a considérablement élargi le paradigme de la diffusion des connaissances humaines...

Dernières ressources sur l'IA # AI Open Services # OCR # Extraction et nettoyage de documents

Il y a 6 mois

012.7K

Ollama OCR : Extraction de texte à partir d'images à l'aide de modèles visuels dans Ollama

Introduction Ollama OCR est une puissante boîte à outils de reconnaissance optique de caractères (OCR) qui utilise le modèle de langage visuel de pointe fourni par la plate-forme Ollama pour extraire du texte à partir d'images. Le projet est disponible sous la forme d'un paquetage Python et fournit des...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

Il y a 8 mois

016.9K

STranslate : un outil de traduction léger avec plusieurs interfaces de traduction et une fonctionnalité OCR

Introduction générale STranslate est un outil de traduction et de reconnaissance optique de caractères (OCR) prêt à l'emploi développé par WPF. L'outil est conçu pour fournir des fonctionnalités de traduction et de reconnaissance optique de caractères (OCR) efficaces et pratiques pour un large éventail de langues et de types de textes....

Dernières ressources sur l'IA # AI Traduction # OCR

Il y a 8 mois

011.7K

VisionParser : outil OCR pour le traitement de haute précision des reçus et des factures, API disponible

Description générale VisionParser est un outil OCR (Optical Character Recognition) conçu pour le traitement des reçus et des factures. Grâce à une technologie avancée d'IA générative, VisionParser est capable de convertir rapidement et avec précision toutes sortes de reçus et de factures en données structurées pour...

Dernières ressources sur l'IA # OCR

Il y a 9 mois

011.1K

Chunkr : un service tout-en-un qui utilise des modèles visuels pour l'ingestion de documents et le découpage intelligent basé sur la hiérarchie des paragraphes du texte.

Introduction générale Chunkr est une API auto-hébergée dédiée à la conversion de fichiers PDF, PPTX, DOCX et Excel en données utilisables dans RAG (Retrieval Augmented Generation) et LLM (Large Language Modelling). Le projet a été développé par Lumina...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

Il y a 9 mois

012.8K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR : bibliothèque OCR qui convertit des images en Markdown en trois lignes de code en utilisant l'interface gratuite Llama 3.2 Vision.

Introduction générale Llama OCR est une bibliothèque OCR (Optical Character Recognition) basée sur Llama 3.2 Vision, capable de convertir des documents au format Markdown. La bibliothèque a été développée par Nutlope et utilise Together...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Free Large Model API

Il y a 9 mois

012.8K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling : prise en charge d'une variété de formats, analyse et exportation de documents en Markdown et JSON, prise en charge des PDF, OCR

Introduction Docling est un puissant outil d'analyse et d'exportation de documents qui prend en charge un large éventail de formats de documents, notamment PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc et Markdown.

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

Il y a 9 mois

016.3K

ViTLP : Extraction de données structurées à partir de documents PDF typographiquement complexes et génération guidée visuellement de modèles pré-entraînés pour la mise en page de textes

Introduction complète ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) est un projet open source conçu pour...

Dernières ressources sur l'IA # OCR # Extraction et nettoyage de documents

Il y a 9 mois

010.3K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

ScreenPipe : collecte 24 heures sur 24 d'informations enregistrées sur les écrans et les opérations et converties en une base de connaissances locale, grâce à l'assistant IA qui dialogue, résume et révise les connaissances.

Description générale ScreenPipe est un outil d'assistant IA développé par mediar-ai qui se concentre sur l'enregistrement du contenu de l'écran, la capture de captures d'écran et d'audio 24 heures sur 24, 7 jours sur 7. Il combine les fonctions de rewind.ai et de cursor.com...

Dernières ressources sur l'IA # Outil de résumé de texte AI et d'audio/vidéo # AI Notes # OCR

Il y a 9 mois

013.8K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

API d'extraction de texte (text-extract-api) : extraction visuelle d'informations textuelles, outil d'extraction de PDF anonymes

Introduction complète L'API d'extraction de texte (text-extract-api) est un outil puissant conçu pour extraire et analyser le contenu d'une variété de formats de documents (par exemple PDF, Word, PPTX, etc.). L'API utilise la technologie de pointe de la reconnaissance optique de caractères (OCR) et Ol...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

Il y a 8 mois

011K

Picture to Excel Free Tool : Identifier efficacement les tableaux avec un formatage complexe dans les images et les convertir en fichiers Excel

Description générale Picture to Excel Free Tool est un outil en ligne efficace pour identifier et convertir rapidement et précisément les données tabulaires des images en fichiers Excel. L'outil prend en charge un large éventail de formats d'image, tels que JPG et PNG, et peut être utilisé sur des pages web, des applications iOS et des applications Android....

Dernières ressources sur l'IA # OCR

Il y a 10 mois

010.9K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab : modèle d'IA dédié à la reconnaissance OCR, PDF to Markdown (open source/API)

Introduction complète Datalab propose une gamme de modèles d'IA avancés axés sur l'OCR, l'analyse de la mise en page, la conversion de PDF en Markdown et bien plus encore. Ces modèles sont non seulement très performants, mais aussi faciles à utiliser et open source. Les modèles Marker de la plateforme peuvent rapidement et précisément...

Dernières ressources sur l'IA # AI Open Services # AI Java Open Source Projecct # OCR

Il y a 10 mois

013.5K

eSearch : outil OCR multifonctionnel et multiplateforme, recherche intégrée, traduction, carte de recherche, enregistrement d'écran et autres fonctions.

Introduction générale eSearch est un outil de capture d'écran multiplateforme open source développé par xushengfeng qui prend en charge les systèmes Windows, macOS et Linux. Il intègre une variété de fonctionnalités, y compris la capture d'écran, la reconnaissance OCR, la recherche, la traduction, la cartographie...

Dernières ressources sur l'IA # OCR

Il y a 11 mois

010.2K

Surya : Outil professionnel d'OCR de documents multilingues, Déploiement natif Open Source

Introduction complète Surya est une boîte à outils d'OCR de documents multilingues open source qui prend en charge la reconnaissance de texte dans plus de 90 langues. Il effectue non seulement la détection de texte ligne par ligne, mais aussi l'analyse de la mise en page, la détection de l'ordre de lecture et la reconnaissance de tableaux....

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR

Il y a 11 mois

022.3K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU : extraction de documents PDF et conversion au format Markdown multimodal, prise en charge de la numérisation OCR des livres électroniques

Introduction complète MinerU est un outil d'extraction de données open source développé par l'équipe OpenDataLab du Shanghai Artificial Intelligence Laboratory, qui se concentre sur l'extraction efficace du contenu de documents PDF complexes, de pages web et de livres électroniques. Il est capable de prendre des PDF multimodaux contenant des images, des formules, des tableaux et d'autres éléments...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR # Extraction et nettoyage de documents

Il y a 11 mois

023.1K

PixPin : captures d'écran longues et dynamiques, reconnaissance de texte native intégrée (OCR)

Introduction générale PixPin est un puissant outil de capture d'écran et d'affichage conçu pour améliorer la productivité des utilisateurs. Que ce soit pour des besoins quotidiens ou professionnels, PixPin offre des fonctions pratiques de capture d'écran, de collage, de capture d'écran longue, de reconnaissance de texte (OCR) et de capture d'écran dynamique. Son interface simple et...

Dernières ressources sur l'IA # OCR

Il y a 11 mois

015.3K

GOT-OCR2.0 : basé sur le modèle d'OCR multimodal de bout en bout QWen2 0.5B

Introduction complète GOT-OCR2.0 est un modèle de reconnaissance optique de caractères (OCR) Open Source co-proposé par StepStar, qui vise à faire évoluer la technologie OCR vers OCR-2.0 grâce à un modèle unifié de bout en bout. Le modèle prend en charge un large éventail de tâches d'OCR, y compris la reconnaissance de textes normaux, de gr...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR

Il y a 12 mois

012.9K

PaddleOCR : bibliothèque d'outils d'OCR multilingue basée sur Flying Paddle, prenant en charge la reconnaissance de plus de 80 langues.

Introduction PaddleOCR est une boîte à outils multilingue d'OCR basée sur PaddlePaddle, conçue pour fournir un système d'OCR pratique et ultra-léger. Il prend en charge la reconnaissance de plus de 80 langues et fournit des outils d'annotation et de synthèse des données pour...

Dernières ressources sur l'IA # AI Java Open Source Projecct # OCR

Il y a 9 mois

012.3K

Pix2Text : outil de reconnaissance d'images et de textes libre et gratuit

Pix2Text Introduction générale Pix2Text (P2T) est un outil open source gratuit conçu pour remplacer Mathpix, fournissant la reconnaissance d'images, de textes et de formules mathématiques. Les utilisateurs peuvent utiliser l'outil gratuitement via la version web, reconnaissant jusqu'à 10 000 par jour...

Dernières ressources sur l'IA # OCR

il y a 1 an

013.3K

Umi-OCR : logiciel open source d'OCR hors ligne, reconnaissance d'images par lots et reconnaissance de PDF

Umi-OCR Introduction générale Umi-OCR est un logiciel OCR hors ligne gratuit et open source qui prend en charge les captures d'écran, l'importation d'images par lots, la reconnaissance de documents PDF, l'exclusion des filigranes, des en-têtes et des pieds de page, la numérisation et la génération de codes QR. Le logiciel dispose d'une bibliothèque multilingue intégrée pour Windows et Li...

Dernières ressources sur l'IA # OCR

il y a 1 an

014.7K

TTime : Picture Your Text Recognition and Text Translation Software (logiciel de reconnaissance et de traduction de texte)

TTime Introduction générale TTime est un projet publié par InkTimeRecord sur GitHub, c'est un logiciel de traduction simple et efficace. Il fournit principalement des fonctions de traduction d'entrées, de captures d'écran, de traits et de hoverball, supporte de multiples sources de traduction et des services de reconnaissance de texte...

Dernières ressources sur l'IA # AI Traduction # OCR

il y a 1 an

011.3K

Ce n'est pas le cas.