OCR

Insgesamt 27 Artikel

in Ordnung bringen

VOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer Formeln

Umfassende Einführung Das Versatile OCR Program ist ein Open-Source-Tool zur optischen Zeichenerkennung (OCR), das für die Arbeit mit komplexen akademischen und Bildungsdokumenten entwickelt wurde. Es kann Text, Tabellen, mathematische Formeln, Diagramme und Schemata aus PDFs, Bildern und anderen Dokumenten extrahieren und...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 5 Monaten

016.8K

Automatisches Parsen von PDF-Inhalten und Extrahieren von Text und Tabellen von Open-Source-Diensten

Umfassende Einführung Es analysiert automatisch das Layout von PDF-Dokumenten, identifiziert Text, Titel, Bilder, Tabellen, Formeln und andere Elemente auf der Seite und bestimmt ihre richtige Reihenfolge. Das Tool unterstützt OCR-Funktionalität und kann gescannte PDFs in durchsuchbaren Text umwandeln. Es läuft auf Docker und bietet zwei Modelle...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 5 Monaten

019.1K

RolmOCR: Dokument-OCR-Modell zur Erkennung von handgeschriebenen und schrägen Schriftzeichen

Umfassende Einführung RolmOCR ist ein Open-Source-Tool für die optische Zeichenerkennung (OCR), das vom Reducto AI-Team entwickelt wurde und auf dem visuellen Sprachmodell Qwen2.5-VL-7B basiert. Es kann Text aus Bildern und PDF-Dateien schneller extrahieren als ähnliche Tools...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR

vor 6 Monaten

021K

uniOCR: plattformübergreifendes Open-Source-Tool zur Texterkennung

Allgemeine Einführung uniOCR ist ein Open-Source-Tool zur Texterkennung, das vom mediar-ai-Team entwickelt wurde. Es basiert auf der Sprache Rust und unterstützt macOS, Windows und Linux Systeme. Benutzer können es verwenden, um Text aus Bildern zu extrahieren...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR

vor 6 Monaten

017.2K

PDF Craft: Gescannte PDF-Dokumente in Markdown umwandeln Open-Source-Tools

Allgemeine Einführung PDF Craft ist ein Open-Source-Tool, mit dem PDFs von Büchern gescannt und in das Markdown-Format konvertiert werden können. Es wurde von oomol-lab entwickelt und wird auf GitHub für Benutzer gehostet, die ihre eBooks organisieren möchten. Das Tool funktioniert durch diese ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 6 Monaten

021.4K

SmolDocling: ein visuelles Sprachmodell für die effiziente Verarbeitung von Dokumenten in einem kleinen Volumen

Umfassende Einführung SmolDocling ist ein visuelles Sprachmodell (VLM), das vom ds4sd-Team in Zusammenarbeit mit IBM entwickelt wurde, auf SmolVLM-256M aufbaut und auf der Hugging Face-Plattform gehostet wird. Es ist klein in der Größe, nur ...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 6 Monaten

017.7K

Mistral OCR: 94,89% Gesamtgenauigkeit, 1000 Seiten/30 Sekunden, nur $1

In der langen Geschichte der menschlichen Zivilisation hat jeder Sprung in der Art und Weise, wie Informationen erworben und analysiert werden, tiefgreifend zum sozialen Fortschritt beigetragen. Von den antiken Hieroglyphen über den tragbaren Papyrus bis hin zur späteren Entwicklung des Buchdrucks und der heutigen digitalen Welle hat jede technologische Innovation das Paradigma der menschlichen Wissensverbreitung erheblich erweitert...

Neueste AI-Ressourcen # AI Offene Dienste # OCR # Extraktion und Reinigung von Dokumenten

vor 7 Monaten

021.1K

Ollama OCR: Extrahieren von Text aus Bildern mithilfe visueller Modelle in Ollama

Umfassende Einführung Ollama OCR ist ein leistungsstarkes Toolkit für die optische Zeichenerkennung (OCR), das das hochmoderne visuelle Sprachmodell der Ollama-Plattform nutzt, um Text aus Bildern zu extrahieren. Das Projekt ist sowohl als Python-Paket verfügbar als auch als benutzerfreundliche Strea...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 8 Monaten

028.8K

STranslate: ein leichtes Übersetzungsprogramm mit mehreren Übersetzungsschnittstellen und OCR-Funktionalität

Allgemeine Einführung STranslate ist ein gebrauchsfertiges Übersetzungs- und OCR-Tool, das von WPF entwickelt wurde. Das Tool wurde entwickelt, um eine effiziente und bequeme Übersetzung und OCR-Funktionalität (Optical Character Recognition) für eine Vielzahl von Sprachen und Texttypen zu bieten.STranslate ist offen...

Neueste AI-Ressourcen # AI Übersetzung # OCR

vor 9 Monaten

019K

VisionParser: OCR-Tool für die hochpräzise Verarbeitung von Belegen und Rechnungen, API verfügbar

Allgemeine Beschreibung VisionParser ist ein OCR-Tool (Optical Character Recognition) für die Verarbeitung von Quittungen und Rechnungen. Mit der fortschrittlichen generativen KI-Technologie ist VisionParser in der Lage, alle Arten von Quittungen und Rechnungen schnell und präzise in strukturierte Daten für die...

Neueste AI-Ressourcen # OCR

vor 9 Monaten

018.5K

Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet

Allgemeine Einführung Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Das Projekt wurde von Lumina entwickelt...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 9 Monaten

021.3K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR: OCR-Bibliothek, die Bilder in drei Zeilen Code in Markdown umwandelt und dabei die kostenlose Llama 3.2 Vision-Schnittstelle verwendet

Allgemeine Einführung Llama OCR ist eine OCR-Bibliothek (Optical Character Recognition), die auf Llama 3.2 Vision basiert und Dokumente in das Markdown-Format konvertieren kann. Die Bibliothek wurde von Nutlope entwickelt und verwendet Together...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Kostenloses großes Modell API

vor 9 Monaten

021.9K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: Unterstützung für eine Vielzahl von Formaten, Dokumentenparsing und Export als Markdown und JSON, PDF-Unterstützung OCR

Umfassende Einführung Docling ist ein leistungsstarkes Tool zum Parsen und Exportieren von Dokumenten, das eine Vielzahl von Dokumentenformaten unterstützt, darunter PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc und Markdown....

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 9 Monaten

029.1K

ViTLP: Extraktion von strukturierten Daten aus typografisch komplexen PDF-Dokumenten und visuell geführte Generierung von vortrainierten Modellen für das Textlayout

Umfassende Einführung ViTLP (Visually Guided Generative Text-Layout Pre-training for Document Intelligence) ist ein Open-Source-Projekt, das entwickelt wurde, um...

Neueste AI-Ressourcen # OCR # Extraktion und Reinigung von Dokumenten

vor 10 Monaten

018.3K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

ScreenPipe: 24-Stunden-Sammlung von aufgezeichneten Bildschirm- und Betriebsinformationen und Umwandlung in eine lokale Wissensbasis, durch den KI-Assistenten Dialog, Zusammenfassung, Überprüfung von Wissen

Allgemeine Beschreibung ScreenPipe ist ein von mediar-ai entwickeltes KI-Assistententool, das sich auf die Aufnahme von Bildschirminhalten, Screenshots und Audio 24/7 konzentriert. Es kombiniert rewind.ai und cursor.com's...

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Anmerkungen # OCR

vor 10 Monaten

021.5K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

Textextraktions-API (text-extract-api): visuelle Extraktion von Textinformationen, anonymisiertes PDF-Extraktionswerkzeug

Umfassende Einführung Die Textextraktions-API (text-extract-api) ist ein leistungsfähiges Tool zum Extrahieren und Parsen von Inhalten aus einer Vielzahl von Dokumentformaten (z. B. PDF, Word, PPTX usw.). Die API nutzt die modernste OCR-Technologie (Optical Character Recognition) und...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 8 Monaten

017.9K

Picture to Excel Free Tool: Effizientes Erkennen von Tabellen mit komplexen Formatierungen in Bildern und Konvertieren in Excel-Dateien

Allgemeine Beschreibung Picture to Excel Free Tool ist ein effizientes Online-Tool zur schnellen und genauen Identifizierung und Konvertierung von Tabellendaten aus Bildern in Excel-Dateien. Das Tool unterstützt eine breite Palette von Bildformaten, wie JPG und PNG, und kann auf Webseiten, iOS-Apps und Android-Apps verwendet werden...

Neueste AI-Ressourcen # OCR

vor 11 Monaten

019.1K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: spezielles KI-Modell für OCR-Erkennung, PDF zu Markdown (Open Source/API)

Umfassende Einführung Datalab bietet eine Reihe von fortschrittlichen KI-Modellen mit Schwerpunkt auf OCR, Layout-Analyse, PDF zu Markdown und mehr. Diese Modelle sind nicht nur sehr leistungsfähig, sondern auch einfach zu bedienen und quelloffen. Die Marker-Modelle auf der Plattform können schnell und genau...

Neueste AI-Ressourcen # AI Offene Dienste # AI Java Open Source Projekt # OCR

vor 11 Monaten

021.5K

eSearch: Multifunktionales plattformübergreifendes OCR-Tool, integrierte Suche | Übersetzung | Suchkarte | Bildschirmaufzeichnung und weitere Funktionen

Allgemeine Einführung eSearch ist ein von xushengfeng entwickeltes plattformübergreifendes Open-Source-Screenshot-Tool, das Windows-, macOS- und Linux-Systeme unterstützt. Es integriert eine Vielzahl von Funktionen, einschließlich Screenshot, OCR-Erkennung, Suche, Übersetzung, Mapping...

Neueste AI-Ressourcen # OCR

vor 11 Monaten

016.7K

Surya: Professionelles mehrsprachiges OCR-Tool für Dokumente, Open Source Native Deployment

Umfassende Einführung Surya ist ein Open-Source-Toolkit für die mehrsprachige OCR von Dokumenten, das die Texterkennung in über 90 Sprachen unterstützt. Es führt nicht nur eine zeilenweise Texterkennung durch, sondern auch eine Layout-Analyse, eine Erkennung der Lesereihenfolge und eine Tabellenerkennung...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR

vor 11 Monaten

037K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: Extraktion und Konvertierung von PDF-Dokumenten in das multimodale Markdown-Format, Unterstützung von OCR-Scans für E-Books

Umfassende Einführung MinerU ist ein Open-Source-Tool zur Datenextraktion, das vom OpenDataLab-Team am Shanghai Artificial Intelligence Laboratory entwickelt wurde und sich auf die effiziente Extraktion von Inhalten aus komplexen PDF-Dokumenten, Webseiten und eBooks konzentriert. Es ist in der Lage, multimodale PDFs zu verarbeiten, die Bilder, Formeln, Tabellen und andere Elemente enthalten...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR # Extraktion und Reinigung von Dokumenten

vor 12 Monaten

037.1K

PixPin: lange und dynamische Bildschirmfotos, integrierte Texterkennung (OCR)

Allgemeine Einführung PixPin ist ein leistungsfähiges Screenshot- und Posting-Tool, das entwickelt wurde, um die Produktivität der Benutzer zu steigern. Ob für den täglichen Gebrauch im Büro oder im Beruf, PixPin bietet bequeme Screenshot-, Einfüge-, Long-Screenshot-, Texterkennungs- (OCR) und Dynamic-Screenshot-Funktionen. Seine einfache Schnittstelle und...

Neueste AI-Ressourcen # OCR

vor 1 Jahr

024.7K

GOT-OCR2.0: Basierend auf QWen2 0.5B End-to-End multimodales OCR-Modell

Umfassende Einführung GOT-OCR2.0 ist ein von StepStar mitentwickeltes Open Source Optical Character Recognition (OCR)-Modell, das die OCR-Technologie durch ein einheitliches End-to-End-Modell in Richtung OCR-2.0 vorantreiben soll. Das Modell unterstützt eine breite Palette von OCR-Aufgaben, einschließlich normaler Texterkennung,...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR

vor 1 Jahr

020.7K

PaddleOCR: Eine mehrsprachige OCR-Werkzeugbibliothek auf der Grundlage von Flying Paddle, die die Erkennung von mehr als 80 Sprachen unterstützt

Umfassende Einführung PaddleOCR ist ein mehrsprachiges OCR-Toolkit, das auf PaddlePaddle basiert und ein praktisches und ultraleichtes OCR-System bietet. Es unterstützt die Erkennung von mehr als 80 Sprachen und bietet Werkzeuge zur Datenkommentierung und -synthese, um die...

Neueste AI-Ressourcen # AI Java Open Source Projekt # OCR

vor 9 Monaten

022.6K

Pix2Text: kostenloses Open-Source-Tool zur Bilderkennung

Pix2Text Allgemeine Einführung Pix2Text (P2T) ist ein kostenloses Open-Source-Tool, das Mathpix ersetzen soll und die Erkennung von Bildtext und mathematischen Formeln ermöglicht. Benutzer können das Tool kostenlos über die Webversion nutzen und bis zu 10.000 pro Tag erkennen...

Neueste AI-Ressourcen # OCR

vor 1 Jahr

022.5K

Umi-OCR: quelloffene Offline-OCR-Software, Batch-Bilderkennung und PDF-Erkennung

Umi-OCR Allgemeine Einführung Umi-OCR ist eine kostenlose Open-Source-Offline-OCR-Software, die Screenshots, Batch-Import von Bildern, Erkennung von PDF-Dokumenten, Ausschließen von Wasserzeichen und Kopf- und Fußzeilen, Scannen und Generieren von QR-Codes unterstützt. Die Software hat eine eingebaute mehrsprachige Bibliothek für Windows und Li...

Neueste AI-Ressourcen # OCR

vor 1 Jahr

024.7K

TTime: Picture Your Text Recognition and Text Translation Software

TTime Allgemeine Einführung TTime ist ein Projekt, das von InkTimeRecord auf GitHub veröffentlicht wurde und ist eine einfache und effiziente Übersetzungssoftware. Es bietet hauptsächlich Eingabe-, Screenshot-, Strich- und Hoverball-Übersetzungsfunktionen, unterstützt mehrere Übersetzungsquellen und Texterkennungsdienste...

Neueste AI-Ressourcen # AI Übersetzung # OCR

vor 1 Jahr

019.9K

Das ist nicht alles.