OCR

Insgesamt 27 Artikel
VOP:提取复杂图表与数学公式的OCR工具

VOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer Formeln

Umfassende Einführung Das Versatile OCR Program ist ein Open-Source-Tool zur optischen Zeichenerkennung (OCR), das für die Arbeit mit komplexen akademischen und Bildungsdokumenten entwickelt wurde. Es kann Text, Tabellen, mathematische Formeln, Diagramme und Schemata aus PDFs, Bildern und anderen Dokumenten extrahieren und...
vor 4 Monaten
01.4K
自动解析PDF内容并提取文字与表格的开源服务

Automatisches Parsen von PDF-Inhalten und Extrahieren von Text und Tabellen von Open-Source-Diensten

Umfassende Einführung Es analysiert automatisch das Layout von PDF-Dokumenten, identifiziert Text, Titel, Bilder, Tabellen, Formeln und andere Elemente auf der Seite und bestimmt ihre richtige Reihenfolge. Das Tool unterstützt OCR-Funktionalität und kann gescannte PDFs in durchsuchbaren Text umwandeln. Es läuft auf Docker und bietet zwei Modelle...
vor 4 Monaten
01.1K
Mistral OCR:94.89%总体精度,1000 页/30秒,只需1美元

Mistral OCR: 94,89% Gesamtgenauigkeit, 1000 Seiten/30 Sekunden, nur $1

In der langen Geschichte der menschlichen Zivilisation hat jeder Sprung in der Art und Weise, wie Informationen erworben und analysiert werden, tiefgreifend zum sozialen Fortschritt beigetragen. Von den antiken Hieroglyphen über den tragbaren Papyrus bis hin zur späteren Entwicklung des Buchdrucks und der heutigen digitalen Welle hat jede technologische Innovation das Paradigma der menschlichen Wissensverbreitung erheblich erweitert...
vor 5 Monaten
01.3K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: Extrahieren von Text aus Bildern mithilfe visueller Modelle in Ollama

Umfassende Einführung Ollama OCR ist ein leistungsstarkes Toolkit für die optische Zeichenerkennung (OCR), das das hochmoderne visuelle Sprachmodell der Ollama-Plattform nutzt, um Text aus Bildern zu extrahieren. Das Projekt ist sowohl als Python-Paket verfügbar als auch als benutzerfreundliche Strea...
vor 7 Monaten
02.9K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: ein All-in-One-Dienst, der visuelle Modelle für die Aufnahme von Dokumenten und intelligentes Chunking auf der Grundlage von Textabsatzhierarchien verwendet

Allgemeine Einführung Chunkr ist eine selbst gehostete API zur Konvertierung von PDF-, PPTX-, DOCX- und Excel-Dateien in Daten, die für die Verwendung in RAG (Retrieval Augmented Generation) und LLM (Large Language Modelling) geeignet sind. Das Projekt wurde von Lumina entwickelt...
vor 8 Monaten
02.6K
ScreenPipe:24小时收集录屏和操作信息并转换为本地知识库,通过AI助手对话、总结、回顾知识

ScreenPipe: 24-Stunden-Sammlung von aufgezeichneten Bildschirm- und Betriebsinformationen und Umwandlung in eine lokale Wissensbasis, durch den KI-Assistenten Dialog, Zusammenfassung, Überprüfung von Wissen

Allgemeine Beschreibung ScreenPipe ist ein von mediar-ai entwickeltes KI-Assistententool, das sich auf die Aufnahme von Bildschirminhalten, Screenshots und Audio 24/7 konzentriert. Es kombiniert rewind.ai und cursor.com's...
vor 9 Monaten
02.3K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

Textextraktions-API (text-extract-api): visuelle Extraktion von Textinformationen, anonymisiertes PDF-Extraktionswerkzeug

Umfassende Einführung Die Textextraktions-API (text-extract-api) ist ein leistungsfähiges Tool zum Extrahieren und Parsen von Inhalten aus einer Vielzahl von Dokumentformaten (z. B. PDF, Word, PPTX usw.). Die API nutzt die modernste OCR-Technologie (Optical Character Recognition) und...
vor 7 Monaten
02K
图片转Excel免费工具:高效识别图片中复杂格式的表格并转换为Excel文件

Picture to Excel Free Tool: Effizientes Erkennen von Tabellen mit komplexen Formatierungen in Bildern und Konvertieren in Excel-Dateien

Allgemeine Beschreibung Picture to Excel Free Tool ist ein effizientes Online-Tool zur schnellen und genauen Identifizierung und Konvertierung von Tabellendaten aus Bildern in Excel-Dateien. Das Tool unterstützt eine breite Palette von Bildformaten, wie JPG und PNG, und kann auf Webseiten, iOS-Apps und Android-Apps verwendet werden...
vor 9 Monaten
01.8K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: Extraktion und Konvertierung von PDF-Dokumenten in das multimodale Markdown-Format, Unterstützung von OCR-Scans für E-Books

Umfassende Einführung MinerU ist ein Open-Source-Tool zur Datenextraktion, das vom OpenDataLab-Team am Shanghai Artificial Intelligence Laboratory entwickelt wurde und sich auf die effiziente Extraktion von Inhalten aus komplexen PDF-Dokumenten, Webseiten und eBooks konzentriert. Es ist in der Lage, multimodale PDFs zu verarbeiten, die Bilder, Formeln, Tabellen und andere Elemente enthalten...
vor 10 Monaten
02.5K