AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 27 Artikel

Tags: OCR Seite 2

MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描-首席AI分享圈

MinerU: Extraktion und Konvertierung von PDF-Dokumenten in das multimodale Markdown-Format, Unterstützung von OCR-Scans für E-Books

Umfassende Einführung MinerU ist ein Open-Source-Tool zur Datenextraktion, das vom OpenDataLab-Team am Shanghai Artificial Intelligence Lab entwickelt wurde und sich auf die effiziente Extraktion von Inhalten aus komplexen PDF-Dokumenten, Webseiten und eBooks konzentriert. Es kann multimodale PDF-Dokumente, die Bilder, Formeln, Tabellen und andere Elemente enthalten, in einfach zu analysierende M...

PixPin:长截图和动态截图,内置本地文字识别(OCR)-首席AI分享圈

PixPin: lange und dynamische Bildschirmfotos, integrierte Texterkennung (OCR)

Allgemeine Einführung PixPin ist ein leistungsfähiges Screenshot- und Posting-Tool, das entwickelt wurde, um die Produktivität der Benutzer zu steigern. Ob für den täglichen Gebrauch im Büro oder im Beruf, PixPin bietet bequeme Screenshot-, Einfüge-, Long-Screenshot-, Texterkennungs- (OCR) und Dynamic-Screenshot-Funktionen. Die einfache Benutzeroberfläche und die reichhaltigen Funktionen machen...

AI-Tools
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型-首席AI分享圈

GOT-OCR2.0: Basierend auf QWen2 0.5B End-to-End multimodales OCR-Modell

Umfassende Einführung GOT-OCR2.0 ist ein gemeinsames Open-Source-Modell für die optische Zeichenerkennung (OCR) von StepStar, das die OCR-Technologie durch ein einheitliches End-to-End-Modell in Richtung OCR-2.0 vorantreiben soll. Das Modell unterstützt eine breite Palette von OCR-Aufgaben, einschließlich normaler Texterkennung, Erkennung von formatiertem Text, feinkörnige OCR,...

PaddleOCR: Eine mehrsprachige OCR-Werkzeugbibliothek auf der Grundlage von Flying Paddle, die die Erkennung von mehr als 80 Sprachen unterstützt

Allgemeine Einführung PaddleOCR ist ein mehrsprachiges OCR-Toolkit, das auf PaddlePaddle basiert und ein praktisches und ultraleichtes OCR-System bieten soll. Es unterstützt die Erkennung in über 80 Sprachen und bietet Tools für die Datenannotation und -synthese zur Unterstützung von Servern, mobilen, eingebetteten und IoT-Geräten...

Pix2Text:开源免费图片文字识别工具-首席AI分享圈

Pix2Text: kostenloses Open-Source-Tool zur Bilderkennung

Pix2Text Allgemeine Beschreibung Pix2Text (P2T) ist ein kostenloses Open-Source-Tool, das Mathpix ersetzen soll und die Erkennung von Bildtexten und mathematischen Formeln ermöglicht. Benutzer können das Tool kostenlos über die Webversion nutzen und bis zu 10.000 Zeichen pro Tag erkennen. P2T unterstützt die Erkennung von Text in Bildern, Tabellen,...

AI-Tools
Umi-OCR:开源离线OCR软件,批量图片识别和PDF识别-首席AI分享圈

Umi-OCR: quelloffene Offline-OCR-Software, Batch-Bilderkennung und PDF-Erkennung

Umi-OCR Allgemeine Beschreibung Umi-OCR ist eine kostenlose Open-Source-Offline-OCR-Software, die Screenshots, Batch-Import von Bildern, Erkennung von PDF-Dokumenten, Ausschließen von Wasserzeichen und Kopf- und Fußzeilen, Scannen und Generieren von QR-Codes unterstützt. Die Software verfügt über eine eingebaute mehrsprachige Bibliothek für Windows und Linux.Umi-OCR erfordert keine Installation, un...

AI-Tools
TTime:图片你文字识别和文字翻译软件-首席AI分享圈

TTime: Picture Your Text Recognition and Text Translation Software

TTime Allgemeine Einführung TTime, ein auf GitHub veröffentlichtes Projekt von InkTimeRecord, ist eine einfache und effiziente Übersetzungssoftware. Es bietet vor allem Eingabe-, Screenshot-, Strich- und Hoverball-Übersetzungsfunktionen, unterstützt mehrere Übersetzungsquellen und Texterkennungsdienste, so dass Benutzer schnell Sprachen und Texte konvertieren können...

de_DEDeutsch