Pix2Text Allgemeine Einführung
Pix2Text (P2T) ist ein kostenloses Open-Source-Tool, das als Ersatz für Mathpix entwickelt wurde und die Erkennung von Bildtext und mathematischen Formeln ermöglicht. P2T unterstützt die Erkennung und Konvertierung von Text, Tabellen, mathematischen Formeln usw. aus Bildern in das LaTeX- oder Markdown-Format zur einfachen Bearbeitung und Verwendung.
Pix2Text Funktionsliste
- Bildtexterkennung: Erkennen Sie chinesischen und englischen Text in Bildern und wandeln Sie ihn in bearbeitbaren Text um.
- Erkennung mathematischer Formeln: Erkennen Sie mathematische Formeln in Bildern und konvertieren Sie sie in eine LaTeX-Darstellung.
- Tabellenerkennung: Erkennen Sie Tabellen in Bildern und konvertieren Sie sie in das Markdown-Format.
- PDF-Konvertierung: Konvertieren Sie den Inhalt einer PDF-Datei in das Markdown-Format.
- Kostenlose Nutzung: bis zu 10.000 Zeichen pro Tag.
Pix2Text-Hilfe
Installation und Nutzung
Pix2Text ist in einer webbasierten Version erhältlich, bei der der Benutzer keine Software installieren muss. Besuchen Sie einfach Pix2Text-Website und laden Sie die zu erkennende Bild- oder PDF-Datei hoch, um das Erkennungsergebnis zu erhalten.
Funktion Betriebsablauf
- Zugang zur Website: Öffnen Sie Ihren Browser und besuchen Sie Pix2Text-Website.
- Hochladen von DateienKlicken Sie auf die Schaltfläche "Datei hochladen" auf der Seite und wählen Sie die zu erkennende Bild- oder PDF-Datei aus.
- Auswahl der IdentifikationsartWählen Sie, ob Sie Text, mathematische Formeln oder Tabellen erkennen wollen.
- Ergebnisse anzeigenKlicken Sie auf die Schaltfläche "Erkennung starten" und warten Sie ein paar Sekunden, bis das Erkennungsergebnis angezeigt wird.
- Ergebnisse herunterladenErkennungsergebnisse können direkt kopiert oder als LaTeX- oder Markdown-Datei heruntergeladen werden.
Detaillierte Funktionen
- Bild-Text-ErkennungUnterstützt chinesische und englische Texterkennung für alle Arten von Dokumenten, Büchern, handschriftlichen Notizen und anderen Bildern.
- Erkennung mathematischer FormelnDas fortschrittliche Modell zur Erkennung mathematischer Formeln kann mathematische Formeln in Bildern genau identifizieren und in LaTeX-Darstellungen umwandeln, was für die akademische Forschung und das Verfassen von Abschlussarbeiten praktisch ist.
- Formulare ErkennungErkennung von Tabellenstrukturen in Bildern und Umwandlung in das Markdown-Format zur einfachen Verwendung in Dokumenten.
- PDF-KonvertierungKonvertieren Sie PDF-Dateien in das Markdown-Format für Benutzer, die PDF-Inhalte bearbeiten und organisieren müssen.
- Kostenlose NutzungPix2Text ist kostenlos und erkennt bis zu 10.000 Zeichen pro Tag, so dass es für Einzelpersonen und kleine Teams geeignet ist.
Tipps & Tricks
- Bilder in hoher QualitätDas Hochladen von scharfen Bildern kann die Erkennungsgenauigkeit verbessern.
- Segment-IdentifikationBei längeren Dokumenten können die Bilder zur Erkennung in Segmenten hochgeladen werden, um sicherzustellen, dass jedes Segment genau erkannt wird.
- Ergebnisse der Inspektion: Die Erkennungsergebnisse können eine geringe Anzahl von Fehlern enthalten, und die Benutzer werden gebeten, sie vor der Verwendung zu überprüfen und zu korrigieren.
Pix2Text Projekt-Bereitstellung
Montage
- Offene Quelladresse:https://github.com/breezedeus/Pix2Text
- Vorbereitung der Python-UmgebungStellen Sie sicher, dass Python 3.6 und höher installiert ist.
- Pix2Text installieren::
pip install pix2text
Wenn Sie mehrsprachige Texte erkennen müssen, verwenden Sie den folgenden Befehl, um zusätzliche Pakete zu installieren:
pip install pix2text[mehrsprachig]
Wenn die Installation langsam ist, können Sie eine inländische Installationsquelle angeben, z. B. die AliCloud-Installationsquelle:
pip install pix2text -i https://mirrors.aliyun.com/pypi/simple
ausnutzen
- Kommandozeilentool::
- Erkennen von Text in Bildern:
pix2text bild.jpg
- Erkennen von PDF-Dateien:
pix2text-Dokument.pdf
- Erkennen von Text in Bildern:
- HTTP-Dienst::
- Starten Sie den HTTP-Dienst:
pix2text dienen
- Erkennen von Bildern über HTTP-Anfragen:
curl -F "file=@image.jpg" http://localhost:5000/ocr
- Starten Sie den HTTP-Dienst:
- Nutzung der Webversion::
- Besuchen Sie die Pix2Text-Online-Version der Website und ziehen Sie das Bild per Drag & Drop in den dafür vorgesehenen Bereich, um das Erkennungsergebnis zu erhalten.
typisches Beispiel
- Bild-Text-Erkennung: Eingabebild: !example Ausgabetext:
Dies ist ein Beispieltext.
- Erkennung mathematischer Formeln: Eingabebild: !Beispiel Ausgabeformel:
$$E=mc^2$$
- Formulare Erkennung: Eingabebild: !example Ausgabetabelle:
| Kopfzeile1 | Kopfzeile2 | |---------|---------| | Daten1 | Daten2 |