Allgemeine Einführung
PDFMathTranslate ist ein Open-Source-Tool, das sich auf die Übersetzung wissenschaftlicher Arbeiten konzentriert und in der Lage ist, den vollständigen Text von PDF-Dokumenten zu übersetzen und zweisprachige Versionen zu erstellen. Es nutzt KI-Technologie, um das vollständige Layout des Originaldokuments beizubehalten, einschließlich Formeln, Diagramme, Inhaltsverzeichnisse und Notizen, und unterstützt Google, DeepL, Ollama, OpenAI und andere Übersetzungsdienste. Das Tool bietet eine Befehlszeile (CLI), eine grafische Oberfläche (GUI), eine Docker-Bereitstellung und ein Zotero-Plugin, um die Bedürfnisse von Forschern nach schneller Übersetzung und Lektüre zu erfüllen. Bis März 2025 hat das Projekt über 17.000 Sterne auf GitHub erhalten, verfügt über eine aktive Community und wird ständig mit neuer Unterstützung für lokale Modelle, Nicht-PDF/A-Dateien und BabelDOC-Backends aktualisiert.
-
Online-Erfahrung: https://pdf2zh.com/
Funktionsliste
- Vollständige Übersetzung und ZweisprachigkeitPDF-Dokumente in die Zielsprache übersetzen und dabei sowohl einsprachige Übersetzungen als auch zweisprachige Querverweise erstellen.
- Bewahrung der ursprünglichen TypografieFormeln, Diagramme, Inhaltsverzeichnisse und Notizen einheitlich formatieren und komplexe Satzprogramme wie LaTeX unterstützen.
- Unterstützung mehrerer SprachenÜbersetzung aus mehreren Ausgangssprachen, z. B. Englisch, in mehrere Zielsprachen, z. B. Chinesisch.
- Multi-ÜbersetzungsdiensteIntegration mit Diensten wie Google, DeepL, OpenAI, Ollama, und Unterstützung für Xinference Lokale Modelle.
- Multiplattform-NutzungBietet CLI-Tools, GUI-Schnittstelle, Docker-Container und Zotero-Plugins.
- Online-Erfahrung:: Testen Sie die Kernfunktionen ohne Installation über öffentliche Dienste.
- Erweiterte AnpassungUnterstützung für erweiterte Optionen wie Teilübersetzung, Multi-Thread-Verarbeitung, benutzerdefinierte Ausgabeverzeichnisse und mehr.
Hilfe verwenden
Einbauverfahren
PDFMathTranslate bietet mehrere Installationsmethoden für unterschiedliche Szenarien. Im Folgenden finden Sie die detaillierten Schritte:
1. die UV-Installation (Befehlszeile empfohlen)
- VoraussetzungenPython 3.10 bis 3.12 ist erforderlich.
- umziehen:
- Installieren Sie das UV-Tool:
pip install uv
- Installieren Sie PDFMathTranslate:
uv tool install --python 3.12 pdf2zh
- Überprüfen: Ausführen
pdf2zh --version
Wenn die Versionsnummer angezeigt wird, ist der Vorgang erfolgreich.
- Installieren Sie das UV-Tool:
- Fehlerbehebung im NetzwerkWenn das Modell nicht heruntergeladen werden kann
wybxc/DocLayout-YOLO-DocStructBench-onnx
setzen Sie die Umgebungsvariablen:- CMD.
set HF_ENDPOINT=https://hf-mirror.com
- PowerShell.
$env:HF_ENDPOINT = "https://hf-mirror.com"
- CMD.
2. ausführbare Windows-Datei (keine Programmierumgebung erforderlich)
- umziehen:
- Besuchen Sie die GitHub-Veröffentlichungsseite (https://github.com/Byaidu/PDFMathTranslate/releases).
- Download der neuesten
pdf2zh-version-win64.zip
. - Entpacken und doppelklicken Sie auf
pdf2zh.exe
Laufen.
- zur Kenntnis nehmenFalls dies nicht funktioniert, müssen Sie die VC++-Laufzeitbibliothek installieren (https://aka.ms/vs/17/release/vc_redist.x64.exe).
3. grafische Benutzeroberfläche (GUI)
- VoraussetzungenPython 3.10 bis 3.12.
- umziehen:
- Installieren Sie das Paket:
pip install pdf2zh
- Starten Sie die GUI:
pdf2zh -i
- Browser-Zugang
http://localhost:7860/
(Falls nicht automatisch eingeschaltet, geben Sie es manuell ein).
- Installieren Sie das Paket:
- Fehlerbehebung im NetzwerkWie bei der UV-Montagemethode.
4. die Docker-Bereitstellung
- Voraussetzungen: Docker ist installiert (https://www.docker.com/).
- umziehen:
- Ziehen Sie das Image und führen Sie es aus:
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
- Browser-Zugang
http://localhost:7860/
.
- Ziehen Sie das Image und führen Sie es aus:
- Alternatives ProgrammWenn Docker Hub nicht verfügbar ist, verwenden Sie GitHub-Spiegel:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate
5. das Zotero-Plugin
- umziehen:
- Besuchen Sie https://github.com/guaguastandup/zotero-pdf2zh, um das Plugin herunterzuladen.
- Installieren und konfigurieren Sie die Übersetzungsparameter in Zotero.
Arbeitsablauf
1. die Übersetzung auf der Befehlszeile
- grundlegende Bedienung:
- Bereiten Sie die PDF-Datei vor (z. B.
paper.pdf
). - Befehl ausführen:
pdf2zh paper.pdf
- Ausgabe: Generieren
paper-mono.pdf
(Übersetzung) undpaper-dual.pdf
(zweisprachig), Speichern im aktuellen Verzeichnis.
- Erweiterte Optionen:
- Geben Sie die Sprache an:
-li en -lo zh
(Englisch-Chinesisch). - Dienst auswählen:
-s deepl
(Verwenden Sie DeepL). - Teilweise Übersetzung:
-p 1-5
(Seiten 1-5). - Ausgangspfad:
-o ./output
.
Beispiel:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
- Kompatibilität:: Nicht-PDF/A-Dateien plus
--compatible
Parameter:
pdf2zh paper.pdf --compatible
2. die Verwendung der GUI-Schnittstelle
- Verfahren:
- Starten Sie die GUI (
pdf2zh -i
). - Hochladen einer Datei: Klicken Sie auf "Datei auswählen", um eine lokale PDF-Datei hochzuladen, oder geben Sie einen Online-Link ein (z. B. "PDF hochladen").
http://arxiv.org/paper.pdf
). - Konfigurationsparameter:
- Ausgangssprache: Wählen Sie "Englisch".
- Zielsprache: Wählen Sie "Chinesisch (Vereinfacht)".
- Übersetzungsdienst: Wählen Sie "Google" oder andere.
- Klicken Sie auf "Übersetzen" und warten Sie, bis der Vorgang abgeschlossen ist.
- Download: Sie erhalten eine ein- oder zweisprachige PDF-Datei.
- Ausgewählte FunktionenUnterstützung für Online-Link-Übersetzung und intuitive Bedienung.
3. die Docker-Online-Dienste
- Verfahren:
- Zugriff nach dem Start des Containers
http://localhost:7860/
. - Wie bei der GUI-Bedienung, Dateien oder Links hochladen, Parameter einstellen und dann übersetzen.
- Funktion teilen: hinzufügen
--share
Parameter, um einen öffentlichen Link zu erzeugen:pdf2zh -i --share
4. die Verwendung des Zotero-Plug-ins
- Verfahren:
- Wählen Sie das PDF-Dokument in Zotero aus.
- Klicken Sie auf das Plugin-Symbol, um die Sprache und die Dienste einzustellen.
- Das Ergebnis wird nach der Übersetzung automatisch an den Eintrag angehängt.
Ausgewählte Funktionen
- Einbehaltung des Satzes: Verwendung
DocLayout-YOLO
Modellparsing-Layout, um die genaue Platzierung von Formeln und Diagrammen zu gewährleisten. - Online-Service-ErfahrungBesuchen Sie https://pdf2zh.com/ oder https://app.immersivetranslate.com/babel-doc/ (1.000 kostenlose Seiten pro Monat), um es ohne Installation zu nutzen.
- Multithreading-Beschleunigung: Verwendung
-t 4
Aktivieren Sie 4 Threads für große Dateien:
pdf2zh large_paper.pdf -t 4
caveat
- RessourcenbeschränkungenDie Online-Demo verfügt über begrenzte Computerressourcen, die Sie bitte nicht missbrauchen sollten.
- Protokoll aktualisierenMärz 2025 BabelDOC WebUI-Unterstützung (experimentell) hinzugefügt, um das Übersetzungserlebnis zu verbessern.
- Feedback der Gemeinschaft: Reichen Sie Vorschläge über GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) oder die Telegram-Gruppe (https://t.me/+Z9_SgnxmsmA5NzBl) ein.
PDFMathTranslate Inoffizielles Integrationspaket
https://pan.quark.cn/s/e9e912c62c3a#/list/share
https://github.com/aidayang/PDFMathTranslate-OneClick