Allgemeine Einführung
BabelDOC ist ein Open-Source-Tool, mit dem PDF-Dokumente in ein zweisprachiges Format übersetzt werden können. Es wurde vom funstory-ai-Team entwickelt und auf GitHub gehostet. Es dient vor allem Benutzern, die mit fremdsprachigen Dokumenten arbeiten müssen, wie Forschern, Studenten und Technikern.BabelDOC unterstützt die Übersetzung von englischen PDFs ins Chinesische, wobei das ursprüngliche Layout, einschließlich mathematischer Formeln und Tabellen, erhalten bleibt. Benutzer können es über einen Online-Dienst, die Befehlszeileninstrumentierung (CLI) oder die Python-API nutzen. Der Online-Dienst wird von Immersive Translate bereitgestellt und ist für 1000 Seiten pro Monat kostenlos, während die Selbstbereitstellung über den Quellcode oder die PDFMathTranslate Projektrealisierung.
Funktionsliste
- Übersetzen Sie PDF-Dateien in ein zweisprachiges Format, in dem der Originaltext und der übersetzte Text nebeneinander angezeigt werden.
- Behält die ursprüngliche Typografie bei und unterstützt die korrekte Darstellung von mathematischen Formeln, Tabellen und Bildern.
- Bietet Befehlszeilentools (CLI) zur Unterstützung der Stapelübersetzung mehrerer Dateien.
- Bereitstellung einer Python-API, die von Entwicklern leicht in andere Programme eingebettet werden kann.
- Unterstützung für Online-Dienste, kostenlose Übersetzung von 1000 Seiten pro Monat.
- Es wird die Selbstbereitstellung unterstützt, mit der Möglichkeit, lokal zu arbeiten oder zusätzliche Übersetzungsdienste in Verbindung mit PDFMathTranslate zu nutzen.
- Konfigurierbar mit mehreren Übersetzungsmaschinen, wie OpenAI, Bing, etc.
- Offline-Verwaltung von Ressourcenpaketen, geeignet für Umgebungen ohne Netzwerk.
Hilfe verwenden
BabelDOC kann auf vielfältige Weise eingesetzt werden, z. B. als Online-Dienst oder als lokale Anwendung. Hier finden Sie einen detaillierten Leitfaden, der Ihnen den schnellen Einstieg erleichtert.
Nutzung von Online-Diensten
- Zugang zu Online-Diensten
zeigen (eine Eintrittskarte) Immersives Übersetzen - BabelDOCDies ist ein Beta-Dienst. - Hochladen von Dateien
Klicken Sie auf die Schaltfläche Hochladen und wählen Sie die zu übersetzende PDF-Datei aus. Die Dateigröße und die Anzahl der Seiten müssen innerhalb des kostenlosen Kontingents liegen (1000 Seiten/Monat). - Sprache auswählen
Die Übersetzung von Englisch nach Chinesisch wird standardmäßig unterstützt. Nach dem Hochladen wird das System automatisch eine zweisprachige PDF-Datei verarbeiten und erzeugen. - Ergebnisse herunterladen
Sobald die Übersetzung abgeschlossen ist, klicken Sie auf die Schaltfläche Download, um die übersetzte Datei zu erhalten. Das Ergebnis enthält den Originaltext und die Übersetzung, die nebeneinander angezeigt werden.
Lokaler Installationsprozess
BabelDOC unterstützt die Installation von PyPI oder aus dem Quellcode, was empfohlen wird. uv
Management der Umwelt.
Installieren aus PyPI
- Installation von Python und uv
Stellen Sie sicher, dass auf Ihrem System Python 3.12 oder höher installiert ist. Laden Sie uv herunter, installieren Sie es und konfigurieren Sie die Umgebungsvariablen. - Installation von BabelDOC
Läuft im Terminal:
uv tool install --python 3.12 BabelDOC
- Überprüfen der Installation
Eingabe:
babeldoc --help
Wenn eine Hilfemeldung angezeigt wird, war die Installation erfolgreich.
Installation von der Quelle aus
- Klonprojekt
Läuft im Terminal:
git clone https://github.com/funstory-ai/BabelDOC
cd BabelDOC
- Installation von Abhängigkeiten
ausnutzenuv
Installieren Sie die Abhängigkeit:
uv run pip install -r requirements.txt
- Überprüfen der Installation
Laufen:
uv run babeldoc --help
Die Anzeige der Hilfemeldung zeigt den Erfolg an.
Offline-Ressourcen
Wenn Sie es offline verwenden müssen, können Sie das Ressourcenpaket verwalten:
- Ressourcenkit generieren
babeldoc --generate-offline-assets /path/to/output/dir
Die erzeugte Zip-Datei enthält Schriftarten und Modelle.
2. Ressourcen-Kit für die Rückgewinnung
babeldoc --restore-offline-assets /path/to/offline_assets_package.zip
Die Ressourcen werden in den Standardpfad extrahiert ~/.cache/babeldoc/assets/
.
Lokale Nutzung
Verwendung der Befehlszeile
- Übersetzung einzelner Dokumente
Angenommen, es gibt eine Dateiexample.pdf
Übersetzt mit OpenAI:
babeldoc --files example.pdf --openai --openai-model "gpt-4o-mini" --openai-api-key "你的API密钥"
Die Ausgabedatei wird automatisch erzeugt als example_translated.pdf
.
2. Übersetzung von mehreren Dokumenten
Verarbeitet mehrere Dateien:
babeldoc --files example1.pdf --files example2.pdf --bing
- Seite spezifizieren
Übersetzen Sie nur die Seiten 1, 3-5:
babeldoc --files example.pdf --pages "1,3-5" --openai --openai-api-key "你的API密钥"
- Anpassung der Sprache
Standardübersetzung Englisch-Chinesisch, falls andere Sprachen gewünscht werden:
babeldoc --files example.pdf --lang-in "en" --lang-out "fr" --openai --openai-api-key "你的API密钥"
Python-API-Verwendung
- Basisübersetzung
Dokumente erstellentranslate.py
::
from babeldoc.main import TranslationConfig, translate_document
config = TranslationConfig(
files=["example.pdf"],
lang_in="en",
lang_out="zh",
translator="openai",
openai_api_key="你的API密钥",
openai_model="gpt-4o-mini"
)
translate_document(config)
in Bewegung sein python translate.py
Bereit zum Übersetzen.
2. Offline-Ressourcenverwaltung
from pathlib import Path
from babeldoc.assets.assets import generate_offline_assets_package, restore_offline_assets_package
# 生成资源包
generate_offline_assets_package(Path("/path/to/output/dir"))
# 恢复资源包
restore_offline_assets_package(Path("/path/to/offline_assets_package.zip"))
Featured Function Bedienung
- Zweisprachigkeit
In der übersetzten PDF-Datei werden der Originaltext und der übersetzte Text nebeneinander angezeigt. Zum Beispiel ist der englische Text auf der linken Seite und der chinesische Text auf der rechten Seite, um einen einfachen Vergleich zu ermöglichen. Formeln wieE=mc^2
Der Originaltext wird beibehalten und mit Erläuterungen zur Übersetzung versehen. - Unterstützung bei komplexer Dokumentation
Unterstützt die Erkennung und Speicherung von mathematischen Formeln und Tabellen. Bei der Übersetzung wird die ursprüngliche Struktur nicht zerstört. - Flexibler Einsatz
Online-Dienste sind einfach und schnell, und die Selbsteinführung ermöglicht mehr Anpassungsmöglichkeiten, z. B. bei der Auswahl der Übersetzungsmaschine.
Verbesserung der Selbsteinführung
Wenn Sie mehr Funktionalität benötigen, können Sie PDFMathTranslate verwenden:
- PDFMathTranslate installieren
Folgen Sie den Anweisungen auf GitHub, um es zu installieren, mit Unterstützung für WebUI und weitere Übersetzungsdienste. - Kombiniert mit BabelDOC
PDFMathTranslate Version 1.9.3+ bietet experimentelle Unterstützung für BabelDOC für erweiterte Übersetzungsmöglichkeiten.
caveat
- Der Online-Dienst ist bis zu 1.000 Seiten pro Monat kostenlos, danach wird er kostenpflichtig.
- Für den lokalen Einsatz müssen Sie einen API-Schlüssel konfigurieren, z. B. den OpenAI-Schlüssel, den Sie auf der OpenAI-Website erhalten.
- Derzeit ist es hauptsächlich für die Übersetzung vom Englischen ins Chinesische optimiert und unterstützt nur begrenzt andere Sprachen.
- Große Dateien werden zur Verwendung empfohlen
--max-pages-per-part
Segmentierung.
Anwendungsszenario
- akademische Forschung
Der Forscher erhielt das englische Papier und übersetzte es mit BabelDOC in eine zweisprachige Version, um das Lesen und Verstehen zu erleichtern. - Übersetzung der technischen Dokumentation
Der Entwickler übersetzt die englischen technischen Handbücher und behält den Code und die Diagramme zur direkten Verwendung bei seiner Arbeit. - Pädagogisches Lernen
Die Schüler übersetzen damit fremdsprachige Lehrbücher, lernen die Sprache und beherrschen gleichzeitig den Inhalt.
QA
- Welche Dateiformate werden unterstützt?
Nur PDF wird unterstützt, andere Formate müssen erst in PDF konvertiert werden. - Was ist der Unterschied zwischen Online-Diensten und lokaler Bereitstellung?
Der Online-Dienst ist einfach und bietet 1.000 kostenlose Seiten pro Monat; für die lokale Bereitstellung ist eine Installation erforderlich, die jedoch mit weiteren Optionen angepasst werden kann. - Was ist, wenn die Übersetzung nicht korrekt ist?
Versuchen Sie, die Übersetzungsmaschine zu wechseln (z. B. von Bing zu OpenAI) oder das Modell anzupassen. - Wie kann ich Code beisteuern?
auschecken MITWIRKENDie Immersive Translate-Mitgliedschaft ist für aktive Beitragszahler verfügbar.