AI Personal Learning
und praktische Anleitung
TRAE

BabelDOC: PDF-Dokumente werden in zweisprachige Open-Source-Tools übersetzt

Allgemeine Einführung

BabelDOC ist ein Open-Source-Tool, mit dem PDF-Dokumente in ein zweisprachiges Format übersetzt werden können. Es wurde vom funstory-ai-Team entwickelt und auf GitHub gehostet. Es dient vor allem Benutzern, die mit fremdsprachigen Dokumenten arbeiten müssen, wie Forschern, Studenten und Technikern.BabelDOC unterstützt die Übersetzung von englischen PDFs ins Chinesische, wobei das ursprüngliche Layout, einschließlich mathematischer Formeln und Tabellen, erhalten bleibt. Benutzer können es über einen Online-Dienst, die Befehlszeileninstrumentierung (CLI) oder die Python-API nutzen. Der Online-Dienst wird von Immersive Translate bereitgestellt und ist für 1000 Seiten pro Monat kostenlos, während die Selbstbereitstellung über den Quellcode oder die PDFMathTranslate Projektrealisierung.

BabelDOC: PDF-Dokumente werden in zweisprachige Open-Source-Tools übersetzt-1


 

Funktionsliste

  • Übersetzen Sie PDF-Dateien in ein zweisprachiges Format, in dem der Originaltext und der übersetzte Text nebeneinander angezeigt werden.
  • Behält die ursprüngliche Typografie bei und unterstützt die korrekte Darstellung von mathematischen Formeln, Tabellen und Bildern.
  • Bietet Befehlszeilentools (CLI) zur Unterstützung der Stapelübersetzung mehrerer Dateien.
  • Bereitstellung einer Python-API, die von Entwicklern leicht in andere Programme eingebettet werden kann.
  • Unterstützung für Online-Dienste, kostenlose Übersetzung von 1000 Seiten pro Monat.
  • Es wird die Selbstbereitstellung unterstützt, mit der Möglichkeit, lokal zu arbeiten oder zusätzliche Übersetzungsdienste in Verbindung mit PDFMathTranslate zu nutzen.
  • Konfigurierbar mit mehreren Übersetzungsmaschinen, wie OpenAI, Bing, etc.
  • Offline-Verwaltung von Ressourcenpaketen, geeignet für Umgebungen ohne Netzwerk.

 

Hilfe verwenden

BabelDOC kann auf vielfältige Weise eingesetzt werden, z. B. als Online-Dienst oder als lokale Anwendung. Hier finden Sie einen detaillierten Leitfaden, der Ihnen den schnellen Einstieg erleichtert.

Nutzung von Online-Diensten

  1. Zugang zu Online-Diensten
    zeigen (eine Eintrittskarte) Immersives Übersetzen - BabelDOCDies ist ein Beta-Dienst.
  2. Hochladen von Dateien
    Klicken Sie auf die Schaltfläche Hochladen und wählen Sie die zu übersetzende PDF-Datei aus. Die Dateigröße und die Anzahl der Seiten müssen innerhalb des kostenlosen Kontingents liegen (1000 Seiten/Monat).
  3. Sprache auswählen
    Die Übersetzung von Englisch nach Chinesisch wird standardmäßig unterstützt. Nach dem Hochladen wird das System automatisch eine zweisprachige PDF-Datei verarbeiten und erzeugen.
  4. Ergebnisse herunterladen
    Sobald die Übersetzung abgeschlossen ist, klicken Sie auf die Schaltfläche Download, um die übersetzte Datei zu erhalten. Das Ergebnis enthält den Originaltext und die Übersetzung, die nebeneinander angezeigt werden.

Lokaler Installationsprozess

BabelDOC unterstützt die Installation von PyPI oder aus dem Quellcode, was empfohlen wird. uv Management der Umwelt.

Installieren aus PyPI

  1. Installation von Python und uv
    Stellen Sie sicher, dass auf Ihrem System Python 3.12 oder höher installiert ist. Laden Sie uv herunter, installieren Sie es und konfigurieren Sie die Umgebungsvariablen.
  2. Installation von BabelDOC
    Läuft im Terminal:
uv tool install --python 3.12 BabelDOC
  1. Überprüfen der Installation
    Eingabe:
babeldoc --help

Wenn eine Hilfemeldung angezeigt wird, war die Installation erfolgreich.

Installation von der Quelle aus

  1. Klonprojekt
    Läuft im Terminal:
git clone https://github.com/funstory-ai/BabelDOC
cd BabelDOC
  1. Installation von Abhängigkeiten
    ausnutzen uv Installieren Sie die Abhängigkeit:
uv run pip install -r requirements.txt
  1. Überprüfen der Installation
    Laufen:
uv run babeldoc --help

Die Anzeige der Hilfemeldung zeigt den Erfolg an.

Offline-Ressourcen

Wenn Sie es offline verwenden müssen, können Sie das Ressourcenpaket verwalten:

  1. Ressourcenkit generieren
babeldoc --generate-offline-assets /path/to/output/dir

Die erzeugte Zip-Datei enthält Schriftarten und Modelle.
2. Ressourcen-Kit für die Rückgewinnung

babeldoc --restore-offline-assets /path/to/offline_assets_package.zip

Die Ressourcen werden in den Standardpfad extrahiert ~/.cache/babeldoc/assets/.

Lokale Nutzung

Verwendung der Befehlszeile

  1. Übersetzung einzelner Dokumente
    Angenommen, es gibt eine Datei example.pdfÜbersetzt mit OpenAI:
babeldoc --files example.pdf --openai --openai-model "gpt-4o-mini" --openai-api-key "你的API密钥"

Die Ausgabedatei wird automatisch erzeugt als example_translated.pdf.
2. Übersetzung von mehreren Dokumenten
Verarbeitet mehrere Dateien:

babeldoc --files example1.pdf --files example2.pdf --bing
  1. Seite spezifizieren
    Übersetzen Sie nur die Seiten 1, 3-5:
babeldoc --files example.pdf --pages "1,3-5" --openai --openai-api-key "你的API密钥"
  1. Anpassung der Sprache
    Standardübersetzung Englisch-Chinesisch, falls andere Sprachen gewünscht werden:
babeldoc --files example.pdf --lang-in "en" --lang-out "fr" --openai --openai-api-key "你的API密钥"

Python-API-Verwendung

  1. Basisübersetzung
    Dokumente erstellen translate.py::
from babeldoc.main import TranslationConfig, translate_document
config = TranslationConfig(
files=["example.pdf"],
lang_in="en",
lang_out="zh",
translator="openai",
openai_api_key="你的API密钥",
openai_model="gpt-4o-mini"
)
translate_document(config)

in Bewegung sein python translate.py Bereit zum Übersetzen.
2. Offline-Ressourcenverwaltung

from pathlib import Path
from babeldoc.assets.assets import generate_offline_assets_package, restore_offline_assets_package
# 生成资源包
generate_offline_assets_package(Path("/path/to/output/dir"))
# 恢复资源包
restore_offline_assets_package(Path("/path/to/offline_assets_package.zip"))

Featured Function Bedienung

  1. Zweisprachigkeit
    In der übersetzten PDF-Datei werden der Originaltext und der übersetzte Text nebeneinander angezeigt. Zum Beispiel ist der englische Text auf der linken Seite und der chinesische Text auf der rechten Seite, um einen einfachen Vergleich zu ermöglichen. Formeln wie E=mc^2 Der Originaltext wird beibehalten und mit Erläuterungen zur Übersetzung versehen.
  2. Unterstützung bei komplexer Dokumentation
    Unterstützt die Erkennung und Speicherung von mathematischen Formeln und Tabellen. Bei der Übersetzung wird die ursprüngliche Struktur nicht zerstört.
  3. Flexibler Einsatz
    Online-Dienste sind einfach und schnell, und die Selbsteinführung ermöglicht mehr Anpassungsmöglichkeiten, z. B. bei der Auswahl der Übersetzungsmaschine.

Verbesserung der Selbsteinführung

Wenn Sie mehr Funktionalität benötigen, können Sie PDFMathTranslate verwenden:

  1. PDFMathTranslate installieren
    Folgen Sie den Anweisungen auf GitHub, um es zu installieren, mit Unterstützung für WebUI und weitere Übersetzungsdienste.
  2. Kombiniert mit BabelDOC
    PDFMathTranslate Version 1.9.3+ bietet experimentelle Unterstützung für BabelDOC für erweiterte Übersetzungsmöglichkeiten.

caveat

  • Der Online-Dienst ist bis zu 1.000 Seiten pro Monat kostenlos, danach wird er kostenpflichtig.
  • Für den lokalen Einsatz müssen Sie einen API-Schlüssel konfigurieren, z. B. den OpenAI-Schlüssel, den Sie auf der OpenAI-Website erhalten.
  • Derzeit ist es hauptsächlich für die Übersetzung vom Englischen ins Chinesische optimiert und unterstützt nur begrenzt andere Sprachen.
  • Große Dateien werden zur Verwendung empfohlen --max-pages-per-part Segmentierung.

 

Anwendungsszenario

  1. akademische Forschung
    Der Forscher erhielt das englische Papier und übersetzte es mit BabelDOC in eine zweisprachige Version, um das Lesen und Verstehen zu erleichtern.
  2. Übersetzung der technischen Dokumentation
    Der Entwickler übersetzt die englischen technischen Handbücher und behält den Code und die Diagramme zur direkten Verwendung bei seiner Arbeit.
  3. Pädagogisches Lernen
    Die Schüler übersetzen damit fremdsprachige Lehrbücher, lernen die Sprache und beherrschen gleichzeitig den Inhalt.

 

QA

  1. Welche Dateiformate werden unterstützt?
    Nur PDF wird unterstützt, andere Formate müssen erst in PDF konvertiert werden.
  2. Was ist der Unterschied zwischen Online-Diensten und lokaler Bereitstellung?
    Der Online-Dienst ist einfach und bietet 1.000 kostenlose Seiten pro Monat; für die lokale Bereitstellung ist eine Installation erforderlich, die jedoch mit weiteren Optionen angepasst werden kann.
  3. Was ist, wenn die Übersetzung nicht korrekt ist?
    Versuchen Sie, die Übersetzungsmaschine zu wechseln (z. B. von Bing zu OpenAI) oder das Modell anzupassen.
  4. Wie kann ich Code beisteuern?
    auschecken MITWIRKENDie Immersive Translate-Mitgliedschaft ist für aktive Beitragszahler verfügbar.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " BabelDOC: PDF-Dokumente werden in zweisprachige Open-Source-Tools übersetzt
de_DEDeutsch