PDFMathTranslate : outil de traduction IA qui préserve la typographie complète des PDF

Introduction générale

PDFMathTranslate est un outil open source qui se concentre sur la traduction de documents scientifiques. Il est capable de traduire le texte intégral de documents PDF et de générer des versions bilingues. Il utilise la technologie de l'IA pour conserver la mise en page complète du document original, y compris les formules, les diagrammes, les tables des matières et les notes. Il prend en charge Google, DeepL, Ollama, OpenAI et d'autres services de traduction. L'outil offre une ligne de commande (CLI), une interface graphique (GUI), un déploiement Docker et un plugin Zotero pour répondre aux besoins des chercheurs en matière de traduction et de lecture rapides. En mars 2025, le projet a reçu plus de 17 000 étoiles sur GitHub, dispose d'une communauté active et continue d'être mis à jour avec un nouveau support pour les modèles locaux, les fichiers non-PDF/A et les backends BabelDOC.

PDFMathTranslate:保留PDF完整排版的AI翻译工具

 

PDFMathTranslate:保留PDF完整排版的AI翻译工具

Expérience en ligne : https://pdf2zh.com/

 

Liste des fonctions

  • Traduction intégrale et bilinguismeLes logiciels de traduction : Traduire des documents PDF dans la langue cible, en générant à la fois des traductions monolingues et des références croisées bilingues.
  • Préserver la typographie originaleLa mise en forme des formules, des graphiques, des tables des matières et des notes, ainsi que la prise en charge des compositions complexes telles que LaTeX, doivent être cohérentes.
  • Prise en charge multilingueTraduction de plusieurs langues sources, telles que l'anglais, vers plusieurs langues cibles, telles que le chinois.
  • Services de traduction multipleIntégration avec des services tels que Google, DeepL, OpenAI, Ollama, et prise en charge de Xinference Modèles locaux.
  • Utilisation multiplateformeZotero : fournit des outils CLI, une interface GUI, des conteneurs Docker et des plugins Zotero.
  • Expérience en ligneLes services publics permettent d'essayer les fonctionnalités de base sans les installer.
  • Personnalisation avancéeLes options avancées telles que la traduction partielle, le traitement multithread, les répertoires de sortie personnalisés et bien d'autres encore sont prises en charge.

 

Utiliser l'aide

Processus d'installation

PDFMathTranslate propose plusieurs méthodes d'installation pour différents scénarios. Vous trouverez ci-dessous les étapes détaillées :

1. installation de l'UV (ligne de commande recommandée)

  • conditions préalablesPython 3.10 à 3.12 est nécessaire.
  • déplacer:
    1. Installer l'outil UV :
      pip install uv
      
    2. Installer PDFMathTranslate :
      uv tool install --python 3.12 pdf2zh
      
    3. Vérifier : Exécuter pdf2zh --versionSi le numéro de version s'affiche, l'opération est réussie.
  • Dépannage du réseauSi le modèle ne peut pas être téléchargé wybxc/DocLayout-YOLO-DocStructBench-onnx, définir les variables d'environnement :
    • CMD. set HF_ENDPOINT=https://hf-mirror.com
    • PowerShell. $env:HF_ENDPOINT = "https://hf-mirror.com"

2. exécutable Windows (aucun environnement de programmation n'est requis)

  • déplacer:
    1. Visitez la page de publication GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
    2. Télécharger la dernière version pdf2zh-version-win64.zip.
    3. Dézippez et double-cliquez sur pdf2zh.exe La course à pied.
  • prendre noteSi cela ne fonctionne pas, vous devez installer la bibliothèque d'exécution VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).

3. l'interface utilisateur graphique (GUI)

  • conditions préalables: Python 3.10 à 3.12.
  • déplacer:
    1. Installer le paquet :
      pip install pdf2zh
      
    2. Démarrer l'interface graphique :
      pdf2zh -i
      
    3. accès au navigateur http://localhost:7860/(S'il n'est pas activé automatiquement, entrez manuellement).
  • Dépannage du réseauMéthode de montage : Identique à la méthode de montage UV.

4. déploiement de Docker

  • conditions préalablesDocker est installé (https://www.docker.com/).
  • déplacer:
    1. Tirer l'image et l'exécuter :
      docker pull byaidu/pdf2zh
      docker run -d -p 7860:7860 byaidu/pdf2zh
      
    2. accès au navigateur http://localhost:7860/.
  • Programme alternatifSi Docker Hub n'est pas disponible, utilisez les miroirs GitHub :
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate

5. plug-in Zotero

  • déplacer:
  1. Visitez https://github.com/guaguastandup/zotero-pdf2zh pour télécharger le plugin.
  2. Installer et configurer les paramètres de traduction dans Zotero.

flux de travail

1) Traduction en ligne de commande

  • fonctionnement de base:
  1. Préparer le fichier PDF (par ex. paper.pdf).
  2. Exécuter la commande :
    pdf2zh paper.pdf
    
  3. Sortie : Générer paper-mono.pdf(traduction) et paper-dual.pdf(bilingue), enregistrer dans le répertoire actuel.
  • Options avancées:
  • Spécifiez la langue :-li en -lo zh(de l'anglais au chinois).
  • Sélectionnez le service :-s deepl(Utiliser DeepL).
  • Traduction partielle :-p 1-5(pages 1-5).
  • Chemin de sortie :-o ./output.
    Exemple :
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
  • la compatibilité: : Fichiers non-PDF/A plus --compatible Paramètres :
pdf2zh paper.pdf --compatible

2. utilisation de l'interface GUI

  • procédure:
  1. Démarrer l'interface graphique (pdf2zh -i).
  2. Télécharger un fichier : cliquer sur "Sélectionner un fichier" pour télécharger un PDF local ou saisir un lien en ligne (par exemple, "Télécharger un PDF"). http://arxiv.org/paper.pdf).
  3. Paramètres de configuration :
    • Langue de la source : Sélectionnez "English".
    • Langue cible : Sélectionnez "Chinois (simplifié)".
    • Service de traduction : choisissez "Google" ou autre.
  4. Cliquez sur "Traduire" et attendez la fin de la traduction.
  5. Télécharger : Obtenir un fichier PDF monolingue ou bilingue.
  • Fonctions vedettesLes services de traduction en ligne et l'utilisation intuitive de l'application.

3. les services en ligne Docker

  • procédure:
  1. Accès après l'exécution du conteneur http://localhost:7860/.
  2. Même fonctionnement que l'interface graphique, téléchargement de fichiers ou de liens, définition des paramètres, puis traduction.
  3. Fonction de partage : ajouter --share pour générer un lien public :
    pdf2zh -i --share
    

4. utilisation du plug-in Zotero

  • procédure:
  1. Sélectionnez le document PDF dans Zotero.
  2. Cliquez sur l'icône du plugin pour définir la langue et les services.
  3. Le résultat est automatiquement ajouté à l'entrée après la traduction.

Fonctions vedettes

  • Conservation de la composition: Utilisation DocLayout-YOLO Modélisation de la mise en page pour garantir l'exactitude de l'emplacement des formules et des graphiques.
  • Expérience du service en ligne: Visitez https://pdf2zh.com/ ou https://app.immersivetranslate.com/babel-doc/ (1 000 pages gratuites par mois) pour l'utiliser sans installation.
  • Accélération multithread: Utilisation -t 4 Activer 4 threads pour les fichiers volumineux :
pdf2zh large_paper.pdf -t 4

mise en garde

  • Contraintes en matière de ressourcesLa démo en ligne dispose de ressources informatiques limitées, veuillez ne pas en abuser.
  • Journal des mises à jourMars 2025 Ajout de la prise en charge de BabelDOC WebUI (expérimental) pour améliorer l'expérience de traduction.
  • Retour d'information de la communautéLes suggestions : Soumettez vos suggestions via GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) ou le groupe Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).

 

PDFMathTranslate - Pack d'intégration non officiel

https://pan.quark.cn/s/e9e912c62c3a#/list/share

https://github.com/aidayang/PDFMathTranslate-OneClick

© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...