PDFMathTranslate : outil de traduction IA qui préserve la typographie complète des PDF
Introduction générale
PDFMathTranslate est un outil open source qui se concentre sur la traduction de documents scientifiques. Il est capable de traduire le texte intégral de documents PDF et de générer des versions bilingues. Il utilise la technologie de l'IA pour conserver la mise en page complète du document original, y compris les formules, les diagrammes, les tables des matières et les notes. Il prend en charge Google, DeepL, Ollama, OpenAI et d'autres services de traduction. L'outil offre une ligne de commande (CLI), une interface graphique (GUI), un déploiement Docker et un plugin Zotero pour répondre aux besoins des chercheurs en matière de traduction et de lecture rapides. En mars 2025, le projet a reçu plus de 17 000 étoiles sur GitHub, dispose d'une communauté active et continue d'être mis à jour avec un nouveau support pour les modèles locaux, les fichiers non-PDF/A et les backends BabelDOC.

Expérience en ligne : https://pdf2zh.com/
Liste des fonctions
- Traduction intégrale et bilinguismeLes logiciels de traduction : Traduire des documents PDF dans la langue cible, en générant à la fois des traductions monolingues et des références croisées bilingues.
- Préserver la typographie originaleLa mise en forme des formules, des graphiques, des tables des matières et des notes, ainsi que la prise en charge des compositions complexes telles que LaTeX, doivent être cohérentes.
- Prise en charge multilingueTraduction de plusieurs langues sources, telles que l'anglais, vers plusieurs langues cibles, telles que le chinois.
- Services de traduction multipleIntégration avec des services tels que Google, DeepL, OpenAI, Ollama, et prise en charge de Xinference Modèles locaux.
- Utilisation multiplateformeZotero : fournit des outils CLI, une interface GUI, des conteneurs Docker et des plugins Zotero.
- Expérience en ligneLes services publics permettent d'essayer les fonctionnalités de base sans les installer.
- Personnalisation avancéeLes options avancées telles que la traduction partielle, le traitement multithread, les répertoires de sortie personnalisés et bien d'autres encore sont prises en charge.
Utiliser l'aide
Processus d'installation
PDFMathTranslate propose plusieurs méthodes d'installation pour différents scénarios. Vous trouverez ci-dessous les étapes détaillées :
1. installation de l'UV (ligne de commande recommandée)
- conditions préalablesPython 3.10 à 3.12 est nécessaire.
- déplacer:
- Installer l'outil UV :
pip install uv
- Installer PDFMathTranslate :
uv tool install --python 3.12 pdf2zh
- Vérifier : Exécuter
pdf2zh --version
Si le numéro de version s'affiche, l'opération est réussie.
- Installer l'outil UV :
- Dépannage du réseauSi le modèle ne peut pas être téléchargé
wybxc/DocLayout-YOLO-DocStructBench-onnx
, définir les variables d'environnement :- CMD.
set HF_ENDPOINT=https://hf-mirror.com
- PowerShell.
$env:HF_ENDPOINT = "https://hf-mirror.com"
- CMD.
2. exécutable Windows (aucun environnement de programmation n'est requis)
- déplacer:
- Visitez la page de publication GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
- Télécharger la dernière version
pdf2zh-version-win64.zip
. - Dézippez et double-cliquez sur
pdf2zh.exe
La course à pied.
- prendre noteSi cela ne fonctionne pas, vous devez installer la bibliothèque d'exécution VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).
3. l'interface utilisateur graphique (GUI)
- conditions préalables: Python 3.10 à 3.12.
- déplacer:
- Installer le paquet :
pip install pdf2zh
- Démarrer l'interface graphique :
pdf2zh -i
- accès au navigateur
http://localhost:7860/
(S'il n'est pas activé automatiquement, entrez manuellement).
- Installer le paquet :
- Dépannage du réseauMéthode de montage : Identique à la méthode de montage UV.
4. déploiement de Docker
- conditions préalablesDocker est installé (https://www.docker.com/).
- déplacer:
- Tirer l'image et l'exécuter :
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
- accès au navigateur
http://localhost:7860/
.
- Tirer l'image et l'exécuter :
- Programme alternatifSi Docker Hub n'est pas disponible, utilisez les miroirs GitHub :
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate
5. plug-in Zotero
- déplacer:
- Visitez https://github.com/guaguastandup/zotero-pdf2zh pour télécharger le plugin.
- Installer et configurer les paramètres de traduction dans Zotero.
flux de travail
1) Traduction en ligne de commande
- fonctionnement de base:
- Préparer le fichier PDF (par ex.
paper.pdf
). - Exécuter la commande :
pdf2zh paper.pdf
- Sortie : Générer
paper-mono.pdf
(traduction) etpaper-dual.pdf
(bilingue), enregistrer dans le répertoire actuel.
- Options avancées:
- Spécifiez la langue :
-li en -lo zh
(de l'anglais au chinois). - Sélectionnez le service :
-s deepl
(Utiliser DeepL). - Traduction partielle :
-p 1-5
(pages 1-5). - Chemin de sortie :
-o ./output
.
Exemple :
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
- la compatibilité: : Fichiers non-PDF/A plus
--compatible
Paramètres :
pdf2zh paper.pdf --compatible
2. utilisation de l'interface GUI
- procédure:
- Démarrer l'interface graphique (
pdf2zh -i
). - Télécharger un fichier : cliquer sur "Sélectionner un fichier" pour télécharger un PDF local ou saisir un lien en ligne (par exemple, "Télécharger un PDF").
http://arxiv.org/paper.pdf
). - Paramètres de configuration :
- Langue de la source : Sélectionnez "English".
- Langue cible : Sélectionnez "Chinois (simplifié)".
- Service de traduction : choisissez "Google" ou autre.
- Cliquez sur "Traduire" et attendez la fin de la traduction.
- Télécharger : Obtenir un fichier PDF monolingue ou bilingue.
- Fonctions vedettesLes services de traduction en ligne et l'utilisation intuitive de l'application.
3. les services en ligne Docker
- procédure:
- Accès après l'exécution du conteneur
http://localhost:7860/
. - Même fonctionnement que l'interface graphique, téléchargement de fichiers ou de liens, définition des paramètres, puis traduction.
- Fonction de partage : ajouter
--share
pour générer un lien public :pdf2zh -i --share
4. utilisation du plug-in Zotero
- procédure:
- Sélectionnez le document PDF dans Zotero.
- Cliquez sur l'icône du plugin pour définir la langue et les services.
- Le résultat est automatiquement ajouté à l'entrée après la traduction.
Fonctions vedettes
- Conservation de la composition: Utilisation
DocLayout-YOLO
Modélisation de la mise en page pour garantir l'exactitude de l'emplacement des formules et des graphiques. - Expérience du service en ligne: Visitez https://pdf2zh.com/ ou https://app.immersivetranslate.com/babel-doc/ (1 000 pages gratuites par mois) pour l'utiliser sans installation.
- Accélération multithread: Utilisation
-t 4
Activer 4 threads pour les fichiers volumineux :
pdf2zh large_paper.pdf -t 4
mise en garde
- Contraintes en matière de ressourcesLa démo en ligne dispose de ressources informatiques limitées, veuillez ne pas en abuser.
- Journal des mises à jourMars 2025 Ajout de la prise en charge de BabelDOC WebUI (expérimental) pour améliorer l'expérience de traduction.
- Retour d'information de la communautéLes suggestions : Soumettez vos suggestions via GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) ou le groupe Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).
PDFMathTranslate - Pack d'intégration non officiel
https://pan.quark.cn/s/e9e912c62c3a#/list/share
https://github.com/aidayang/PDFMathTranslate-OneClick
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...