PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF
Últimos recursos sobre IAActualizado hace 3 meses Círculo de intercambio de inteligencia artificial 17.2K 00
Introducción general
PDFMathTranslate es una herramienta de código abierto que se centra en la traducción de documentos científicos, y es capaz de traducir el texto completo de los documentos PDF y generar versiones bilingües. Utiliza tecnología de IA para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporta Google, DeepL, Ollama, OpenAI y otros servicios de traducción. La herramienta ofrece línea de comandos (CLI), interfaz gráfica (GUI), despliegue Docker y plugin Zotero para satisfacer las necesidades de los investigadores de traducción y lectura rápida. A fecha de marzo de 2025, el proyecto ha recibido más de 17.000 estrellas en GitHub, cuenta con una comunidad activa y sigue actualizándose con nuevo soporte para modelos locales, archivos no PDF/A y backends BabelDOC.

Experiencia en línea: https://pdf2zh.com/
Lista de funciones
- Traducción completa y bilingüismo: Traduce documentos PDF al idioma de destino, generando tanto traducciones monolingües como referencias cruzadas bilingües.
- Conservar la tipografía originalFormato coherente de fórmulas, gráficos, tablas de contenido y notas, y compatibilidad con formatos complejos como LaTeX.
- Soporte multilingüeTraducción de varios idiomas de origen, como el inglés, a varios idiomas de destino, como el chino.
- Servicios de traducción múltiple: Integración con servicios como Google, DeepL, OpenAI, Ollama, y compatibilidad con Xinferencia Modelos locales.
- Uso multiplataforma: Proporciona herramientas CLI, interfaz GUI, contenedores Docker y plugins Zotero.
- Experiencia en línea:: Pruebe la funcionalidad básica sin instalación a través de los servicios públicos.
- Personalización avanzadaCompatibilidad con opciones avanzadas como traducción parcial, procesamiento multihilo, directorios de salida personalizados, etc.
Utilizar la ayuda
Proceso de instalación
PDFMathTranslate ofrece varios métodos de instalación para diferentes escenarios. A continuación se detallan los pasos:
1. Instalación de UV (se recomienda la línea de comandos)
- requisitos previosSe requiere Python 3.10 a 3.12.
- mover:
- Instala la herramienta UV:
pip install uv
- Instale PDFMathTranslate:
uv tool install --python 3.12 pdf2zh
- Verificar: Ejecutar
pdf2zh --version
Si se muestra el número de versión, es correcto.
- Instala la herramienta UV:
- Solución de problemas de red: Si no se puede descargar el modelo
wybxc/DocLayout-YOLO-DocStructBench-onnx
Configure las variables de entorno:- CMD.
set HF_ENDPOINT=https://hf-mirror.com
- PowerShell.
$env:HF_ENDPOINT = "https://hf-mirror.com"
- CMD.
2. Ejecutable en Windows (no requiere entorno de programación)
- mover:
- Visite la página de publicación de GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
- Descargar la última
pdf2zh-version-win64.zip
. - Descomprimir y hacer doble clic
pdf2zh.exe
Corriendo.
- tenga en cuentaSi no funciona, necesita instalar la biblioteca de ejecución VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).
3. Interfaz gráfica de usuario (GUI)
- requisitos previos: Python 3.10 a 3.12.
- mover:
- Instala el paquete:
pip install pdf2zh
- Inicie la GUI:
pdf2zh -i
- acceso al navegador
http://localhost:7860/
(Si no se activa automáticamente, introdúzcalo manualmente).
- Instala el paquete:
- Solución de problemas de redIgual que el método de montaje UV.
4. Despliegue de Docker
- requisitos previosDocker está instalado (https://www.docker.com/).
- mover:
- Saca la imagen y ejecútala:
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
- acceso al navegador
http://localhost:7860/
.
- Saca la imagen y ejecútala:
- Programa alternativoSi Docker Hub no está disponible, utilice las réplicas de GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate
5. Complemento Zotero
- mover:
- Visite https://github.com/guaguastandup/zotero-pdf2zh para descargar el plugin.
- Instale y configure los parámetros de traducción en Zotero.
flujo de trabajo
1. Traducción desde la línea de comandos
- funcionamiento básico:
- Prepare el archivo PDF (por ejemplo
paper.pdf
). - Ejecutar comando:
pdf2zh paper.pdf
- Salida: Generar
paper-mono.pdf
(traducción) ypaper-dual.pdf
(bilingüe), guardar en el directorio actual.
- Opciones avanzadas:
- Especifique el idioma:
-li en -lo zh
(De inglés a chino). - Seleccione Servicio:
-s deepl
(Utilice DeepL). - Traducción parcial:
-p 1-5
(páginas 1-5). - Ruta de salida:
-o ./output
.
Ejemplo:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
- compatibilidad:: Archivos no PDF/A plus
--compatible
Parámetros:
pdf2zh paper.pdf --compatible
2. Uso de la interfaz GUI
- procedimiento:
- Inicie la GUI (
pdf2zh -i
). - Cargar un archivo: Haga clic en "Seleccionar archivo" para cargar un PDF local o introduzca un enlace en línea (por ejemplo, "Cargar PDF").
http://arxiv.org/paper.pdf
). - Parámetros de configuración:
- Idioma de origen: Seleccione "Inglés".
- Idioma de destino: Seleccione "Chino (simplificado)".
- Servicio de traducción: elija "Google" u otro.
- Haz clic en "Traducir" y espera a que termine.
- Descargar: Obtenga un archivo PDF monolingüe o bilingüe.
- Funciones destacadas: Compatibilidad con la traducción de enlaces en línea y funcionamiento intuitivo.
3. Servicios en línea de Docker
- procedimiento:
- Acceso después de ejecutar el contenedor
http://localhost:7860/
. - Igual que la operación GUI, cargar archivos o enlaces, establecer parámetros y luego traducir.
- Función Compartir: añadir
--share
para generar un enlace público:pdf2zh -i --share
4. Uso del complemento Zotero
- procedimiento:
- Seleccione el documento PDF en Zotero.
- Haga clic en el icono del plugin para configurar el idioma y los servicios.
- El resultado se añade automáticamente a la entrada después de la traducción.
Funciones destacadas
- Conservación de la composición tipográfica: Uso
DocLayout-YOLO
Diseño de modelos de análisis sintáctico para garantizar la colocación precisa de fórmulas y gráficos. - Experiencia de servicio en línea: Visite https://pdf2zh.com/ o https://app.immersivetranslate.com/babel-doc/ (1.000 páginas gratuitas al mes) para utilizarlo sin instalación.
- Aceleración multihilo: Uso
-t 4
Habilitar 4 hilos para archivos grandes:
pdf2zh large_paper.pdf -t 4
advertencia
- Limitación de recursosLa demo en línea dispone de recursos informáticos limitados, por lo que le rogamos que no abuse de ellos.
- Registro de actualizaciónMarzo de 2025 Añadida compatibilidad con BabelDOC WebUI (experimental) para mejorar la experiencia de traducción.
- Comentarios de la comunidadEnvía sugerencias a través de GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) o del grupo de Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).
PDFMathTranslate Paquete de integración no oficial
https://pan.quark.cn/s/e9e912c62c3a#/list/share
https://github.com/aidayang/PDFMathTranslate-OneClick
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...