PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF

堆友AI

Introducción general

PDFMathTranslate es una herramienta de código abierto que se centra en la traducción de documentos científicos, y es capaz de traducir el texto completo de los documentos PDF y generar versiones bilingües. Utiliza tecnología de IA para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporta Google, DeepL, Ollama, OpenAI y otros servicios de traducción. La herramienta ofrece línea de comandos (CLI), interfaz gráfica (GUI), despliegue Docker y plugin Zotero para satisfacer las necesidades de los investigadores de traducción y lectura rápida. A fecha de marzo de 2025, el proyecto ha recibido más de 17.000 estrellas en GitHub, cuenta con una comunidad activa y sigue actualizándose con nuevo soporte para modelos locales, archivos no PDF/A y backends BabelDOC.

PDFMathTranslate:保留PDF完整排版的AI翻译工具

 

PDFMathTranslate:保留PDF完整排版的AI翻译工具

Experiencia en línea: https://pdf2zh.com/

 

Lista de funciones

  • Traducción completa y bilingüismo: Traduce documentos PDF al idioma de destino, generando tanto traducciones monolingües como referencias cruzadas bilingües.
  • Conservar la tipografía originalFormato coherente de fórmulas, gráficos, tablas de contenido y notas, y compatibilidad con formatos complejos como LaTeX.
  • Soporte multilingüeTraducción de varios idiomas de origen, como el inglés, a varios idiomas de destino, como el chino.
  • Servicios de traducción múltiple: Integración con servicios como Google, DeepL, OpenAI, Ollama, y compatibilidad con Xinferencia Modelos locales.
  • Uso multiplataforma: Proporciona herramientas CLI, interfaz GUI, contenedores Docker y plugins Zotero.
  • Experiencia en línea:: Pruebe la funcionalidad básica sin instalación a través de los servicios públicos.
  • Personalización avanzadaCompatibilidad con opciones avanzadas como traducción parcial, procesamiento multihilo, directorios de salida personalizados, etc.

 

Utilizar la ayuda

Proceso de instalación

PDFMathTranslate ofrece varios métodos de instalación para diferentes escenarios. A continuación se detallan los pasos:

1. Instalación de UV (se recomienda la línea de comandos)

  • requisitos previosSe requiere Python 3.10 a 3.12.
  • mover:
    1. Instala la herramienta UV:
      pip install uv
      
    2. Instale PDFMathTranslate:
      uv tool install --python 3.12 pdf2zh
      
    3. Verificar: Ejecutar pdf2zh --versionSi se muestra el número de versión, es correcto.
  • Solución de problemas de red: Si no se puede descargar el modelo wybxc/DocLayout-YOLO-DocStructBench-onnxConfigure las variables de entorno:
    • CMD. set HF_ENDPOINT=https://hf-mirror.com
    • PowerShell. $env:HF_ENDPOINT = "https://hf-mirror.com"

2. Ejecutable en Windows (no requiere entorno de programación)

  • mover:
    1. Visite la página de publicación de GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
    2. Descargar la última pdf2zh-version-win64.zip.
    3. Descomprimir y hacer doble clic pdf2zh.exe Corriendo.
  • tenga en cuentaSi no funciona, necesita instalar la biblioteca de ejecución VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).

3. Interfaz gráfica de usuario (GUI)

  • requisitos previos: Python 3.10 a 3.12.
  • mover:
    1. Instala el paquete:
      pip install pdf2zh
      
    2. Inicie la GUI:
      pdf2zh -i
      
    3. acceso al navegador http://localhost:7860/(Si no se activa automáticamente, introdúzcalo manualmente).
  • Solución de problemas de redIgual que el método de montaje UV.

4. Despliegue de Docker

  • requisitos previosDocker está instalado (https://www.docker.com/).
  • mover:
    1. Saca la imagen y ejecútala:
      docker pull byaidu/pdf2zh
      docker run -d -p 7860:7860 byaidu/pdf2zh
      
    2. acceso al navegador http://localhost:7860/.
  • Programa alternativoSi Docker Hub no está disponible, utilice las réplicas de GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate

5. Complemento Zotero

  • mover:
  1. Visite https://github.com/guaguastandup/zotero-pdf2zh para descargar el plugin.
  2. Instale y configure los parámetros de traducción en Zotero.

flujo de trabajo

1. Traducción desde la línea de comandos

  • funcionamiento básico:
  1. Prepare el archivo PDF (por ejemplo paper.pdf).
  2. Ejecutar comando:
    pdf2zh paper.pdf
    
  3. Salida: Generar paper-mono.pdf(traducción) y paper-dual.pdf(bilingüe), guardar en el directorio actual.
  • Opciones avanzadas:
  • Especifique el idioma:-li en -lo zh(De inglés a chino).
  • Seleccione Servicio:-s deepl(Utilice DeepL).
  • Traducción parcial:-p 1-5(páginas 1-5).
  • Ruta de salida:-o ./output.
    Ejemplo:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
  • compatibilidad:: Archivos no PDF/A plus --compatible Parámetros:
pdf2zh paper.pdf --compatible

2. Uso de la interfaz GUI

  • procedimiento:
  1. Inicie la GUI (pdf2zh -i).
  2. Cargar un archivo: Haga clic en "Seleccionar archivo" para cargar un PDF local o introduzca un enlace en línea (por ejemplo, "Cargar PDF"). http://arxiv.org/paper.pdf).
  3. Parámetros de configuración:
    • Idioma de origen: Seleccione "Inglés".
    • Idioma de destino: Seleccione "Chino (simplificado)".
    • Servicio de traducción: elija "Google" u otro.
  4. Haz clic en "Traducir" y espera a que termine.
  5. Descargar: Obtenga un archivo PDF monolingüe o bilingüe.
  • Funciones destacadas: Compatibilidad con la traducción de enlaces en línea y funcionamiento intuitivo.

3. Servicios en línea de Docker

  • procedimiento:
  1. Acceso después de ejecutar el contenedor http://localhost:7860/.
  2. Igual que la operación GUI, cargar archivos o enlaces, establecer parámetros y luego traducir.
  3. Función Compartir: añadir --share para generar un enlace público:
    pdf2zh -i --share
    

4. Uso del complemento Zotero

  • procedimiento:
  1. Seleccione el documento PDF en Zotero.
  2. Haga clic en el icono del plugin para configurar el idioma y los servicios.
  3. El resultado se añade automáticamente a la entrada después de la traducción.

Funciones destacadas

  • Conservación de la composición tipográfica: Uso DocLayout-YOLO Diseño de modelos de análisis sintáctico para garantizar la colocación precisa de fórmulas y gráficos.
  • Experiencia de servicio en línea: Visite https://pdf2zh.com/ o https://app.immersivetranslate.com/babel-doc/ (1.000 páginas gratuitas al mes) para utilizarlo sin instalación.
  • Aceleración multihilo: Uso -t 4 Habilitar 4 hilos para archivos grandes:
pdf2zh large_paper.pdf -t 4

advertencia

  • Limitación de recursosLa demo en línea dispone de recursos informáticos limitados, por lo que le rogamos que no abuse de ellos.
  • Registro de actualizaciónMarzo de 2025 Añadida compatibilidad con BabelDOC WebUI (experimental) para mejorar la experiencia de traducción.
  • Comentarios de la comunidadEnvía sugerencias a través de GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) o del grupo de Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).

 

PDFMathTranslate Paquete de integración no oficial

https://pan.quark.cn/s/e9e912c62c3a#/list/share

https://github.com/aidayang/PDFMathTranslate-OneClick

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...