PDFMathTranslate: herramienta de traducción automática que conserva toda la tipografía de los PDF

Introducción general

PDFMathTranslate es una herramienta de código abierto que se centra en la traducción de documentos científicos, y es capaz de traducir el texto completo de los documentos PDF y generar versiones bilingües. Utiliza tecnología de IA para conservar el diseño completo del documento original , incluyendo fórmulas , diagramas , tablas de contenido y notas , soporta Google, DeepL, Ollama, OpenAI y otros servicios de traducción. La herramienta ofrece línea de comandos (CLI), interfaz gráfica (GUI), despliegue Docker y plugin Zotero para satisfacer las necesidades de los investigadores de traducción y lectura rápida. A fecha de marzo de 2025, el proyecto ha recibido más de 17.000 estrellas en GitHub, cuenta con una comunidad activa y sigue actualizándose con nuevo soporte para modelos locales, archivos no PDF/A y backends BabelDOC.

PDFMathTranslate:保留PDF完整排版的AI翻译工具

 

PDFMathTranslate:保留PDF完整排版的AI翻译工具

Experiencia en línea: https://pdf2zh.com/

 

Lista de funciones

  • Traducción completa y bilingüismo: Traduce documentos PDF al idioma de destino, generando tanto traducciones monolingües como referencias cruzadas bilingües.
  • Conservar la tipografía originalFormato coherente de fórmulas, gráficos, tablas de contenido y notas, y compatibilidad con formatos complejos como LaTeX.
  • Soporte multilingüeTraducción de varios idiomas de origen, como el inglés, a varios idiomas de destino, como el chino.
  • Servicios de traducción múltiple: Integración con servicios como Google, DeepL, OpenAI, Ollama, y compatibilidad con Xinferencia Modelos locales.
  • Uso multiplataforma: Proporciona herramientas CLI, interfaz GUI, contenedores Docker y plugins Zotero.
  • Experiencia en línea:: Pruebe la funcionalidad básica sin instalación a través de los servicios públicos.
  • Personalización avanzadaCompatibilidad con opciones avanzadas como traducción parcial, procesamiento multihilo, directorios de salida personalizados, etc.

 

Utilizar la ayuda

Proceso de instalación

PDFMathTranslate ofrece varios métodos de instalación para diferentes escenarios. A continuación se detallan los pasos:

1. Instalación de UV (se recomienda la línea de comandos)

  • requisitos previosSe requiere Python 3.10 a 3.12.
  • mover:
    1. Instala la herramienta UV:
      pip install uv
      
    2. Instale PDFMathTranslate:
      uv tool install --python 3.12 pdf2zh
      
    3. Verificar: Ejecutar pdf2zh --versionSi se muestra el número de versión, es correcto.
  • Solución de problemas de red: Si no se puede descargar el modelo wybxc/DocLayout-YOLO-DocStructBench-onnxConfigure las variables de entorno:
    • CMD. set HF_ENDPOINT=https://hf-mirror.com
    • PowerShell. $env:HF_ENDPOINT = "https://hf-mirror.com"

2. Ejecutable en Windows (no requiere entorno de programación)

  • mover:
    1. Visite la página de publicación de GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
    2. Descargar la última pdf2zh-version-win64.zip.
    3. Descomprimir y hacer doble clic pdf2zh.exe Corriendo.
  • tenga en cuentaSi no funciona, necesita instalar la biblioteca de ejecución VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).

3. Interfaz gráfica de usuario (GUI)

  • requisitos previos: Python 3.10 a 3.12.
  • mover:
    1. Instala el paquete:
      pip install pdf2zh
      
    2. Inicie la GUI:
      pdf2zh -i
      
    3. acceso al navegador http://localhost:7860/(Si no se activa automáticamente, introdúzcalo manualmente).
  • Solución de problemas de redIgual que el método de montaje UV.

4. Despliegue de Docker

  • requisitos previosDocker está instalado (https://www.docker.com/).
  • mover:
    1. Saca la imagen y ejecútala:
      docker pull byaidu/pdf2zh
      docker run -d -p 7860:7860 byaidu/pdf2zh
      
    2. acceso al navegador http://localhost:7860/.
  • Programa alternativoSi Docker Hub no está disponible, utilice las réplicas de GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate

5. Complemento Zotero

  • mover:
  1. Visite https://github.com/guaguastandup/zotero-pdf2zh para descargar el plugin.
  2. Instale y configure los parámetros de traducción en Zotero.

flujo de trabajo

1. Traducción desde la línea de comandos

  • funcionamiento básico:
  1. Prepare el archivo PDF (por ejemplo paper.pdf).
  2. Ejecutar comando:
    pdf2zh paper.pdf
    
  3. Salida: Generar paper-mono.pdf(traducción) y paper-dual.pdf(bilingüe), guardar en el directorio actual.
  • Opciones avanzadas:
  • Especifique el idioma:-li en -lo zh(De inglés a chino).
  • Seleccione Servicio:-s deepl(Utilice DeepL).
  • Traducción parcial:-p 1-5(páginas 1-5).
  • Ruta de salida:-o ./output.
    Ejemplo:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
  • compatibilidad:: Archivos no PDF/A plus --compatible Parámetros:
pdf2zh paper.pdf --compatible

2. Uso de la interfaz GUI

  • procedimiento:
  1. Inicie la GUI (pdf2zh -i).
  2. Cargar un archivo: Haga clic en "Seleccionar archivo" para cargar un PDF local o introduzca un enlace en línea (por ejemplo, "Cargar PDF"). http://arxiv.org/paper.pdf).
  3. Parámetros de configuración:
    • Idioma de origen: Seleccione "Inglés".
    • Idioma de destino: Seleccione "Chino (simplificado)".
    • Servicio de traducción: elija "Google" u otro.
  4. Haz clic en "Traducir" y espera a que termine.
  5. Descargar: Obtenga un archivo PDF monolingüe o bilingüe.
  • Funciones destacadas: Compatibilidad con la traducción de enlaces en línea y funcionamiento intuitivo.

3. Servicios en línea de Docker

  • procedimiento:
  1. Acceso después de ejecutar el contenedor http://localhost:7860/.
  2. Igual que la operación GUI, cargar archivos o enlaces, establecer parámetros y luego traducir.
  3. Función Compartir: añadir --share para generar un enlace público:
    pdf2zh -i --share
    

4. Uso del complemento Zotero

  • procedimiento:
  1. Seleccione el documento PDF en Zotero.
  2. Haga clic en el icono del plugin para configurar el idioma y los servicios.
  3. El resultado se añade automáticamente a la entrada después de la traducción.

Funciones destacadas

  • Conservación de la composición tipográfica: Uso DocLayout-YOLO Diseño de modelos de análisis sintáctico para garantizar la colocación precisa de fórmulas y gráficos.
  • Experiencia de servicio en línea: Visite https://pdf2zh.com/ o https://app.immersivetranslate.com/babel-doc/ (1.000 páginas gratuitas al mes) para utilizarlo sin instalación.
  • Aceleración multihilo: Uso -t 4 Habilitar 4 hilos para archivos grandes:
pdf2zh large_paper.pdf -t 4

advertencia

  • Limitación de recursosLa demo en línea dispone de recursos informáticos limitados, por lo que le rogamos que no abuse de ellos.
  • Registro de actualizaciónMarzo de 2025 Añadida compatibilidad con BabelDOC WebUI (experimental) para mejorar la experiencia de traducción.
  • Comentarios de la comunidadEnvía sugerencias a través de GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) o del grupo de Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).

 

PDFMathTranslate Paquete de integración no oficial

https://pan.quark.cn/s/e9e912c62c3a#/list/share

https://github.com/aidayang/PDFMathTranslate-OneClick

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...