Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜

PDFMathTranslate: ferramenta de tradução de IA que preserva a tipografia completa dos PDFs

Introdução geral

O PDFMathTranslate é uma ferramenta de código aberto que se concentra na tradução de artigos científicos e é capaz de traduzir o texto completo de documentos PDF e gerar versões bilíngues. Ele usa a tecnologia de IA para manter o layout completo do documento original, incluindo fórmulas, diagramas, índices e notas, e é compatível com Google, DeepL, Ollama, OpenAI e outros serviços de tradução. A ferramenta oferece linha de comando (CLI), interface gráfica (GUI), implantação do Docker e plug-in Zotero para atender às necessidades dos pesquisadores de tradução e leitura rápidas. Em março de 2025, o projeto recebeu mais de 17.000 estrelas no GitHub, tem uma comunidade ativa e continua a ser atualizado com novo suporte para modelos locais, arquivos não PDF/A e back-ends do BabelDOC.

PDFMathTranslate:学术论文翻译,保留排版格式、支持多种翻译服务-1


 

PDFMathTranslate:学术论文翻译,保留排版格式、支持多种翻译服务-1

Experiência on-line: https://pdf2zh.com/

 

Lista de funções

  • Tradução completa e bilinguismoTradução de documentos PDF para o idioma de destino, gerando traduções monolíngues e referências cruzadas bilíngues.
  • Preservação da tipografia originalFormatação consistente de fórmulas, gráficos, tabelas de conteúdo e notas, além de suporte para tipografia complexa, como o LaTeX.
  • Suporte a vários idiomasTradução de vários idiomas de origem, como o inglês, para vários idiomas de destino, como o chinês.
  • Serviços de tradução múltiplaIntegração com serviços como Google, DeepL, OpenAI, Ollama e suporte para Xinferência Modelos locais.
  • Uso em várias plataformasFornece ferramentas CLI, interface GUI, contêineres Docker e plug-ins Zotero.
  • Experiência on-line:: Experimente a funcionalidade principal sem instalação por meio de serviços públicos.
  • Personalização avançadaSuporte a opções avançadas, como tradução parcial, processamento multithread, diretórios de saída personalizados e muito mais.

 

Usando a Ajuda

Processo de instalação

O PDFMathTranslate oferece vários métodos de instalação para diferentes cenários. Veja a seguir as etapas detalhadas:

1. instalação do UV (linha de comando recomendada)

  • pré-requisitosÉ necessário o Python 3.10 a 3.12.
  • mover:
    1. Instale a ferramenta UV:
      pip install uv
      
    2. Instale o PDFMathTranslate:
      uv tool install --python 3.12 pdf2zh
      
    3. Verificar: Executar pdf2zh --versionSe o número da versão for exibido, o processo foi bem-sucedido.
  • Solução de problemas de redeSe não for possível fazer o download do modelo wybxc/DocLayout-YOLO-DocStructBench-onnxDefina as variáveis de ambiente:
    • CMD. set HF_ENDPOINT=https://hf-mirror.com
    • PowerShell. $env:HF_ENDPOINT = "https://hf-mirror.com"

2. executável no Windows (não é necessário um ambiente de programação)

  • mover:
    1. Visite a página de lançamento do GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
    2. Faça o download da versão mais recente pdf2zh-version-win64.zip.
    3. Descompacte e clique duas vezes pdf2zh.exe Em execução.
  • tomar nota deSe não funcionar, você precisará instalar a biblioteca de tempo de execução do VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).

3. interface gráfica do usuário (GUI)

  • pré-requisitosPython 3.10 a 3.12.
  • mover:
    1. Instale o pacote:
      pip install pdf2zh
      
    2. Inicie a GUI:
      pdf2zh -i
      
    3. acesso ao navegador http://localhost:7860/(Se não for ativado automaticamente, insira manualmente).
  • Solução de problemas de redeMétodo de montagem: Igual ao método de montagem UV.

4. implantação do Docker

  • pré-requisitosDocker: o Docker está instalado (https://www.docker.com/).
  • mover:
    1. Extraia a imagem e execute-a:
      docker pull byaidu/pdf2zh
      docker run -d -p 7860:7860 byaidu/pdf2zh
      
    2. acesso ao navegador http://localhost:7860/.
  • Programa alternativoSe o Docker Hub não estiver disponível, use os espelhos do GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate

5. plug-in do Zotero

  • mover:
  1. Acesse https://github.com/guaguastandup/zotero-pdf2zh para fazer o download do plug-in.
  2. Instale e configure os parâmetros de tradução no Zotero.

fluxo de trabalho

1. tradução da linha de comando

  • operação básica:
  1. Prepare o arquivo PDF (por exemplo paper.pdf).
  2. Executar comando:
    pdf2zh paper.pdf
    
  3. Saída: Gerar paper-mono.pdf(tradução) e paper-dual.pdf(bilíngue), salvar no diretório atual.
  • Opções avançadas:
  • Especifique o idioma:-li en -lo zh(Inglês para chinês).
  • Selecione o serviço:-s deepl(Use DeepL).
  • Tradução parcial:-p 1-5(páginas 1-5).
  • Caminho de saída:-o ./output.
    Exemplo:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
  • compatibilidade:: Arquivos não PDF/A mais --compatible Parâmetros:
pdf2zh paper.pdf --compatible

2. uso da interface GUI

  • procedimento:
  1. Inicie a GUI (pdf2zh -i).
  2. Carregar um arquivo: clique em "Select File" (Selecionar arquivo) para carregar um PDF local ou insira um link on-line (por exemplo, "Upload PDF"). http://arxiv.org/paper.pdf).
  3. Parâmetros de configuração:
    • Idioma de origem: Selecione "English" (Inglês).
    • Idioma de destino: Selecione "Chinês (simplificado)".
    • Serviço de tradução: escolha "Google" ou outro.
  4. Clique em "Translate" (Traduzir) e aguarde a conclusão.
  5. Download: Obtenha um arquivo PDF monolíngue ou bilíngue.
  • Funções em destaqueSuporte para tradução de links on-line e operação intuitiva.

3. serviços on-line do Docker

  • procedimento:
  1. Acesso após a execução do contêiner http://localhost:7860/.
  2. Igual à operação da GUI, carregue arquivos ou links, defina parâmetros e depois traduza.
  3. Função de compartilhamento: add --share para gerar um link público:
    pdf2zh -i --share
    

4. uso do plug-in do Zotero

  • procedimento:
  1. Selecione o documento PDF no Zotero.
  2. Clique no ícone do plug-in para definir o idioma e os serviços.
  3. O resultado é automaticamente anexado à entrada após a tradução.

Funções em destaque

  • Retenção da composição tipográfica: Uso DocLayout-YOLO Layout de análise de modelos para garantir o posicionamento preciso de fórmulas e gráficos.
  • Experiência de serviço on-lineVisite https://pdf2zh.com/ ou https://app.immersivetranslate.com/babel-doc/ (1.000 páginas gratuitas por mês) para usá-lo sem instalação.
  • Aceleração multi-threaded: Uso -t 4 Habilite 4 threads para arquivos grandes:
pdf2zh large_paper.pdf -t 4

advertência

  • Restrições de recursosA demonstração on-line tem recursos de computação limitados, portanto, não abuse deles.
  • Registro de atualização: março de 2025 Adicionado suporte à WebUI do BabelDOC (experimental) para aprimorar a experiência de tradução.
  • Feedback da comunidadeEnvie sugestões por meio do GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) ou do grupo do Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).

 

Pacote de integração não oficial do PDFMathTranslate

https://pan.quark.cn/s/e9e912c62c3a#/list/share

https://github.com/aidayang/PDFMathTranslate-OneClick

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " PDFMathTranslate: ferramenta de tradução de IA que preserva a tipografia completa dos PDFs
pt_BRPortuguês do Brasil