Introdução geral
O PDFMathTranslate é uma ferramenta de código aberto que se concentra na tradução de artigos científicos e é capaz de traduzir o texto completo de documentos PDF e gerar versões bilíngues. Ele usa a tecnologia de IA para manter o layout completo do documento original, incluindo fórmulas, diagramas, índices e notas, e é compatível com Google, DeepL, Ollama, OpenAI e outros serviços de tradução. A ferramenta oferece linha de comando (CLI), interface gráfica (GUI), implantação do Docker e plug-in Zotero para atender às necessidades dos pesquisadores de tradução e leitura rápidas. Em março de 2025, o projeto recebeu mais de 17.000 estrelas no GitHub, tem uma comunidade ativa e continua a ser atualizado com novo suporte para modelos locais, arquivos não PDF/A e back-ends do BabelDOC.
-
Experiência on-line: https://pdf2zh.com/
Lista de funções
- Tradução completa e bilinguismoTradução de documentos PDF para o idioma de destino, gerando traduções monolíngues e referências cruzadas bilíngues.
- Preservação da tipografia originalFormatação consistente de fórmulas, gráficos, tabelas de conteúdo e notas, além de suporte para tipografia complexa, como o LaTeX.
- Suporte a vários idiomasTradução de vários idiomas de origem, como o inglês, para vários idiomas de destino, como o chinês.
- Serviços de tradução múltiplaIntegração com serviços como Google, DeepL, OpenAI, Ollama e suporte para Xinferência Modelos locais.
- Uso em várias plataformasFornece ferramentas CLI, interface GUI, contêineres Docker e plug-ins Zotero.
- Experiência on-line:: Experimente a funcionalidade principal sem instalação por meio de serviços públicos.
- Personalização avançadaSuporte a opções avançadas, como tradução parcial, processamento multithread, diretórios de saída personalizados e muito mais.
Usando a Ajuda
Processo de instalação
O PDFMathTranslate oferece vários métodos de instalação para diferentes cenários. Veja a seguir as etapas detalhadas:
1. instalação do UV (linha de comando recomendada)
- pré-requisitosÉ necessário o Python 3.10 a 3.12.
- mover:
- Instale a ferramenta UV:
pip install uv
- Instale o PDFMathTranslate:
uv tool install --python 3.12 pdf2zh
- Verificar: Executar
pdf2zh --version
Se o número da versão for exibido, o processo foi bem-sucedido.
- Instale a ferramenta UV:
- Solução de problemas de redeSe não for possível fazer o download do modelo
wybxc/DocLayout-YOLO-DocStructBench-onnx
Defina as variáveis de ambiente:- CMD.
set HF_ENDPOINT=https://hf-mirror.com
- PowerShell.
$env:HF_ENDPOINT = "https://hf-mirror.com"
- CMD.
2. executável no Windows (não é necessário um ambiente de programação)
- mover:
- Visite a página de lançamento do GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
- Faça o download da versão mais recente
pdf2zh-version-win64.zip
. - Descompacte e clique duas vezes
pdf2zh.exe
Em execução.
- tomar nota deSe não funcionar, você precisará instalar a biblioteca de tempo de execução do VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).
3. interface gráfica do usuário (GUI)
- pré-requisitosPython 3.10 a 3.12.
- mover:
- Instale o pacote:
pip install pdf2zh
- Inicie a GUI:
pdf2zh -i
- acesso ao navegador
http://localhost:7860/
(Se não for ativado automaticamente, insira manualmente).
- Instale o pacote:
- Solução de problemas de redeMétodo de montagem: Igual ao método de montagem UV.
4. implantação do Docker
- pré-requisitosDocker: o Docker está instalado (https://www.docker.com/).
- mover:
- Extraia a imagem e execute-a:
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
- acesso ao navegador
http://localhost:7860/
.
- Extraia a imagem e execute-a:
- Programa alternativoSe o Docker Hub não estiver disponível, use os espelhos do GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate
5. plug-in do Zotero
- mover:
- Acesse https://github.com/guaguastandup/zotero-pdf2zh para fazer o download do plug-in.
- Instale e configure os parâmetros de tradução no Zotero.
fluxo de trabalho
1. tradução da linha de comando
- operação básica:
- Prepare o arquivo PDF (por exemplo
paper.pdf
). - Executar comando:
pdf2zh paper.pdf
- Saída: Gerar
paper-mono.pdf
(tradução) epaper-dual.pdf
(bilíngue), salvar no diretório atual.
- Opções avançadas:
- Especifique o idioma:
-li en -lo zh
(Inglês para chinês). - Selecione o serviço:
-s deepl
(Use DeepL). - Tradução parcial:
-p 1-5
(páginas 1-5). - Caminho de saída:
-o ./output
.
Exemplo:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
- compatibilidade:: Arquivos não PDF/A mais
--compatible
Parâmetros:
pdf2zh paper.pdf --compatible
2. uso da interface GUI
- procedimento:
- Inicie a GUI (
pdf2zh -i
). - Carregar um arquivo: clique em "Select File" (Selecionar arquivo) para carregar um PDF local ou insira um link on-line (por exemplo, "Upload PDF").
http://arxiv.org/paper.pdf
). - Parâmetros de configuração:
- Idioma de origem: Selecione "English" (Inglês).
- Idioma de destino: Selecione "Chinês (simplificado)".
- Serviço de tradução: escolha "Google" ou outro.
- Clique em "Translate" (Traduzir) e aguarde a conclusão.
- Download: Obtenha um arquivo PDF monolíngue ou bilíngue.
- Funções em destaqueSuporte para tradução de links on-line e operação intuitiva.
3. serviços on-line do Docker
- procedimento:
- Acesso após a execução do contêiner
http://localhost:7860/
. - Igual à operação da GUI, carregue arquivos ou links, defina parâmetros e depois traduza.
- Função de compartilhamento: add
--share
para gerar um link público:pdf2zh -i --share
4. uso do plug-in do Zotero
- procedimento:
- Selecione o documento PDF no Zotero.
- Clique no ícone do plug-in para definir o idioma e os serviços.
- O resultado é automaticamente anexado à entrada após a tradução.
Funções em destaque
- Retenção da composição tipográfica: Uso
DocLayout-YOLO
Layout de análise de modelos para garantir o posicionamento preciso de fórmulas e gráficos. - Experiência de serviço on-lineVisite https://pdf2zh.com/ ou https://app.immersivetranslate.com/babel-doc/ (1.000 páginas gratuitas por mês) para usá-lo sem instalação.
- Aceleração multi-threaded: Uso
-t 4
Habilite 4 threads para arquivos grandes:
pdf2zh large_paper.pdf -t 4
advertência
- Restrições de recursosA demonstração on-line tem recursos de computação limitados, portanto, não abuse deles.
- Registro de atualização: março de 2025 Adicionado suporte à WebUI do BabelDOC (experimental) para aprimorar a experiência de tradução.
- Feedback da comunidadeEnvie sugestões por meio do GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) ou do grupo do Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).
Pacote de integração não oficial do PDFMathTranslate
https://pan.quark.cn/s/e9e912c62c3a#/list/share
https://github.com/aidayang/PDFMathTranslate-OneClick