Introdução geral
O BabelDOC é uma ferramenta de código aberto projetada para traduzir documentos PDF em um formato bilíngue. Desenvolvida pela equipe funstory-ai e hospedada no GitHub, ela atende principalmente a usuários que precisam trabalhar com documentos em idiomas estrangeiros, como pesquisadores, estudantes e técnicos.O BabelDOC oferece suporte à tradução de PDFs em inglês para chinês, preservando o layout original, inclusive fórmulas matemáticas e tabelas. Os usuários podem usá-lo por meio de um serviço on-line, instrumentação de linha de comando (CLI) ou API Python. O serviço on-line é fornecido pela Immersive Translate e é gratuito para 1.000 páginas por mês, enquanto a auto-implantação pode ser obtida por meio do código-fonte ou do projeto PDFMathTranslate.
Lista de funções
- Traduza arquivos PDF em um formato bilíngue com o texto original e o traduzido exibidos lado a lado.
- Mantém a tipografia original e oferece suporte à apresentação correta de fórmulas matemáticas, tabelas e imagens.
- Fornece ferramentas de linha de comando (CLI) para suportar a tradução em lote de vários arquivos.
- Fornecer API Python, fácil para os desenvolvedores incorporarem em outros programas.
- Suporte para serviços on-line, tradução gratuita de 1.000 páginas por mês.
- Há suporte para a autoimplantação, com a opção de executar localmente ou usar serviços de tradução adicionais em conjunto com o PDFMathTranslate.
- Configurável com vários mecanismos de tradução, como OpenAI, Bing, etc.
- Fornece gerenciamento de pacotes de recursos off-line, adequado para ambientes sem rede.
Usando a Ajuda
O BabelDOC pode ser usado de várias maneiras, incluindo serviços on-line e implantação local. Aqui está um guia detalhado para ajudá-lo a começar rapidamente.
Uso de serviços on-line
- Acesso a serviços on-line
show (um ingresso) Tradução imersiva - BabelDOCEste é um serviço Beta. - Carregamento de arquivos
Clique no botão Upload e selecione o arquivo PDF a ser traduzido. O tamanho do arquivo e o número de páginas devem estar dentro da cota gratuita (1000 páginas/mês). - Selecionar idioma
A tradução de inglês para chinês é suportada por padrão. Após o upload, o sistema processará e gerará automaticamente um PDF bilíngue. - Resultados do download
Quando a tradução estiver concluída, clique no botão de download para obter o arquivo traduzido. O resultado manterá o texto original e a tradução exibidos lado a lado.
Processo de instalação local
O BabelDOC é compatível com a instalação a partir do PyPI ou do código-fonte, e é recomendado. uv
Gerenciando o meio ambiente.
Instalação a partir do PyPI
- Instalação do Python e do uv
Certifique-se de que seu sistema tenha o Python 3.12 ou posterior. Baixe e instale o uv e configure as variáveis de ambiente. - Instalação do BabelDOC
É executado no terminal:
uv tool install --python 3.12 BabelDOC
- Verificar a instalação
Entrada:
babeldoc --help
Se uma mensagem de ajuda for exibida, a instalação foi bem-sucedida.
Instalação a partir da fonte
- projeto de clonagem
É executado no terminal:
git clone https://github.com/funstory-ai/BabelDOC
cd BabelDOC
- Instalação de dependências
fazer uso deuv
Instale a dependência:
uv run pip install -r requirements.txt
- Verificar a instalação
Em execução:
uv run babeldoc --help
A visualização da mensagem de ajuda indica sucesso.
Recursos off-line
Se precisar usá-lo off-line, você poderá gerenciar o pacote de recursos:
- Gerar kit de recursos
babeldoc --generate-offline-assets /path/to/output/dir
O arquivo zip gerado contém fontes e modelos.
2. Kit de recursos de recuperação
babeldoc --restore-offline-assets /path/to/offline_assets_package.zip
Os recursos serão extraídos para o caminho padrão ~/.cache/babeldoc/assets/
.
Uso local
Uso da linha de comando
- Tradução de documentos individuais
Suponha que haja um arquivoexample.pdf
Traduzido com OpenAI:
babeldoc --files example.pdf --openai --openai-model "gpt-4o-mini" --openai-api-key "你的API密钥"
O arquivo de saída é gerado automaticamente como example_translated.pdf
.
2. Tradução de vários documentos
Manipula vários arquivos:
babeldoc --files example1.pdf --files example2.pdf --bing
- Especificar a página
Traduza somente as páginas 1, 3-5:
babeldoc --files example.pdf --pages "1,3-5" --openai --openai-api-key "你的API密钥"
- Ajuste de idioma
Tradução padrão de inglês para chinês, se outros idiomas forem necessários:
babeldoc --files example.pdf --lang-in "en" --lang-out "fr" --openai --openai-api-key "你的API密钥"
Uso da API do Python
- tradução básica
Criação de documentostranslate.py
::
from babeldoc.main import TranslationConfig, translate_document
config = TranslationConfig(
files=["example.pdf"],
lang_in="en",
lang_out="zh",
translator="openai",
openai_api_key="你的API密钥",
openai_model="gpt-4o-mini"
)
translate_document(config)
estar em movimento python translate.py
Pronto para traduzir.
2. Gerenciamento de recursos off-line
from pathlib import Path
from babeldoc.assets.assets import generate_offline_assets_package, restore_offline_assets_package
# 生成资源包
generate_offline_assets_package(Path("/path/to/output/dir"))
# 恢复资源包
restore_offline_assets_package(Path("/path/to/offline_assets_package.zip"))
Operação da função em destaque
- bilinguismo
O PDF traduzido coloca o texto original e o texto traduzido lado a lado. Por exemplo, o inglês está à esquerda e o chinês está à direita para facilitar a comparação. Fórmulas comoE=mc^2
O texto original será mantido, com explicações sobre a tradução ao lado. - Suporte a documentação complexa
Oferece suporte ao reconhecimento e à retenção de fórmulas matemáticas e tabelas. A tradução não destrói a estrutura original. - Implementação flexível
Os serviços on-line são simples e rápidos, e a autoimplantação oferece mais opções de personalização, como a seleção do mecanismo de tradução.
Aprimoramento da auto-implantação
Se precisar de mais funcionalidades, você pode usar o PDFMathTranslate:
- Instalar o PDFMathTranslate
Siga as instruções do GitHub para instalá-lo, com suporte para WebUI e mais serviços de tradução. - Combinado com o BabelDOC
PDFMathTranslate versão 1.9.3+ suporte experimental para BabelDOC para recursos de tradução aprimorados.
advertência
- O serviço on-line é gratuito para 1.000 páginas por mês, a partir do qual você terá que pagar.
- Para a implementação local, você precisa configurar uma chave de API, como a chave OpenAI, que pode ser obtida no site da OpenAI.
- Atualmente, ele é otimizado principalmente para a tradução de inglês para chinês, com suporte limitado para outros idiomas.
- Recomenda-se o uso de arquivos grandes
--max-pages-per-part
Segmentação.
cenário do aplicativo
- pesquisa acadêmica
O pesquisador recebeu o documento em inglês e o traduziu para uma versão bilíngue usando o BabelDOC para facilitar a leitura e a compreensão. - Tradução de documentação técnica
O desenvolvedor traduz os manuais técnicos em inglês, mantendo o código e os diagramas para uso direto em seu trabalho. - Aprendizagem educacional
Os alunos o utilizam para traduzir livros didáticos de idiomas estrangeiros, aprendendo o idioma e dominando o conteúdo ao mesmo tempo.
QA
- Quais formatos de arquivo são suportados?
Somente PDF é compatível; outros formatos precisam ser convertidos para PDF primeiro. - Qual é a diferença entre serviços on-line e implantação local?
O serviço on-line é simples, com 1.000 páginas gratuitas por mês; as implantações locais exigem instalação, mas podem ser personalizadas com mais opções. - E se a tradução não for precisa?
Tente trocar os mecanismos de tradução (por exemplo, do Bing para o OpenAI) ou ajustar o modelo. - Como faço para contribuir com o código?
confira CONTRIBUINTEA associação à Immersive Translate está disponível para colaboradores ativos.