Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

BabelDOC: documentos PDF serão traduzidos para ferramentas bilíngues de código aberto

Introdução geral

O BabelDOC é uma ferramenta de código aberto projetada para traduzir documentos PDF em um formato bilíngue. Desenvolvida pela equipe funstory-ai e hospedada no GitHub, ela atende principalmente a usuários que precisam trabalhar com documentos em idiomas estrangeiros, como pesquisadores, estudantes e técnicos.O BabelDOC oferece suporte à tradução de PDFs em inglês para chinês, preservando o layout original, inclusive fórmulas matemáticas e tabelas. Os usuários podem usá-lo por meio de um serviço on-line, instrumentação de linha de comando (CLI) ou API Python. O serviço on-line é fornecido pela Immersive Translate e é gratuito para 1.000 páginas por mês, enquanto a auto-implantação pode ser obtida por meio do código-fonte ou do projeto PDFMathTranslate.

BabelDOC: documentos PDF serão traduzidos para ferramentas bilíngues de código aberto-1


 

Lista de funções

  • Traduza arquivos PDF em um formato bilíngue com o texto original e o traduzido exibidos lado a lado.
  • Mantém a tipografia original e oferece suporte à apresentação correta de fórmulas matemáticas, tabelas e imagens.
  • Fornece ferramentas de linha de comando (CLI) para suportar a tradução em lote de vários arquivos.
  • Fornecer API Python, fácil para os desenvolvedores incorporarem em outros programas.
  • Suporte para serviços on-line, tradução gratuita de 1.000 páginas por mês.
  • Há suporte para a autoimplantação, com a opção de executar localmente ou usar serviços de tradução adicionais em conjunto com o PDFMathTranslate.
  • Configurável com vários mecanismos de tradução, como OpenAI, Bing, etc.
  • Fornece gerenciamento de pacotes de recursos off-line, adequado para ambientes sem rede.

 

Usando a Ajuda

O BabelDOC pode ser usado de várias maneiras, incluindo serviços on-line e implantação local. Aqui está um guia detalhado para ajudá-lo a começar rapidamente.

Uso de serviços on-line

  1. Acesso a serviços on-line
    show (um ingresso) Tradução imersiva - BabelDOCEste é um serviço Beta.
  2. Carregamento de arquivos
    Clique no botão Upload e selecione o arquivo PDF a ser traduzido. O tamanho do arquivo e o número de páginas devem estar dentro da cota gratuita (1000 páginas/mês).
  3. Selecionar idioma
    A tradução de inglês para chinês é suportada por padrão. Após o upload, o sistema processará e gerará automaticamente um PDF bilíngue.
  4. Resultados do download
    Quando a tradução estiver concluída, clique no botão de download para obter o arquivo traduzido. O resultado manterá o texto original e a tradução exibidos lado a lado.

Processo de instalação local

O BabelDOC é compatível com a instalação a partir do PyPI ou do código-fonte, e é recomendado. uv Gerenciando o meio ambiente.

Instalação a partir do PyPI

  1. Instalação do Python e do uv
    Certifique-se de que seu sistema tenha o Python 3.12 ou posterior. Baixe e instale o uv e configure as variáveis de ambiente.
  2. Instalação do BabelDOC
    É executado no terminal:
uv tool install --python 3.12 BabelDOC
  1. Verificar a instalação
    Entrada:
babeldoc --help

Se uma mensagem de ajuda for exibida, a instalação foi bem-sucedida.

Instalação a partir da fonte

  1. projeto de clonagem
    É executado no terminal:
git clone https://github.com/funstory-ai/BabelDOC
cd BabelDOC
  1. Instalação de dependências
    fazer uso de uv Instale a dependência:
uv run pip install -r requirements.txt
  1. Verificar a instalação
    Em execução:
uv run babeldoc --help

A visualização da mensagem de ajuda indica sucesso.

Recursos off-line

Se precisar usá-lo off-line, você poderá gerenciar o pacote de recursos:

  1. Gerar kit de recursos
babeldoc --generate-offline-assets /path/to/output/dir

O arquivo zip gerado contém fontes e modelos.
2. Kit de recursos de recuperação

babeldoc --restore-offline-assets /path/to/offline_assets_package.zip

Os recursos serão extraídos para o caminho padrão ~/.cache/babeldoc/assets/.

Uso local

Uso da linha de comando

  1. Tradução de documentos individuais
    Suponha que haja um arquivo example.pdfTraduzido com OpenAI:
babeldoc --files example.pdf --openai --openai-model "gpt-4o-mini" --openai-api-key "你的API密钥"

O arquivo de saída é gerado automaticamente como example_translated.pdf.
2. Tradução de vários documentos
Manipula vários arquivos:

babeldoc --files example1.pdf --files example2.pdf --bing
  1. Especificar a página
    Traduza somente as páginas 1, 3-5:
babeldoc --files example.pdf --pages "1,3-5" --openai --openai-api-key "你的API密钥"
  1. Ajuste de idioma
    Tradução padrão de inglês para chinês, se outros idiomas forem necessários:
babeldoc --files example.pdf --lang-in "en" --lang-out "fr" --openai --openai-api-key "你的API密钥"

Uso da API do Python

  1. tradução básica
    Criação de documentos translate.py::
from babeldoc.main import TranslationConfig, translate_document
config = TranslationConfig(
files=["example.pdf"],
lang_in="en",
lang_out="zh",
translator="openai",
openai_api_key="你的API密钥",
openai_model="gpt-4o-mini"
)
translate_document(config)

estar em movimento python translate.py Pronto para traduzir.
2. Gerenciamento de recursos off-line

from pathlib import Path
from babeldoc.assets.assets import generate_offline_assets_package, restore_offline_assets_package
# 生成资源包
generate_offline_assets_package(Path("/path/to/output/dir"))
# 恢复资源包
restore_offline_assets_package(Path("/path/to/offline_assets_package.zip"))

Operação da função em destaque

  1. bilinguismo
    O PDF traduzido coloca o texto original e o texto traduzido lado a lado. Por exemplo, o inglês está à esquerda e o chinês está à direita para facilitar a comparação. Fórmulas como E=mc^2 O texto original será mantido, com explicações sobre a tradução ao lado.
  2. Suporte a documentação complexa
    Oferece suporte ao reconhecimento e à retenção de fórmulas matemáticas e tabelas. A tradução não destrói a estrutura original.
  3. Implementação flexível
    Os serviços on-line são simples e rápidos, e a autoimplantação oferece mais opções de personalização, como a seleção do mecanismo de tradução.

Aprimoramento da auto-implantação

Se precisar de mais funcionalidades, você pode usar o PDFMathTranslate:

  1. Instalar o PDFMathTranslate
    Siga as instruções do GitHub para instalá-lo, com suporte para WebUI e mais serviços de tradução.
  2. Combinado com o BabelDOC
    PDFMathTranslate versão 1.9.3+ suporte experimental para BabelDOC para recursos de tradução aprimorados.

advertência

  • O serviço on-line é gratuito para 1.000 páginas por mês, a partir do qual você terá que pagar.
  • Para a implementação local, você precisa configurar uma chave de API, como a chave OpenAI, que pode ser obtida no site da OpenAI.
  • Atualmente, ele é otimizado principalmente para a tradução de inglês para chinês, com suporte limitado para outros idiomas.
  • Recomenda-se o uso de arquivos grandes --max-pages-per-part Segmentação.

 

cenário do aplicativo

  1. pesquisa acadêmica
    O pesquisador recebeu o documento em inglês e o traduziu para uma versão bilíngue usando o BabelDOC para facilitar a leitura e a compreensão.
  2. Tradução de documentação técnica
    O desenvolvedor traduz os manuais técnicos em inglês, mantendo o código e os diagramas para uso direto em seu trabalho.
  3. Aprendizagem educacional
    Os alunos o utilizam para traduzir livros didáticos de idiomas estrangeiros, aprendendo o idioma e dominando o conteúdo ao mesmo tempo.

 

QA

  1. Quais formatos de arquivo são suportados?
    Somente PDF é compatível; outros formatos precisam ser convertidos para PDF primeiro.
  2. Qual é a diferença entre serviços on-line e implantação local?
    O serviço on-line é simples, com 1.000 páginas gratuitas por mês; as implantações locais exigem instalação, mas podem ser personalizadas com mais opções.
  3. E se a tradução não for precisa?
    Tente trocar os mecanismos de tradução (por exemplo, do Bing para o OpenAI) ou ajustar o modelo.
  4. Como faço para contribuir com o código?
    confira CONTRIBUINTEA associação à Immersive Translate está disponível para colaboradores ativos.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " BabelDOC: documentos PDF serão traduzidos para ferramentas bilíngues de código aberto
pt_BRPortuguês do Brasil