综合介绍
Doc2XAPITranslate 是一个强大的文档全文翻译工具,专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器,包括DeepSeek、OpenAI、Ollama、Google翻译、DeepL和DeeLX,确保翻译的准确性和多样性。Doc2XAPITranslate 能够保留原文中的公式、表格和图片格式,提供高质量的翻译结果。用户可以通过简单的操作,将文档转换为Markdown或Word格式,方便后续编辑和使用。
功能列表
- 多翻译器支持:内置多种翻译器,如DeepSeek、OpenAI、Ollama、Google翻译、DeepL和DeeLX。
- 多线程翻译:支持多线程翻译,提高翻译速度和效率。
- 格式保留:保留原文中的公式、表格和图片格式,确保翻译结果的完整性。
- 多种输出格式:支持将翻译结果输出为Markdown或Word格式。
- 自定义翻译器:用户可以自定义翻译器,满足特定需求。
- GUI界面:提供友好的图形用户界面,方便用户操作。
- CLI支持:支持命令行界面操作,适合高级用户和自动化流程。
使用帮助
安装流程
- Windows:
- 下载并安装Pandoc。
- 在Powershell中输入以下命令安装:
shell
winget install --source winget --exact --id JohnMacFarlane.Pandoc
- MacOS:
- 在终端中运行以下命令安装Pandoc:
shell
brew install pandoc
- 在终端中运行以下命令安装Pandoc:
- Ubuntu/Debian:
- 在终端中运行以下命令安装Pandoc:
shell
sudo apt install pandoc
- 在终端中运行以下命令安装Pandoc:
- Arch/Manjaro:
- 在终端中运行以下命令安装Pandoc:
shell
sudo pacman -S pandoc-cli
- 在终端中运行以下命令安装Pandoc:
使用流程
- 运行GUI程序:
- 下载预编译好的程序,解压后运行。
- 导入Markdown或PDF文件,选择翻译器和翻译设置,点击开始翻译。
- 翻译完成后,选择输出格式(Markdown或Word),保存文件。
- 运行CLI程序:
- 克隆当前储存库:
shell
git clone https://github.com/NoEdgeAI/Doc2XAPITranslate.git
cd Doc2XAPITranslate
- 创建并激活虚拟环境:
shell
conda create -n translate python=3.12
conda activate translate
- 安装依赖:
shell
pip install -r requirements.txt
- 运行程序:
shell
python Main.py
- 克隆当前储存库:
自定义翻译器
- 定义翻译函数:
def translate(text: str, prev_text: str, next_text: str) -> str:
try:
return "This is an example!"
except Exception as e:
print(f"Error: {e}")
return text
- 使用自定义翻译器:
from MD_Translate import Process_MD
file_path = "path/to/your/md/file.md"
threads = 10
Process_MD(md_file=file_path, translate=translate, thread=threads)