はじめに
PDFMathTranslateは、科学論文の翻訳に特化したオープンソースツールで、PDF文書の全文を翻訳し、対訳を生成することができます。AI技術を使用して、数式、図、目次、注を含む元の文書の完全なレイアウトを保持し、Google、DeepL、Ollama、OpenAIやその他の翻訳サービスをサポートしています。このツールは、コマンドライン(CLI)、グラフィカル・インターフェース(GUI)、Dockerデプロイ、Zoteroプラグインを提供し、研究者の迅速な翻訳と読解のニーズに応える。2025年3月現在、このプロジェクトはGitHubで17,000以上のスターを獲得し、活発なコミュニティを持ち、ローカルモデル、非PDF/Aファイル、BabelDOCバックエンドの新しいサポートで更新され続けています。
-
オンライン経験:https://pdf2zh.com/
機能一覧
- 完全翻訳とバイリンガルPDF 文書をターゲット言語に翻訳し、単言語翻訳とバイリンガル相互参照の両方を生成します。
- オリジナルのタイポグラフィーの保存数式、図表、目次、注釈の一貫した書式を保証し、LaTeXのような複雑な組版をサポートする。
- 多言語サポート英語など複数のソース言語から、中国語など複数のターゲット言語への翻訳。
- マルチ翻訳サービスGoogle、DeepL、OpenAI、Ollamaなどのサービスとの統合や、以下のようなサポートがあります。 シンファレンス 地元モデル。
- マルチプラットフォーム対応CLIツール、GUIインターフェース、Dockerコンテナ、Zoteroプラグインを提供します。
- オンライン体験:: 公開サービスを通じて、インストールなしでコア機能を試すことができます。
- 高度なカスタマイズ部分翻訳、マルチスレッド処理、カスタム出力ディレクトリなどの高度なオプションをサポートします。
ヘルプの使用
設置プロセス
PDFMathTranslateは、さまざまなシナリオのためのいくつかのインストール方法を提供しています。以下はその詳細な手順です:
1.UVのインストール(コマンドライン推奨)
- 前提条件Python 3.10から3.12が必要です。
- 動く:
- UVツールをインストールします:
pip install uv
- PDFMathTranslateをインストールします:
uv tool install --python 3.12 pdf2zh
- 検証:実行
pdf2zh --version
バージョン番号が表示されれば成功。
- UVツールをインストールします:
- ネットワークのトラブルシューティングダウンロードできない場合
wybxc/DocLayout-YOLO-DocStructBench-onnx
環境変数を設定する:- CMD。
set HF_ENDPOINT=https://hf-mirror.com
- PowerShell。
$env:HF_ENDPOINT = "https://hf-mirror.com"
- CMD。
2.Windows実行ファイル(プログラミング環境不要)
- 動く:
- GitHubのリリースページ(https://github.com/Byaidu/PDFMathTranslate/releases)をご覧ください。
- 最新のダウンロード
pdf2zh-version-win64.zip
. - 解凍してダブルクリック
pdf2zh.exe
走っている。
- 銘記する動作しない場合は、VC++ランタイム・ライブラリ(https://aka.ms/vs/17/release/vc_redist.x64.exe)をインストールする必要があります。
3.グラフィカル・ユーザー・インターフェース(GUI)
- 前提条件Python 3.10 から 3.12 へ。
- 動く:
- パッケージをインストールする:
pip install pdf2zh
- GUIを起動する:
pdf2zh -i
- ブラウザアクセス
http://localhost:7860/
(自動的にオンにならない場合は手動で入力)。
- パッケージをインストールする:
- ネットワークのトラブルシューティングUV マウント方式と同じ。
4.Dockerデプロイメント
- 前提条件: Dockerがインストールされています(https://www.docker.com/)。
- 動く:
- 画像を取り出して実行する:
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
- ブラウザアクセス
http://localhost:7860/
.
- 画像を取り出して実行する:
- 代替プログラムDocker Hubが利用できない場合は、GitHubのミラーを利用する:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate
5.Zoteroプラグイン
- 動く:
- https://github.com/guaguastandup/zotero-pdf2zh、プラグインをダウンロードしてください。
- Zoteroに翻訳パラメータをインストールし、設定する。
ワークフロー
1.コマンドライン翻訳
- 基本操作:
- PDFファイルを用意する(例
paper.pdf
). - コマンドを実行する:
pdf2zh paper.pdf
- 出力:生成
paper-mono.pdf
(翻訳)とpaper-dual.pdf
(対訳)、カレントディレクトリに保存。
- 高度なオプション:
- 言語を指定する:
-li en -lo zh
(英語から中国語へ)。 - サービスを選択する:
-s deepl
(DeepLを使用)。 - 部分的な翻訳:
-p 1-5
(1-5ページ)。 - 出力経路:
-o ./output
.
例
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
- 互換性:: 非PDF/Aファイルとプラス
--compatible
パラメーター
pdf2zh paper.pdf --compatible
2.GUIインターフェースの使用
- 手続き:
- GUIを起動する (
pdf2zh -i
). - ファイルのアップロード:「ファイルを選択」をクリックしてローカルのPDFをアップロードするか、オンラインのリンクを入力します(例:「PDFをアップロード」)。
http://arxiv.org/paper.pdf
). - 設定パラメータ:
- ソース言語:「English」を選択。
- 対象言語:「中国語(簡体字)」を選択してください。
- 翻訳サービス:「Google」またはその他を選択。
- 翻訳する」をクリックし、完了するまで待つ。
- ダウンロード: モノリンガルまたはバイリンガルのPDFファイルを取得します。
- 注目の機能オンラインリンク翻訳に対応し、直感的な操作が可能。
3.Dockerオンラインサービス
- 手続き:
- コンテナ実行後のアクセス
http://localhost:7860/
. - GUI操作と同じで、ファイルやリンクをアップロードし、パラメータを設定してから翻訳する。
- シェア機能:追加
--share
パラメータで公開リンクを生成する:pdf2zh -i --share
4.Zoteroプラグインの使用
- 手続き:
- ZoteroでPDF文書を選択する。
- 言語とサービスを設定するには、プラグインのアイコンをクリックしてください。
- 翻訳結果は、翻訳後に自動的にエントリーに追加される。
注目の機能
- 植字の保持使用
DocLayout-YOLO
数式やグラフを正確に配置するためのモデル解析レイアウト。 - オンライン・サービス体験: https://pdf2zh.com/ または https://app.immersivetranslate.com/babel-doc/ (毎月1,000ページ無料)をご覧ください。
- マルチスレッド・アクセラレーション使用
-t 4
大容量ファイル用に4スレッドを有効にする:
pdf2zh large_paper.pdf -t 4
ほら
- リソース制約オンライン・デモの計算リソースには限りがありますので、悪用しないでください。
- 更新ログ: 2025年3月 翻訳体験を向上させるため、BabelDOC WebUIのサポート(実験的)を追加しました。
- コミュニティ・フィードバックGitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) またはTelegramグループ (https://t.me/+Z9_SgnxmsmA5NzBl) からご提案ください。
PDFMathTranslate非公式統合パック
https://pan.quark.cn/s/e9e912c62c3a#/list/share
https://github.com/aidayang/PDFMathTranslate-OneClick