PDFMathTranslate: инструмент перевода с помощью искусственного интеллекта, сохраняющий полную типографику PDF-файлов
Общее введение
PDFMathTranslate - это инструмент с открытым исходным кодом, который ориентирован на перевод научных статей и способен полностью переводить PDF-документы и создавать двуязычные версии. Он использует технологию искусственного интеллекта для сохранения полного макета оригинального документа, включая формулы, диаграммы, оглавления и примечания, поддерживает Google, DeepL, Ollama, OpenAI и другие сервисы перевода. Инструмент предлагает командную строку (CLI), графический интерфейс (GUI), развертывание в Docker и плагин Zotero для удовлетворения потребностей исследователей в быстром переводе и чтении. По состоянию на март 2025 года проект получил более 17 000 звезд на GitHub, имеет активное сообщество и продолжает обновляться за счет новой поддержки локальных моделей, файлов, отличных от PDF/A, и бэкендов BabelDOC.

Опыт работы в Интернете: https://pdf2zh.com/
Список функций
- Полный перевод и двуязычие: Перевод PDF-документов на целевой язык с созданием как одноязычных переводов, так и двуязычных перекрестных ссылок.
- Сохранение оригинальной типографики: Обеспечение последовательного форматирования формул, диаграмм, оглавлений и примечаний, а также поддержка сложных версий, таких как LaTeX.
- Поддержка нескольких языковПеревод с нескольких исходных языков, например английского, на несколько целевых языков, например китайский.
- Услуги мультиперевода: Интеграция с такими сервисами, как Google, DeepL, OpenAI, Ollama, и поддержка Xinference Местные модели.
- Использование нескольких платформ: Предоставляет инструменты CLI, GUI-интерфейс, контейнеры Docker и плагины Zotero.
- Опыт работы в Интернете:: Попробуйте основные функции без установки через публичные сервисы.
- Расширенная настройка: Поддержка дополнительных опций, таких как частичный перевод, многопоточная обработка, пользовательские выходные каталоги и многое другое.
Использование помощи
Процесс установки
PDFMathTranslate предлагает несколько способов установки для различных сценариев. Ниже приведены подробные шаги:
1. Установка ультрафиолетового излучения (рекомендуется использовать командную строку)
- предварительные условияТребуется версия Python 3.10 - 3.12.
- перейти:
- Установите инструмент UV:
pip install uv
- Установите программу PDFMathTranslate:
uv tool install --python 3.12 pdf2zh
- Проверить: Выполнить
pdf2zh --version
Если номер версии отображается, это означает, что работа выполнена успешно.
- Установите инструмент UV:
- Поиск и устранение неисправностей в сети: Если модель не удается загрузить
wybxc/DocLayout-YOLO-DocStructBench-onnx
Установите переменные окружения:- CMD.
set HF_ENDPOINT=https://hf-mirror.com
- PowerShell.
$env:HF_ENDPOINT = "https://hf-mirror.com"
- CMD.
2. исполняемый файл для Windows (среда программирования не требуется)
- перейти:
- Посетите страницу выпуска на GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
- Загрузите последнюю версию
pdf2zh-version-win64.zip
. - Распакуйте и дважды щелкните
pdf2zh.exe
Бег.
- принимать к сведению: Если это не работает, вам необходимо установить библиотеку времени выполнения VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).
3. графический интерфейс пользователя (GUI)
- предварительные условия: Python 3.10 - 3.12.
- перейти:
- Установите пакет:
pip install pdf2zh
- Запустите графический интерфейс:
pdf2zh -i
- доступ к браузеру
http://localhost:7860/
(Если не включается автоматически, введите вручную).
- Установите пакет:
- Поиск и устранение неисправностей в сети: Аналогично методу УФ-монтажа.
4. Развертывание Docker
- предварительные условия: Docker установлен (https://www.docker.com/).
- перейти:
- Извлеките образ и запустите его:
docker pull byaidu/pdf2zh docker run -d -p 7860:7860 byaidu/pdf2zh
- доступ к браузеру
http://localhost:7860/
.
- Извлеките образ и запустите его:
- Альтернативная программа: Если Docker Hub недоступен, используйте зеркала GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate
5. плагин Zotero
- перейти:
- Посетите сайт https://github.com/guaguastandup/zotero-pdf2zh, чтобы загрузить плагин.
- Установите и настройте параметры перевода в Zotero.
рабочий процесс
1. перевод командной строки
- базовая операция:
- Подготовьте PDF-файл (например.
paper.pdf
). - Выполнить команду:
pdf2zh paper.pdf
- Выход: сгенерировать
paper-mono.pdf
(перевод) иpaper-dual.pdf
(на двух языках), сохранить в текущем каталоге.
- Дополнительные параметры:
- Укажите язык:
-li en -lo zh
(с английского на китайский). - Выберите услугу:
-s deepl
(Используйте DeepL). - Частичный перевод:
-p 1-5
(стр. 1-5). - Выходной тракт:
-o ./output
.
Пример:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
- совместимость:: Файлы, не относящиеся к формату PDF/A, плюс
--compatible
Параметры:
pdf2zh paper.pdf --compatible
2. Использование интерфейса GUI
- процедура:
- Запустите графический интерфейс (
pdf2zh -i
). - Загрузка файла: нажмите "Выбрать файл", чтобы загрузить локальный PDF-файл, или введите онлайн-ссылку (например, "Upload PDF").
http://arxiv.org/paper.pdf
). - Параметры конфигурации:
- Язык источника: выберите "Английский".
- Целевой язык: Выберите "Китайский (упрощенный)".
- Служба перевода: выберите "Google" или другую.
- Нажмите "Перевести" и дождитесь окончания работы.
- Скачать: Получите одноязычный или двуязычный PDF-файл.
- Основные функции: Поддержка онлайн-перевода ссылок и интуитивно понятное управление.
3. Онлайн-сервисы Docker
- процедура:
- Доступ после запуска контейнера
http://localhost:7860/
. - Аналогично работе с графическим интерфейсом, загрузите файлы или ссылки, задайте параметры, а затем переведите.
- Функция обмена: добавить
--share
параметр для создания общедоступной ссылки:pdf2zh -i --share
4. Использование плагина Zotero
- процедура:
- Выберите PDF-документ в Zotero.
- Нажмите на значок плагина, чтобы установить язык и службы.
- Результат автоматически добавляется к записи после перевода.
Основные функции
- Сохранение набранных текстов: Использование
DocLayout-YOLO
Разбор макета для обеспечения точного размещения формул и графиков. - Опыт работы с онлайн-сервисами: Посетите https://pdf2zh.com/ или https://app.immersivetranslate.com/babel-doc/ (1 000 бесплатных страниц в месяц), чтобы использовать его без установки.
- Многопоточное ускорение: Использование
-t 4
Включите 4 потока для работы с большими файлами:
pdf2zh large_paper.pdf -t 4
предостережение
- Ограничения ресурсов: Онлайн-демонстрация имеет ограниченные вычислительные ресурсы, поэтому не злоупотребляйте ими.
- Журнал обновлений: Март 2025 Добавлена поддержка BabelDOC WebUI (экспериментальная) для улучшения возможностей перевода.
- Обратная связь с сообществом: Отправляйте предложения через GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) или группу Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).
PDFMathTranslate Неофициальный пакет интеграции
https://pan.quark.cn/s/e9e912c62c3a#/list/share
https://github.com/aidayang/PDFMathTranslate-OneClick
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...