PDFMathTranslate: инструмент перевода с помощью искусственного интеллекта, сохраняющий полную типографику PDF-файлов

Общее введение

PDFMathTranslate - это инструмент с открытым исходным кодом, который ориентирован на перевод научных статей и способен полностью переводить PDF-документы и создавать двуязычные версии. Он использует технологию искусственного интеллекта для сохранения полного макета оригинального документа, включая формулы, диаграммы, оглавления и примечания, поддерживает Google, DeepL, Ollama, OpenAI и другие сервисы перевода. Инструмент предлагает командную строку (CLI), графический интерфейс (GUI), развертывание в Docker и плагин Zotero для удовлетворения потребностей исследователей в быстром переводе и чтении. По состоянию на март 2025 года проект получил более 17 000 звезд на GitHub, имеет активное сообщество и продолжает обновляться за счет новой поддержки локальных моделей, файлов, отличных от PDF/A, и бэкендов BabelDOC.

PDFMathTranslate:保留PDF完整排版的AI翻译工具

 

PDFMathTranslate:保留PDF完整排版的AI翻译工具

Опыт работы в Интернете: https://pdf2zh.com/

 

Список функций

  • Полный перевод и двуязычие: Перевод PDF-документов на целевой язык с созданием как одноязычных переводов, так и двуязычных перекрестных ссылок.
  • Сохранение оригинальной типографики: Обеспечение последовательного форматирования формул, диаграмм, оглавлений и примечаний, а также поддержка сложных версий, таких как LaTeX.
  • Поддержка нескольких языковПеревод с нескольких исходных языков, например английского, на несколько целевых языков, например китайский.
  • Услуги мультиперевода: Интеграция с такими сервисами, как Google, DeepL, OpenAI, Ollama, и поддержка Xinference Местные модели.
  • Использование нескольких платформ: Предоставляет инструменты CLI, GUI-интерфейс, контейнеры Docker и плагины Zotero.
  • Опыт работы в Интернете:: Попробуйте основные функции без установки через публичные сервисы.
  • Расширенная настройка: Поддержка дополнительных опций, таких как частичный перевод, многопоточная обработка, пользовательские выходные каталоги и многое другое.

 

Использование помощи

Процесс установки

PDFMathTranslate предлагает несколько способов установки для различных сценариев. Ниже приведены подробные шаги:

1. Установка ультрафиолетового излучения (рекомендуется использовать командную строку)

  • предварительные условияТребуется версия Python 3.10 - 3.12.
  • перейти:
    1. Установите инструмент UV:
      pip install uv
      
    2. Установите программу PDFMathTranslate:
      uv tool install --python 3.12 pdf2zh
      
    3. Проверить: Выполнить pdf2zh --versionЕсли номер версии отображается, это означает, что работа выполнена успешно.
  • Поиск и устранение неисправностей в сети: Если модель не удается загрузить wybxc/DocLayout-YOLO-DocStructBench-onnxУстановите переменные окружения:
    • CMD. set HF_ENDPOINT=https://hf-mirror.com
    • PowerShell. $env:HF_ENDPOINT = "https://hf-mirror.com"

2. исполняемый файл для Windows (среда программирования не требуется)

  • перейти:
    1. Посетите страницу выпуска на GitHub (https://github.com/Byaidu/PDFMathTranslate/releases).
    2. Загрузите последнюю версию pdf2zh-version-win64.zip.
    3. Распакуйте и дважды щелкните pdf2zh.exe Бег.
  • принимать к сведению: Если это не работает, вам необходимо установить библиотеку времени выполнения VC++ (https://aka.ms/vs/17/release/vc_redist.x64.exe).

3. графический интерфейс пользователя (GUI)

  • предварительные условия: Python 3.10 - 3.12.
  • перейти:
    1. Установите пакет:
      pip install pdf2zh
      
    2. Запустите графический интерфейс:
      pdf2zh -i
      
    3. доступ к браузеру http://localhost:7860/(Если не включается автоматически, введите вручную).
  • Поиск и устранение неисправностей в сети: Аналогично методу УФ-монтажа.

4. Развертывание Docker

  • предварительные условия: Docker установлен (https://www.docker.com/).
  • перейти:
    1. Извлеките образ и запустите его:
      docker pull byaidu/pdf2zh
      docker run -d -p 7860:7860 byaidu/pdf2zh
      
    2. доступ к браузеру http://localhost:7860/.
  • Альтернативная программа: Если Docker Hub недоступен, используйте зеркала GitHub:
docker pull ghcr.io/byaidu/pdfmathtranslate
docker run -d -p 7860:7860 ghcr.io/byaidu/pdfmathtranslate

5. плагин Zotero

  • перейти:
  1. Посетите сайт https://github.com/guaguastandup/zotero-pdf2zh, чтобы загрузить плагин.
  2. Установите и настройте параметры перевода в Zotero.

рабочий процесс

1. перевод командной строки

  • базовая операция:
  1. Подготовьте PDF-файл (например. paper.pdf).
  2. Выполнить команду:
    pdf2zh paper.pdf
    
  3. Выход: сгенерировать paper-mono.pdf(перевод) и paper-dual.pdf(на двух языках), сохранить в текущем каталоге.
  • Дополнительные параметры:
  • Укажите язык:-li en -lo zh(с английского на китайский).
  • Выберите услугу:-s deepl(Используйте DeepL).
  • Частичный перевод:-p 1-5(стр. 1-5).
  • Выходной тракт:-o ./output.
    Пример:
pdf2zh paper.pdf -li en -lo zh -s openai -o ./translated
  • совместимость:: Файлы, не относящиеся к формату PDF/A, плюс --compatible Параметры:
pdf2zh paper.pdf --compatible

2. Использование интерфейса GUI

  • процедура:
  1. Запустите графический интерфейс (pdf2zh -i).
  2. Загрузка файла: нажмите "Выбрать файл", чтобы загрузить локальный PDF-файл, или введите онлайн-ссылку (например, "Upload PDF"). http://arxiv.org/paper.pdf).
  3. Параметры конфигурации:
    • Язык источника: выберите "Английский".
    • Целевой язык: Выберите "Китайский (упрощенный)".
    • Служба перевода: выберите "Google" или другую.
  4. Нажмите "Перевести" и дождитесь окончания работы.
  5. Скачать: Получите одноязычный или двуязычный PDF-файл.
  • Основные функции: Поддержка онлайн-перевода ссылок и интуитивно понятное управление.

3. Онлайн-сервисы Docker

  • процедура:
  1. Доступ после запуска контейнера http://localhost:7860/.
  2. Аналогично работе с графическим интерфейсом, загрузите файлы или ссылки, задайте параметры, а затем переведите.
  3. Функция обмена: добавить --share параметр для создания общедоступной ссылки:
    pdf2zh -i --share
    

4. Использование плагина Zotero

  • процедура:
  1. Выберите PDF-документ в Zotero.
  2. Нажмите на значок плагина, чтобы установить язык и службы.
  3. Результат автоматически добавляется к записи после перевода.

Основные функции

  • Сохранение набранных текстов: Использование DocLayout-YOLO Разбор макета для обеспечения точного размещения формул и графиков.
  • Опыт работы с онлайн-сервисами: Посетите https://pdf2zh.com/ или https://app.immersivetranslate.com/babel-doc/ (1 000 бесплатных страниц в месяц), чтобы использовать его без установки.
  • Многопоточное ускорение: Использование -t 4 Включите 4 потока для работы с большими файлами:
pdf2zh large_paper.pdf -t 4

предостережение

  • Ограничения ресурсов: Онлайн-демонстрация имеет ограниченные вычислительные ресурсы, поэтому не злоупотребляйте ими.
  • Журнал обновлений: Март 2025 Добавлена поддержка BabelDOC WebUI (экспериментальная) для улучшения возможностей перевода.
  • Обратная связь с сообществом: Отправляйте предложения через GitHub Issues (https://github.com/Byaidu/PDFMathTranslate/issues) или группу Telegram (https://t.me/+Z9_SgnxmsmA5NzBl).

 

PDFMathTranslate Неофициальный пакет интеграции

https://pan.quark.cn/s/e9e912c62c3a#/list/share

https://github.com/aidayang/PDFMathTranslate-OneClick

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...