pdf2htmlEX: преобразование PDF в HTML без потерь, с сохранением форматирования текста, подходит для академических статей и журнальных версток

Общее введение

pdf2htmlEX - это инструмент с открытым исходным кодом, предназначенный для преобразования PDF-файлов в формат HTML, путем анализа содержимого PDF-файла и использования HTML + CSS для точного восстановления его визуального эффекта, PDF-документ будет преобразован в браузер и может быть просмотрен непосредственно на веб-странице. Инструмент особенно подходит для научных работ, содержащих большое количество формул и графиков, а также для сложных макетов журналов. pdf2htmlEX использует преимущества современных веб-технологий для обеспечения гибких опций вывода, поддержки ссылок, закладок, печати, SVG фонов и шрифтов Type 3 и других функций.

pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

 

Список функций

  • Конвертируйте PDF-файлы в формат HTML, сохраняя текст и форматирование.
  • Поддерживает различные варианты вывода, включая один HTML-файл или загрузку страниц по требованию
  • Поддержка ссылок, закладок, печати, фонов SVG и шрифтов Type 3
  • Улучшенные настройки DPI обеспечивают неискаженную графику на выходе
  • Поддержка обработки прозрачного и частично скрытого текста
  • Предоставляет множитель размера шрифта и опции масштабирования для обеспечения точного отображения в браузере
  • Поддержка удаления дубликатов файлов и оптимизация размера выходного файла

 

Использование помощи

Процесс установки

  1. Загрузите и установите зависимости: pdf2htmlEX использует такие инструменты, как Poppler и Fontforge, убедитесь, что они установлены в вашей системе.
  2. Загрузите исходный код pdf2htmlEX из репозитория GitHub:git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
  3. Перейдите в загруженную директорию и скомпилируйте исходный код:cd pdf2htmlEX && make
  4. Установите скомпилированный инструмент:sudo make install

Процесс использования

  1. Откройте терминал или инструмент командной строки.
  2. Используйте следующую команду для преобразования PDF-файлов в формат HTML:pdf2htmlEX input.pdf
  3. Преобразованный HTML-файл будет сохранен в той же директории, что и входной файл.

Детальное управление функциями

  • Варианты преобразования: Процесс преобразования можно контролировать с помощью различных опций командной строки, таких как --zoom для настройки масштабирования выходного HTML.--font-size-multiplier настраивает множитель размера шрифта.
  • Работа с непонятным текстом: Использование --correct-text-visibility Опция обрабатывает полностью или частично скрытый текст, обеспечивая его корректное отображение в HTML.
  • Оптимизируйте размер файла: Размер выходного файла может быть оптимизирован за счет удаления дублирующихся фоновых изображений и файлов шрифтов, благодаря чему результирующий HTML-файл будет меньше и эффективнее.
© заявление об авторских правах

Похожие статьи

MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程
Eightify:用AI快速总结YouTube视频的高效学习助手

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...