pdf2htmlEX: преобразование PDF в HTML без потерь, с сохранением форматирования текста, подходит для академических статей и журнальных версток
Общее введение
pdf2htmlEX - это инструмент с открытым исходным кодом, предназначенный для преобразования PDF-файлов в формат HTML, путем анализа содержимого PDF-файла и использования HTML + CSS для точного восстановления его визуального эффекта, PDF-документ будет преобразован в браузер и может быть просмотрен непосредственно на веб-странице. Инструмент особенно подходит для научных работ, содержащих большое количество формул и графиков, а также для сложных макетов журналов. pdf2htmlEX использует преимущества современных веб-технологий для обеспечения гибких опций вывода, поддержки ссылок, закладок, печати, SVG фонов и шрифтов Type 3 и других функций.
Список функций
- Конвертируйте PDF-файлы в формат HTML, сохраняя текст и форматирование.
- Поддерживает различные варианты вывода, включая один HTML-файл или загрузку страниц по требованию
- Поддержка ссылок, закладок, печати, фонов SVG и шрифтов Type 3
- Улучшенные настройки DPI обеспечивают неискаженную графику на выходе
- Поддержка обработки прозрачного и частично скрытого текста
- Предоставляет множитель размера шрифта и опции масштабирования для обеспечения точного отображения в браузере
- Поддержка удаления дубликатов файлов и оптимизация размера выходного файла
Использование помощи
Процесс установки
- Загрузите и установите зависимости: pdf2htmlEX использует такие инструменты, как Poppler и Fontforge, убедитесь, что они установлены в вашей системе.
- Загрузите исходный код pdf2htmlEX из репозитория GitHub:
git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
- Перейдите в загруженную директорию и скомпилируйте исходный код:
cd pdf2htmlEX && make
- Установите скомпилированный инструмент:
sudo make install
Процесс использования
- Откройте терминал или инструмент командной строки.
- Используйте следующую команду для преобразования PDF-файлов в формат HTML:
pdf2htmlEX input.pdf
- Преобразованный HTML-файл будет сохранен в той же директории, что и входной файл.
Детальное управление функциями
- Варианты преобразования: Процесс преобразования можно контролировать с помощью различных опций командной строки, таких как
--zoom
для настройки масштабирования выходного HTML.--font-size-multiplier
настраивает множитель размера шрифта. - Работа с непонятным текстом: Использование
--correct-text-visibility
Опция обрабатывает полностью или частично скрытый текст, обеспечивая его корректное отображение в HTML. - Оптимизируйте размер файла: Размер выходного файла может быть оптимизирован за счет удаления дублирующихся фоновых изображений и файлов шрифтов, благодаря чему результирующий HTML-файл будет меньше и эффективнее.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...