はじめに
pdf2htmlEXは、PDFファイルをHTML形式に変換するために設計されたオープンソースのツールです。PDFファイルの内容を分析し、HTML + CSSを使用して正確にその視覚効果を復元することにより、PDF文書は、ブラウザに変換され、Webページ上で直接表示することができます。pdf2htmlEXは、柔軟な出力オプション、リンクのサポート、ブックマーク、印刷、SVGの背景とタイプ3フォントやその他の機能を提供するために、現代のWeb技術を活用しています。
機能一覧
- テキストと書式を維持したまま、PDFファイルをHTML形式に変換する
- 単一のHTMLファイルやオンデマンドのページ読み込みなど、さまざまな出力オプションをサポート
- リンク、ブックマーク、印刷、SVG背景、Type 3フォントのサポート
- DPI設定の改善により、歪みのない出力グラフィックスを実現
- 透明テキストおよび部分的に不明瞭なテキスト処理のサポート
- ブラウザでの正確な表示を保証するために、フォントサイズ倍率とズームオプションを提供します。
- 重複ファイルの削除と出力ファイルサイズの最適化に対応
ヘルプの使用
設置プロセス
- 依存関係のダウンロードとインストール: pdf2htmlEXはPopplerやFontforgeなどのツールに依存しています。
- pdf2htmlEXのソースコードをGitHubリポジトリからダウンロードしてください:
git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
- ダウンロードしたディレクトリに移動し、ソースコードをコンパイルする:
cd pdf2htmlEX && make
- コンパイルしたツールをインストールする:
sudo make install
使用プロセス
- ターミナルまたはコマンドラインツールを開く。
- PDFファイルをHTML形式に変換するには、以下のコマンドを使用します:
pdf2htmlEX入力.pdf
- 変換されたHTMLファイルは、入力ファイルと同じディレクトリに保存されます。
詳細な機能操作
- 変換オプション変換プロセスは、次のようなさまざまなコマンドラインオプションを使って制御できます。
--ズーム
オプションで出力HTMLのスケーリングを調整することができます。--フォントサイズ倍率
オプションはフォントサイズの倍率を調整します。 - 不明瞭なテキストの処理使用
-正しいテキスト表示
オプションは、完全にまたは部分的に隠されたテキストを処理し、テキストがHTMLで正しく表示されるようにします。 - ファイルサイズの最適化重複する背景画像やフォントファイルを削除することで、出力ファイルのサイズを最適化することができます。