AIパーソナル・ラーニング
と実践的なガイダンス
讯飞绘镜

pdf2htmlEX: テキストフォーマットを維持したまま、PDFをHTMLにロスレス変換。

はじめに

pdf2htmlEXは、PDFファイルをHTML形式に変換するために設計されたオープンソースのツールです。PDFファイルの内容を分析し、HTML + CSSを使用して正確にその視覚効果を復元することにより、PDF文書は、ブラウザに変換され、Webページ上で直接表示することができます。pdf2htmlEXは、柔軟な出力オプション、リンクのサポート、ブックマーク、印刷、SVGの背景とタイプ3フォントやその他の機能を提供するために、現代のWeb技術を活用しています。

pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版-1

 

機能一覧

  • テキストと書式を維持したまま、PDFファイルをHTML形式に変換する
  • 単一のHTMLファイルやオンデマンドのページ読み込みなど、さまざまな出力オプションをサポート
  • リンク、ブックマーク、印刷、SVG背景、Type 3フォントのサポート
  • DPI設定の改善により、歪みのない出力グラフィックスを実現
  • 透明テキストおよび部分的に不明瞭なテキスト処理のサポート
  • ブラウザでの正確な表示を保証するために、フォントサイズ倍率とズームオプションを提供します。
  • 重複ファイルの削除と出力ファイルサイズの最適化に対応

 

ヘルプの使用

設置プロセス

  1. 依存関係のダウンロードとインストール: pdf2htmlEXはPopplerやFontforgeなどのツールに依存しています。
  2. pdf2htmlEXのソースコードをGitHubリポジトリからダウンロードしてください:git clone https://github.com/pdf2htmlEX/pdf2htmlEX.git
  3. ダウンロードしたディレクトリに移動し、ソースコードをコンパイルする:cd pdf2htmlEX && make
  4. コンパイルしたツールをインストールする:sudo make install

使用プロセス

  1. ターミナルまたはコマンドラインツールを開く。
  2. PDFファイルをHTML形式に変換するには、以下のコマンドを使用します:pdf2htmlEX input.pdf
  3. 変換されたHTMLファイルは、入力ファイルと同じディレクトリに保存されます。

詳細な機能操作

  • 変換オプション変換プロセスは、次のようなさまざまなコマンドラインオプションを使って制御できます。 --zoom オプションで出力HTMLのスケーリングを調整することができます。--font-size-multiplier オプションはフォントサイズの倍率を調整します。
  • 不明瞭なテキストの処理使用 --correct-text-visibility オプションは、完全にまたは部分的に隠されたテキストを処理し、テキストがHTMLで正しく表示されるようにします。
  • ファイルサイズの最適化重複する背景画像やフォントファイルを削除することで、出力ファイルのサイズを最適化することができます。
無断転載を禁じます:チーフAIシェアリングサークル " pdf2htmlEX: テキストフォーマットを維持したまま、PDFをHTMLにロスレス変換。
ja日本語