はじめに
PPTX2MDは、PowerPoint PPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssineによって開発されたこのツールは、見出し、リスト、テキストフォーマット(太字、斜体、色、ハイパーリンクなど)、画像、表などの保持をサポートしています。PPTX2MDは、カスタム目次、ファジーマッチング、Markdown、Tiddlywikiのwikitext、Madoko、Quartoなどの様々な出力形式もサポートしています。ユーザーは、Python 3.10以上をインストールし、様々なMarkdownエディタで簡単に使用できるようにMarkdown形式にPPTXファイルを簡単に変換するためにpip経由でptx2mdをインストールするだけです。
機能一覧
- PPTXファイルをMarkdown形式に変換する
- 見出し、リスト、テキスト書式(太字、斜体、カラー、ハイパーリンク)の保持をサポート。
- 画像の抽出と相対パスの挿入をサポート
- セルの結合を含む表変換のサポート
- カスタム・ディレクトリとファジー・マッチングのサポート
- 複数の出力フォーマットをサポート:Markdown、Tiddlywikiのwikitext、Madoko、Quarto
- 様々なコマンドラインパラメータを提供し、カスタム出力ファイルパス、画像ディレクトリ、画像幅などをサポートします。
ヘルプの使用
設置プロセス
- Python 3.10以上がシステムにインストールされていることを確認してください。
- ターミナルまたはコマンドプロンプトを開き、以下のコマンドを実行してpptx2mdをインストールする:
pip install pptx2md
使用方法
- インストールが完了したら、ターミナルまたはコマンドプロンプトで以下のコマンドを実行し、PPTXファイルをMarkdown形式に変換します:
pptx2md [pptx文件名]
デフォルトの出力ファイル名はout.md
抽出された画像は/img/
フォルダー
詳細な機能操作
- カスタムタイトルデフォルトでは、このツールはすべてのPPTX見出しを1レベルのMarkdown見出しとして解析します。階層的なカタログを取得する必要がある場合は、ファイル内の見出しリストを事前に定義し
-t
パラメータでファイルを指定する。例
pptx2md [文件名] -t titles.txt
タイトルファイル(titles.txt)の例:
Heading 1
Heading 1.1
Heading 1.1.1
Heading 1.2
- 出力ファイルパスのカスタマイズ使用
-o
パラメーターは出力ファイルのパスを指定する:
pptx2md [文件名] -o [输出文件路径]
- カスタム画像カタログ使用
-i
パラメータは画像抽出ディレクトリを指定します:
pptx2md [文件名] -i [图片目录]
- 画像幅の設定使用
--image-width
パラメータは画像の最大幅(ピクセル)を設定します:
pptx2md [文件名] --image-width [宽度]
- 画像抽出を無効にする使用
--disable-image
パラメータは画像抽出を無効にする:
pptx2md [文件名] --disable-image
- 特殊文字のエスケープを無効にする使用
--disable-escaping
パラメーターは特殊文字のエスケープを無効にする:
pptx2md [文件名] --disable-escaping
- 発表者の発言を無効にする使用
--disable-notes
発表者ノートを無効にする:
pptx2md [文件名] --disable-notes
- WMF形式の画像処理を無効にする使用
--disable-wmf
パラメーターはWMF形式の画像処理を無効にする(Linuxでの例外を避けるため):
pptx2md [文件名] --disable-wmf
- カラーラベルを無効にする使用
--disable-color
パラメータはHTMLカラータグを無効にします:
pptx2md [文件名] --disable-color
- スライドセパレーターの有効化使用
--enable-slides
パラメータ スライドセパレータを有効にする(PPTXスライドをMarkdownスライドに変換する場合):
pptx2md [文件名] --enable-slides
- マルチカラムスライドの検出を試みる使用
--try-multi-column
パラメータは複数の列のスライドを検出しようとする(遅い):
pptx2md [文件名] --try-multi-column
- テキストブロックの最小サイズの設定使用
--min-block-size
パラメータは、出力テキストブロックの最小文字数を設定します:
pptx2md [文件名] --min-block-size [大小]
- TiddlywikiまたはMadokoフォーマットへのエクスポート使用
--wiki
もしかしたら--mdk
パラメータは対応するマークアップ言語を出力する:
pptx2md [文件名] --wiki
pptx2md [文件名] --mdk