综合介绍
PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超链接)、图片和表格等多种格式。PPTX2MD还支持自定义目录、模糊匹配和多种输出格式,如Markdown、Tiddlywiki的wikitext、Madoko和Quarto。用户只需安装Python 3.10及以上版本,并通过pip安装pptx2md,即可轻松将PPTX文件转换为Markdown格式,方便在各种Markdown编辑器中使用。
功能列表
- 将PPTX文件转换为Markdown格式
- 支持保留标题、列表、文本格式(粗体、斜体、颜色和超链接)
- 支持图片提取并插入相对路径
- 支持表格转换,包括合并单元格
- 支持自定义目录和模糊匹配
- 支持多种输出格式:Markdown、Tiddlywiki的wikitext、Madoko、Quarto
- 提供多种命令行参数,支持自定义输出文件路径、图片目录、图片宽度等
使用帮助
安装流程
- 确保系统已安装Python 3.10及以上版本。
- 打开终端或命令提示符,运行以下命令安装pptx2md:
pip install pptx2md
使用方法
- 安装完成后,在终端或命令提示符中运行以下命令,将PPTX文件转换为Markdown格式:
pptx2md [pptx文件名]
默认输出文件名为out.md
,提取的图片将保存在/img/
文件夹中。
详细功能操作
- 自定义标题:默认情况下,工具将所有PPTX标题解析为一级Markdown标题。若需获取分层目录,可在文件中预定义标题列表,并使用
-t
参数提供该文件。例如:
pptx2md [文件名] -t titles.txt
标题文件示例(titles.txt):
Heading 1
Heading 1.1
Heading 1.1.1
Heading 1.2
- 自定义输出文件路径:使用
-o
参数指定输出文件路径:
pptx2md [文件名] -o [输出文件路径]
- 自定义图片目录:使用
-i
参数指定图片提取目录:
pptx2md [文件名] -i [图片目录]
- 设置图片宽度:使用
--image-width
参数设置图片最大宽度(单位:像素):
pptx2md [文件名] --image-width [宽度]
- 禁用图片提取:使用
--disable-image
参数禁用图片提取:
pptx2md [文件名] --disable-image
- 禁用特殊字符转义:使用
--disable-escaping
参数禁用特殊字符转义:
pptx2md [文件名] --disable-escaping
- 禁用演示者备注:使用
--disable-notes
参数禁用演示者备注:
pptx2md [文件名] --disable-notes
- 禁用WMF格式图片处理:使用
--disable-wmf
参数禁用WMF格式图片处理(避免在Linux下出现异常):
pptx2md [文件名] --disable-wmf
- 禁用颜色标签:使用
--disable-color
参数禁用HTML颜色标签:
pptx2md [文件名] --disable-color
- 启用幻灯片分隔符:使用
--enable-slides
参数启用幻灯片分隔符(适用于将PPTX幻灯片转换为Markdown幻灯片):
pptx2md [文件名] --enable-slides
- 尝试检测多列幻灯片:使用
--try-multi-column
参数尝试检测多列幻灯片(速度较慢):
pptx2md [文件名] --try-multi-column
- 设置最小文本块大小:使用
--min-block-size
参数设置输出文本块的最小字符数:
pptx2md [文件名] --min-block-size [大小]
- 输出为Tiddlywiki或Madoko格式:使用
--wiki
或--mdk
参数输出相应的标记语言:
pptx2md [文件名] --wiki
pptx2md [文件名] --mdk