MarkPDFDown：基于多模态模型将PDF转为Markdown文件

61.4K 00

综合介绍

MarkPDFDown 是一个开源工具。它利用多模态大语言模型，把 PDF 文件转为 Markdown 格式。开发者是 GitHub 用户 jorben。这个工具的目标很简单：让 PDF 文档变得更易编辑和分享。它能识别文档中的标题、列表、表格等结构，生成格式整齐的 Markdown 文件。项目使用 Python 编写，适合需要处理 PDF 文件并转为文本格式的用户。当前版本需要依赖 OpenAI 的 API，用户得自己准备 API 密钥。MarkPDFDown 在 GitHub 上开放源代码，欢迎大家参与改进。

功能列表

将 PDF 文件转换为 Markdown 格式，保留文档结构。
支持识别标题、段落、列表、表格等元素。
通过多模态大模型理解 PDF 内容，确保转换结果准确。
提供命令行操作，支持批量处理 PDF 文件。
开源免费，用户可以自定义修改代码。

使用帮助

MarkPDFDown 是一个命令行工具，需要在电脑上安装并配置环境才能使用。以下是详细的安装和操作步骤，适合新手也能轻松上手。

安装流程

准备环境
你需要一台装有 Python 3.9 的电脑。如果没有，请先下载安装 Python。
打开终端，输入以下命令创建虚拟环境：

conda create -n markpdfdown python=3.9

然后激活环境：

conda activate markpdfdown

下载代码
在终端中输入命令，克隆 MarkPDFDown 的 GitHub 仓库：

git clone https://github.com/jorben/markpdfdown.git

进入项目文件夹：

cd markpdfdown

安装依赖
项目需要一些 Python 库支持。运行以下命令安装：

pip install -r requirements.txt

配置 API 密钥
MarkPDFDown 使用 OpenAI 的多模态模型，需要 API 密钥。先去 OpenAI 官网注册账号，获取密钥。
在终端中设置密钥：

export OPENAI_API_KEY=<你的API密钥>

如果想换模型或 API 地址，可以再设置：

export OPENAI_DEFAULT_MODEL=<你的模型名>
export OPENAI_API_BASE=<你的API地址>

验证安装
输入 python main.py --help，如果显示帮助信息，说明安装成功。

如何使用

安装好后，MarkPDFDown 的操作很简单，主要通过命令行完成。以下是具体步骤。

转换整个 PDF 文件

假设你有一个 PDF 文件，比如 tests/input.pdf，想转为 Markdown 文件 output.md。在终端中输入：

python main.py < tests/input.pdf > output.md

运行后，output.md 就会出现在当前文件夹中，里面是转换好的 Markdown 内容。

转换 PDF 的指定页面

如果只想转换某几页，比如第 2 到第 5 页，输入：

python main.py 2 5 < tests/input.pdf > output.md

第一个数字是起始页，第二个是结束页。页码从 1 开始计数。

使用 Docker 运行

不想装 Python 环境？可以用 Docker。确保电脑上有 Docker。然后运行：

docker run -i -e OPENAI_API_KEY=<你的API密钥> jorben/markpdfdown < tests/input.pdf > output.md

这样直接通过 Docker 容器转换文件。

功能操作详解

核心功能：PDF 转 Markdown
把 PDF 文件拖到命令行窗口，或者直接输入文件路径，工具会自动分析内容。标题会变成 #、## 等，列表用 - 表示，表格用 Markdown 表格格式输出。
比如，一个 PDF 有标题“简介”和正文“这是内容”，转换后可能是：

# 简介
这是内容

批量处理
如果有很多 PDF 文件，可以写个脚本循环调用命令。比如在 Linux 上：

for file in *.pdf; do python main.py < "$file" > "${file%.pdf}.md"; done

调试与改进
转换结果不理想？可以在 GitHub 上提问题，或者自己改代码。项目用 Python 编写，逻辑都在 main.py 里。

注意事项

文件路径不能有中文，否则可能报错。
API 密钥要保密，别泄露给别人。
大文件处理可能需要更多时间，确保网络稳定。

应用场景

学术研究
学生或研究者常需要把论文 PDF 转为 Markdown，方便摘录笔记或分享。MarkPDFDown 能保留论文的结构，比如标题和表格，直接用 Markdown 编辑。
文档整理
公司有大量 PDF 说明书或报告，想转为 Markdown 存档。可以用这个工具批量转换，再上传到 GitHub 或 Notion。
技术写作
写技术博客时，需要引用 PDF 资料。直接转换后，粘贴到 Markdown 编辑器，省去手动整理的麻烦。