综合介绍
LlamaParse 是一个强大的文档解析工具,能够处理复杂的文档如 PDF、PowerPoint、Word 文档和电子表格,并将其转换为结构化数据。LlamaParse 提供多种使用方式,包括独立的 REST API、Python 包、TypeScript SDK 和 Web UI。用户可以通过自然语言指令来解析文档内容,并支持多种语言的 OCR 功能。LlamaParse 的解析功能不仅高效,还能根据用户需求进行定制化输出,适用于各种行业和应用场景。
功能列表
- 文档解析:支持 PDF、PowerPoint、Word 文档和电子表格的解析。
- OCR 功能:支持多种语言的光学字符识别。
- 自然语言指令:通过自然语言指令解析文档内容。
- 多种输出格式:支持 Markdown、纯文本、JSON 等多种输出格式。
- API 集成:提供 REST API,可与任何编程语言集成。
- 多平台支持:提供 Python 包、TypeScript SDK 和 Web UI。
- 自定义解析:根据用户需求定制化解析和输出。
使用帮助
安装与使用
LlamaParse 提供多种使用方式,用户可以根据需求选择合适的方式进行安装和使用。
使用 Web UI
- 访问 LlamaParse 网站。
- 使用 OAuth 2.0(Google、Github、Microsoft)或邮箱登录。
- 登录后,点击“Parse”按钮。
- 在文件上传框中拖拽任意 PDF 文件,或提供文件的 URL。
- 文件上传后,点击页面底部的“Parse”按钮。
- 解析结果将显示在页面下方,支持 Markdown、纯文本、JSON 等多种格式查看。
使用 Python 包
- 安装 LlamaParse Python 包:
pip install llamaparse
- 使用示例:
from llamaparse import LlamaParse
parser = LlamaParse(api_key='YOUR_API_KEY')
result = parser.parse(file_path='/path/to/your/file.pdf')
print(result)
使用 REST API
- 获取 API 密钥:
- 登录 LlamaParse 网站。
- 在用户设置中获取 API 密钥。
- 使用示例:
curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-H "Authorization: Bearer YOUR_API_KEY" \
--form 'file=@/path/to/your/file.pdf;type=application/pdf'
主要功能操作流程
文档解析
- 上传文档:通过 Web UI、Python 包或 REST API 上传需要解析的文档。
- 设置解析选项:可以设置 OCR 语言、解析指令等选项。
- 解析文档:点击“Parse”按钮或调用解析函数。
- 查看结果:解析结果将以指定格式输出,可以在 Web UI 中查看或通过 API 获取。
OCR 功能
- 设置 OCR 语言:在解析选项中设置需要识别的语言。
- 上传包含图像的文档:支持 PDF、图片等格式。
- 解析文档:LlamaParse 将自动识别图像中的文字并进行解析。
自然语言指令
- 设置解析指令:在解析选项中输入自然语言指令,如“解析餐厅收据,提取总金额和小费”。
- 上传文档:支持 PDF、Word 等格式。
- 解析文档:LlamaParse 将根据指令解析文档内容并输出结果。
自定义解析
- 设置自定义解析选项:可以设置是否禁用 OCR、跳过对角线文本等选项。
- 上传文档:支持多种格式的文档上传。
- 解析文档:根据自定义选项进行解析,输出符合需求的结果。
LlamaParse 提供了丰富的功能和灵活的使用方式,用户可以根据需求选择合适的解析方式,并通过自定义选项实现个性化解析。无论是企业用户还是个人用户,LlamaParse 都能帮助简化文档处理流程,提高工作效率。