LlamaParse: Высококачественный сервис парсинга документов и извлечения данных от Llamaindex (1000 бесплатных страниц в день).

Последние ресурсы по искусственному интеллектуОпубликовано 1 год назад Круг обмена ИИ

69.3K 00

Общее введение

LlamaParse - это мощный инструмент для разбора документов, который позволяет обрабатывать сложные документы, такие как PDF, PowerPoint, Word и электронные таблицы, и преобразовывать их в структурированные данные. LlamaParse доступен в различных вариантах, включая отдельный REST API, пакеты Python, TypeScript SDK и веб-интерфейс. LlamaParse анализирует документы с помощью команд естественного языка и поддерживает OCR на нескольких языках, обеспечивая эффективный разбор и индивидуальный вывод для широкого спектра отраслей и приложений.

LlamaParse：Llamaindex推出的高品质解析文档，提取数据服务（每日免费提取1000页）

Список функций

Разбор документов: поддержка документов PDF, PowerPoint, Word и разбора электронных таблиц.
Функция OCR: поддержка оптического распознавания символов на нескольких языках.
Инструкции на естественном языке: разбор содержимого документа с помощью инструкций на естественном языке.
Несколько форматов вывода: поддержка Markdown, обычного текста, JSON и других форматов вывода.
Интеграция API: предоставляет REST API, который может быть интегрирован с любым языком программирования.
Многоплатформенная поддержка: доступны пакеты Python, TypeScript SDK и Web UI.
Пользовательский синтаксический анализ: настройка синтаксического анализа и вывода в соответствии с требованиями пользователя.

Использование помощи

Установка и использование

LlamaParse предлагает различные способы использования, поэтому пользователи могут выбрать подходящий способ установки и использования в зависимости от своих потребностей.

Использование веб-интерфейса

Посетите веб-сайт LlamaParse.
Войдите в систему, используя OAuth 2.0 (Google, Github, Microsoft) или электронную почту.
Войдя в систему, нажмите кнопку "Разобрать".
Перетащите любой PDF-файл в поле "Загрузка файла" или укажите URL-адрес файла.
После загрузки файла нажмите кнопку "Разобрать" в нижней части страницы.
Результат парсинга будет отображаться в нижней части страницы, поддерживая Markdown, обычный текст, JSON и другие форматы.

Использование пакетов Python

Установите пакет LlamaParse Python:

   pip install llamaparse

Пример использования:

   from llamaparse import LlamaParse
parser = LlamaParse(api_key='YOUR_API_KEY')
result = parser.parse(file_path='/path/to/your/file.pdf')
print(result)

Использование REST API

Получите ключ API:
- Войдите на сайт LlamaParse.
- Получите ключ API в настройках пользователя.
Пример использования:

   curl -X 'POST' \
'https://api.cloud.llamaindex.ai/api/parsing/upload' \
-H 'accept: application/json' \
-H 'Content-Type: multipart/form-data' \
-H "Authorization: Bearer YOUR_API_KEY" \
--form 'file=@/path/to/your/file.pdf;type=application/pdf'

Основные функции

разрешение документа

Загрузка документов: загрузите документы для анализа через веб-интерфейс, пакеты Python или REST API.
Настройка параметров синтаксического анализа: Вы можете установить язык OCR, инструкции по синтаксическому анализу и другие параметры.
Разберите документ: нажмите кнопку "Разобрать" или вызовите функцию разбора.
View Result: Результат разбора будет выведен в указанном формате, который можно просмотреть в веб-интерфейсе или получить через API.

Функции OCR

Установить язык OCR: установите язык, который будет распознаваться в параметрах разбора.
Загружайте документы с изображениями: поддерживаются PDF, изображения и другие форматы.
Парсинг документов: LlamaParse автоматически распознает текст на изображениях и разбирает его.

обучение на естественном языке

Настройка инструкций парсинга: введите инструкцию на естественном языке в опции парсинга, например "Парсинг ресторанных квитанций, извлечение общей суммы и чаевых".
Загружайте документы: поддержка PDF, Word и других форматов.
Разбор документа: LlamaParse разберет содержимое документа в соответствии с командой и выведет результат.

Пользовательский синтаксический анализ

Настройка пользовательских параметров разбора: можно задать отключение OCR, пропуск диагонального текста и другие параметры.
Загрузка документов: поддержка загрузки документов в различных форматах.
Парсинг документов: парсинг в соответствии с пользовательскими параметрами и вывод результатов, соответствующих требованиям.

LlamaParse обладает богатой функциональностью и гибкими возможностями использования, позволяя пользователям выбирать подходящий метод синтаксического анализа в соответствии с их потребностями и персонализировать анализ с помощью опций настройки. Независимо от того, являетесь ли вы корпоративным или индивидуальным пользователем, LlamaParse поможет упростить процесс обработки документов и повысить эффективность работы.