OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

54.3K 00

Общее введение

OmniParse - это мощная платформа для разбора и оптимизации данных, предназначенная для преобразования любых неструктурированных данных в структурированные, пригодные для использования данные, оптимизированные для фреймворков GenAI (Generative Artificial Intelligence). Независимо от того, работаете ли вы с документами, таблицами, изображениями, видео, аудиофайлами или веб-контентом, OmniParse сделает ваши данные чистыми, структурированными и готовыми для применения ИИ, таких как RAG (Retrieval Augmented Generation) и тонкая настройка.

: Адрес для демонстраций с открытым исходным кодом: https://colab.research.google.com/github/adithya-s-k/omniparse/blob/main/examples/OmniParse_GoogleColab.ipynb

Список функций

Полностью локализовано, не требует внешнего API
Для графических процессоров T4
Поддерживает около 20 типов файлов
Преобразование документов, мультимедиа и веб-страниц в высококачественный структурированный Markdown
Извлечение таблиц, извлечение изображений/субтитрование, транскрипция аудио/видео, просмотр веб-страниц
Простое развертывание с помощью Docker и Skypilot
Дружелюбная обстановка в лаборатории
Интерактивный пользовательский интерфейс на базе Gradio

Использование помощи

Процесс установки

склад клонов::

git clone https://github.com/adithya-s-k/omniparse
cd omniparse

Создание виртуальной среды::

conda create -n omniparse-venv python=3.10
conda activate omniparse-venv

Установка зависимостей::

poetry install
# 或者
pip install -e .
# 或者
pip install -r pyproject.toml

Использование Docker

Извлечение образов OmniParse API из Docker Hub::
```
docker pull savatar101/omniparse:0.1
```

Запустите контейнер Docker, открыв порт 8000.::

# 如果使用GPU
docker run --gpus all -p 8000:8000 savatar101/omniparse:0.1
# 否则
docker run -p 8000:8000 savatar101/omniparse:0.1

Операционный сервер

Запустите сервер::
```
python server.py --host 0.0.0.0 --port 8000 --documents --media --web
```
- --documents: Загрузите все модели, которые помогают разбирать и впитывать документы (например, семейство моделей Surya OCR и Florence-2).
- --media: Загрузка моделей Whisper для расшифровки аудио- и видеофайлов.
- --web: Настройка краулера Selenium.

Поддерживаемые типы данных

(компьютерный) файл::.doc, .docx, .pdf, .ppt, .pptx
изображения::.png, .jpg, .jpeg, .tiff, .bmp, .heic
видео::.mp4, .mkv, .avi, .mov
частота звука::.mp3, .wav, .aac
веб-страница: динамические веб-страницы.http://.com

Пример использования

разрешение документа::
```
python server.py --host 0.0.0.0 --port 8000 --documents
```
При этом загружаются все модели разбора документов, готовые к обработке данных этого типа.
разбор мультимедиа::
```
python server.py --host 0.0.0.0 --port 8000 --media
```
При этом модель Whisper загружается, готовая к обработке аудио- и видеофайлов.
веб-гусеница::
```
python server.py --host 0.0.0.0 --port 8000 --web
```
Это позволит настроить Selenium crawler, готовый к обработке веб-контента.

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Извлечение и очистка документов

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

BoomCut - инструмент создания видеороликов для исходящего маркетинга с искусственным интеллектом от Little Shadow Technology

Последние ресурсы по искусственному интеллекту

10 месяцев назад

049.4K

KreadoAI: Платформа для создания видео с участием цифрового человека|Клон цифрового человека|Модельное одевание

Последние ресурсы по искусственному интеллекту # AI Обмен лицами и переодевание # AI Digital Man

2 года назад

053.2K

Adobe Firefly(萤火虫)：图像生成式AI套件|免费使用萤火虫图片编辑工具

Adobe Firefly: Image Builder AI Suite | Бесплатные инструменты для редактирования фотографий Firefly

Последние ресурсы по искусственному интеллекту # AI онлайн генерация изображений # AI-ключ для смены фона # AI Обмен лицами и переодевание

2 года назад

080.2K

GLM-4.5V - мультимодальная модель визуального мышления с открытым исходным кодом от Smart Spectrum

Последние ресурсы по искусственному интеллекту

8 месяцев назад

050.9K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Общее введение

Список функций

Использование помощи

Процесс установки

Использование Docker

Операционный сервер

Поддерживаемые типы данных

Пример использования

Video Ocean: создавайте видеоролики на основе текста или изображений, которые сохраняют лица людей, стоящих в очереди.

Smart Spectrum Clearstream: центр приложений для больших моделей корпоративного уровня, обеспечивающий интеллектуальную платформу для разработки ИИ

Похожие статьи

BoomCut - инструмент создания видеороликов для исходящего маркетинга с искусственным интеллектом от Little Shadow Technology

KreadoAI: Платформа для создания видео с участием цифрового человека|Клон цифрового человека|Модельное одевание

Adobe Firefly: Image Builder AI Suite | Бесплатные инструменты для редактирования фотографий Firefly

GLM-4.5V - мультимодальная модель визуального мышления с открытым исходным кодом от Smart Spectrum

Нет комментариев

Последние коллекции

Последние статьи

OmniParse: извлечение любых неструктурированных данных из документов/мультимедиа и их разбор в структурированные данные

Общее введение

Список функций

Использование помощи

Процесс установки

Использование Docker

Операционный сервер

Поддерживаемые типы данных

Пример использования

Video Ocean: создавайте видеоролики на основе текста или изображений, которые сохраняют лица людей, стоящих в очереди.

Smart Spectrum Clearstream: центр приложений для больших моделей корпоративного уровня, обеспечивающий интеллектуальную платформу для разработки ИИ

Похожие статьи

BoomCut - инструмент создания видеороликов для исходящего маркетинга с искусственным интеллектом от Little Shadow Technology

KreadoAI: Платформа для создания видео с участием цифрового человека|Клон цифрового человека|Модельное одевание

Adobe Firefly: Image Builder AI Suite | Бесплатные инструменты для редактирования фотографий Firefly

GLM-4.5V - мультимодальная модель визуального мышления с открытым исходным кодом от Smart Spectrum

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи