MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Последние ресурсы по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

57.3K 00

Общее введение

MiniRAG - это очень простой фреймворк Retrieval Augmented Generation (RAG), целью которого является достижение хорошей производительности RAG даже для небольших моделей за счет гетерогенного индексирования графов и облегченного поиска с использованием топологии. Проект, разработанный Лабораторией науки о данных Гонконгского университета (HKUDS), нацелен на решение проблемы снижения производительности, с которой сталкиваются небольшие языковые модели (SLM) в существующих системах RAG. miniRAG снижает зависимость от сложного семантического понимания, объединяя фрагменты текста и именованные сущности в единую структуру, и использует графовые структуры для эффективного обнаружения знаний. Фреймворк достигает сопоставимой производительности, занимая всего 251 TP3T пространства для хранения данных по сравнению с подходом на основе большой языковой модели (LLM).

Список функций

Механизм индексирования гетерогенных графов: объединение текстовых блоков и именованных сущностей для снижения зависимости от сложного семантического понимания.
Облегченный поиск с использованием топологии: эффективное обнаружение знаний с помощью графовых структур.
Совместимость с небольшими языковыми моделями: обеспечение эффективной работы RAG в сценариях с ограниченными ресурсами.
Обширный эталонный набор данных: набор данных LiHua-World предназначен для оценки производительности легких систем RAG при выполнении сложных запросов.
Простая установка: поддерживает установку из исходного кода и PyPI.

Использование помощи

Процесс установки

Установка из источника (рекомендуется)

Клонирование репозитория MiniRAG:

   git clone https://github.com/HKUDS/MiniRAG.git
cd MiniRAG

Установите зависимость:

   pip install -e .

Установка из PyPI

MiniRAG основан на LightRAG и поэтому может быть установлен напрямую:

pip install lightrag-hku

Быстрый старт

Загрузите нужный набор данных и поместите его в папку./datasetкаталог. Например, набор данных LiHua-World был помещен в каталог./dataset/LiHua-World/data/Каталог.
Используйте следующую команду для индексирования набора данных:

   python ./reproduce/Step_0_index.py

Запустите модуль "Вопросы и ответы":

   python ./reproduce/Step_1_QA.py

В качестве альтернативы используйте./main.pyПриведенный код инициализирует MiniRAG.

Основные функции

Гетерогенный механизм индексирования карт

MiniRAG создает гетерогенные графовые индексы, объединяя текстовые блоки и именованные сущности в единую структуру. Пользователи могут добиться этого, выполнив следующие действия:

Подготовьте набор данных и убедитесь, что он отформатирован в соответствии с требованиями.
Запустите сценарий индексирования:

   python ./reproduce/Step_0_index.py

После завершения индексирования данные будут сохранены в указанном каталоге для последующего поиска.

Облегченный поиск с улучшенной топологией

MiniRAG использует графовые структуры для эффективного поиска знаний, которые могут быть получены пользователем на следующих этапах:

Инициализируйте MiniRAG:

   from minirag import MiniRAG
model = MiniRAG()

Загрузите набор данных и извлеките его:

   results = model.retrieve("你的查询")

Обрабатывает результаты поиска и генерирует ответ:

   response = model.generate(results)

Выполнив все вышеперечисленные действия, пользователи смогут в полной мере использовать возможности MiniRAG для эффективной генерации улучшений поиска.

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct График знаний ## Поиск знаний и RAG Framework

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

FIBO - первая в мире программа с открытым исходным кодом, поддерживающая JSON-текст для создания моделей изображений.

Последние ресурсы по искусственному интеллекту

4 месяца назад

027K

DeckSpeed - AI PPT Maker, презентация, созданная на естественном языке

Последние ресурсы по искусственному интеллекту

9 месяцев назад

036.6K

GitHub Copilot：集成到Visual Studio Code中使用的AI编程助手

GitHub Copilot: ассистент программирования с искусственным интеллектом, интегрированный в Visual Studio Code

Последние ресурсы по искусственному интеллекту # Программирование искусственного интеллекта

1 год назад

054.2K

ControlFlow: Python-фреймворк для создания управляемых и прозрачных рабочих процессов ИИ-интеллекта

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Система разработки интеллектуального тела

1 год назад

045.7K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Общее введение

Список функций

Использование помощи

Процесс установки

Установка из источника (рекомендуется)

Установка из PyPI

Быстрый старт

Основные функции

Гетерогенный механизм индексирования карт

Облегченный поиск с улучшенной топологией

Omni-RGPT: мультимодальная гранд-модель для понимания изображений и видео на уровне регионов для улучшения анализа визуального контента

Charla: минималистичный чат-инструмент с искусственным интеллектом на основе конечных точек с собственной интеграцией в бэкенд Ollama

Похожие статьи

FIBO - первая в мире программа с открытым исходным кодом, поддерживающая JSON-текст для создания моделей изображений.

DeckSpeed - AI PPT Maker, презентация, созданная на естественном языке

GitHub Copilot: ассистент программирования с искусственным интеллектом, интегрированный в Visual Studio Code

ControlFlow: Python-фреймворк для создания управляемых и прозрачных рабочих процессов ИИ-интеллекта

Нет комментариев

Последние коллекции

Последние статьи

MiniRAG: упрощенный поиск с расширенной структурой генерации, индекс графа сущностей Recall Relevant Text Blocks

Общее введение

Список функций

Использование помощи

Процесс установки

Установка из источника (рекомендуется)

Установка из PyPI

Быстрый старт

Основные функции

Гетерогенный механизм индексирования карт

Облегченный поиск с улучшенной топологией

Omni-RGPT: мультимодальная гранд-модель для понимания изображений и видео на уровне регионов для улучшения анализа визуального контента

Charla: минималистичный чат-инструмент с искусственным интеллектом на основе конечных точек с собственной интеграцией в бэкенд Ollama

Похожие статьи

FIBO - первая в мире программа с открытым исходным кодом, поддерживающая JSON-текст для создания моделей изображений.

DeckSpeed - AI PPT Maker, презентация, созданная на естественном языке

GitHub Copilot: ассистент программирования с искусственным интеллектом, интегрированный в Visual Studio Code

ControlFlow: Python-фреймворк для создания управляемых и прозрачных рабочих процессов ИИ-интеллекта

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи