Инженерный колледж AI: 2,8 смешанный рейтинг (как и 2,9)

Ретривер на основе окна предложения RAG методологии

AI工程学院:2.8混合 RAG(同2.9)

 

вводная

Метод Retrieval-Augmented Generation (RAG) для ретриверов на основе окна предложений - это высокоуровневая реализация фреймворка RAG, предназначенная для повышения уровня контекстной осведомленности и согласованности ответов, генерируемых ИИ. Этот подход сочетает в себе преимущества крупномасштабных языковых моделей и эффективных методов поиска информации, обеспечивая мощное решение для генерации высококачественных, богатых контекстом ответов.

https://github.com/adithya-s-k/AI-Engineering.academy/tree/main/RAG/03_Hybrid_RAG

 

локомотив

Обычные системы RAG часто не могут поддерживать согласованность в более широком диапазоне контекстов или испытывают трудности при обработке информации, охватывающей несколько блоков текста. Подходы к ретриверам на основе окон предложений устраняют это ограничение, сохраняя контекстные связи между блоками текста в процессе индексирования и используя эту информацию при поиске и генерации.

Методологические детали

Предварительная обработка документов и создание индекса векторного хранилища

  1. Разделение документов: Разделите входной документ на предложения.
  2. Создание текстового блока: Группирует предложения в удобные для восприятия фрагменты текста.
  3. встраивание: Каждый текстовый блок обрабатывается моделью встраивания для создания векторного представления.
  4. Указатель базы данных векторов: Сохраняет идентификаторы текстовых блоков, содержание текста и векторы вставки в векторную базу данных для эффективного поиска сходства.
  5. Указатель структуры документа: Хранит отношения между блоками текста по отдельности, включая ссылки между каждым блоком и k блоками до и после него.

Рабочий процесс создания усовершенствованного поиска

  1. обработка запросов: Встраивание пользовательских запросов с использованием той же модели встраивания, что и для текстовых блоков.
  2. Поиск сходства: Используйте встраивание запросов для поиска наиболее релевантных фрагментов текста в векторной базе данных.
  3. расширение контекста (вычислительная техника): Для каждого найденного текстового блока система получает k соседних текстовых блоков до и после него из базы данных структуры документа.
  4. контекстуализация: Объедините полученный текстовый блок и его расширенный контекст с исходным запросом.
  5. создание: Передача контекстов расширений и запросов большим языковым моделям для генерации ответов.

блок-схема

Следующая блок-схема иллюстрирует метод Retriever RAG на основе Sentence Window:

AI工程学院:2.8混合 RAG(同2.9)

 

Ключевые особенности RAG

  • Эффективный поискБыстрый и точный поиск информации с использованием векторного поиска по сходству.
  • контекстно-зависимый: Сохранение взаимосвязи между структурой документа и текстовыми блоками в процессе индексирования.
  • Гибкое контекстное окно: Поддерживает динамическое изменение размера контекстного окна во время поиска.
  • масштабируемость: Может обрабатывать большие коллекции документов и разнообразные типы запросов.

Преимущества этого метода

  1. Улучшение согласованности: Создавайте более связные и контекстуально точные ответы, включая в них соседние блоки текста.
  2. Уменьшение галлюцинаций: Снижение вероятности создания неправильного или нерелевантного контента благодаря полученной контекстной информации.
  3. Эффективное хранениеОптимизация пространства для хранения данных за счет сохранения только необходимой информации в базе данных векторов.
  4. Настраиваемое контекстное окноДинамически изменяйте размер контекстного окна в соответствии с различными запросами или требованиями приложения.
  5. Сохранение структуры документа: Сохраняют исходную структуру и информационный поток документа, делая генерацию более понятной с семантической точки зрения.

 

вынести вердикт

Подход RAG Retriever на основе Sentence Window представляет собой мощное решение для повышения качества и контекстной релевантности ответов, генерируемых ИИ. Сохраняя структуру документа и поддерживая гибкое расширение контекста, подход устраняет ключевые ограничения традиционных систем RAG и обеспечивает надежную основу для создания передовых систем вопросов и ответов, анализа документов и приложений для создания контента.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...