Интеллектуальное агентное извлечение расширенной генерации: обзор технологии Agentic RAG

База знаний по искусственному интеллектуОбновлено 1 год назад Круг обмена ИИ

59.6K 00

рефераты

Большие языковые модели (БЯМ), такие как GPT-4 от OpenAI, PaLM от Google и LLaMA от Meta, кардинально изменили искусственный интеллект (ИИ), позволив создавать человекоподобные тексты и понимать естественный язык. Однако их зависимость от статичных обучающих данных ограничивает их способность отвечать на динамичные запросы в реальном времени, что приводит к устаревшим или неточным результатам. В качестве решения, позволяющего расширить возможности LLM, появилось решение Retrieval Augmented Generation (RAG), интегрирующее поиск данных в реальном времени для предоставления контекстуально релевантных и своевременных ответов. Несмотря на перспективность RAG, традиционные системы RAG ограничены статичными рабочими процессами и не обладают гибкостью, необходимой для многоэтапных рассуждений и управления сложными задачами.

Агентный поиск с расширенной генерацией (Agentic Retrieval Augmented Generation, Agentic RAG) преодолевает эти ограничения, внедряя в процесс RAG автономных агентов искусственного интеллекта. Эти агенты используют паттерны агентного проектирования - размышление, планирование, использование инструментов и взаимодействие нескольких агентов - для динамического управления стратегиями поиска, итеративного уточнения контекстного понимания и адаптации рабочих процессов в соответствии с требованиями сложных задач. Такая интеграция позволяет системе Agentic RAG обеспечивать непревзойденную гибкость, масштабируемость и контекстную осведомленность в широком спектре приложений.

В этом обзоре всесторонне рассматривается агентная RAG, начиная с ее основополагающих принципов и эволюции парадигмы RAG. В нем подробно описывается классификация архитектур Agentic RAG, выделяются ключевые области их применения в таких отраслях, как здравоохранение, финансы и образование, а также рассматриваются практические стратегии реализации. Кроме того, в книге обсуждаются проблемы масштабирования этих систем, обеспечения этичности принятия решений и оптимизации работы реальных приложений, а также дается подробное представление о фреймворках и инструментах для реализации Agentic RAG.

Ключевые слова. Большие языковые модели (LLM) - Искусственный интеллект (ИИ) - Понимание естественного языка - Поиск дополненной генерации (RAG) - Агентский RAG - Автономные агенты ИИ - Размышление - Планирование - Использование инструментов - Многоагентное взаимодействие - Агентские паттерны - Контекстуальное понимание - Динамическая адаптация - Масштабируемость - Поиск данных в реальном времени - Классификация агентского RAG - Приложения для здравоохранения - Приложения для финансов - Приложения для образования. Этическое принятие решений ИИ - Оптимизация производительности - Многоступенчатые рассуждения

1 Введение

Большие языковые модели (БЯМ) [1, 2] [3], такие как GPT-4 от OpenAI, PaLM от Google и LLaMA от Meta, кардинально изменили искусственный интеллект (ИИ), создавая человекоподобные тексты и выполняя сложные задачи обработки естественного языка. Эти модели стали движущей силой инноваций в области диалога [4], включая разговорные агенты, автоматизированное создание контента и перевод в реальном времени. Последние достижения расширили их возможности до мультимодальных задач, таких как генерация текста в изображение и текста в видео [5], позволяя создавать и редактировать видео и изображения на основе подробных подсказок [6], что расширяет спектр потенциальных применений генеративного ИИ.

Несмотря на эти достижения, LLM все еще сталкиваются со значительными ограничениями, связанными с их зависимостью от статических данных предварительного обучения. Такая зависимость обычно приводит к устареванию информации, фантомным ответам [7] и неспособности адаптироваться к динамичным сценариям реального мира. Эти проблемы подчеркивают необходимость создания систем, способных интегрировать данные в реальном времени и динамически уточнять ответы для поддержания контекстной релевантности и точности.

RAG повышает релевантность и своевременность ответов, объединяя генеративные возможности LLM с внешними механизмами поиска [10]. Эти системы получают информацию в реальном времени из таких источников, как базы знаний [11], API или Web, эффективно преодолевая разрыв между статичными обучающими данными и динамичными требованиями приложений. Однако традиционные рабочие процессы RAG все еще ограничены их линейным и статичным дизайном, что ограничивает их способность выполнять сложные многоступенчатые рассуждения, интегрировать глубокое контекстное понимание и итеративно дорабатывать ответы.

Эволюция агентов [12] еще больше расширила возможности систем ИИ. Современные агенты, включая агентов на основе LLM и мобильных агентов [13], представляют собой интеллектуальные сущности, способные воспринимать, рассуждать и выполнять задачи автономно. Эти агенты используют такие шаблоны рабочего процесса, как размышление [14], планирование [15], использование инструментов и совместная работа нескольких агентов [16], что позволяет им управлять динамическими рабочими процессами и решать сложные задачи.

Конвергенция RAG и агентного интеллекта привела к появлению Agentic Retrieval Augmented Generation (Agentic RAG) [17], парадигмы, которая интегрирует агентов в процесс RAG. Agentic RAG реализует динамические стратегии поиска, контекстное понимание и итеративное уточнение [18], позволяя адаптивно и эффективно обрабатывать информацию. В отличие от традиционной RAG, агентная RAG использует автономных агентов для организации поиска, фильтрации релевантной информации и уточнения ответов, и превосходит ее в сценариях, требующих точности и адаптивности.

В этом обзоре рассматриваются основополагающие принципы, классификация и применение агентных RAG. В нем представлен всеобъемлющий обзор парадигм RAG, таких как Simple RAG, Modular RAG и Graph RAG [19], и их эволюции до агентных систем RAG. Основные материалы включают подробную классификацию агентных RAG-систем, их применение в таких областях, как здравоохранение [20, 21], финансы и образование [22], а также понимание стратегий реализации, бенчмаркинга и этических аспектов.

Статья построена следующим образом: в разделе 2 рассказывается о RAG и его развитии, подчеркиваются ограничения традиционных подходов. В разделе 3 подробно рассматриваются принципы агентного интеллекта и агентные модели. В разделе 4 представлена классификация агентных систем RAG, включая одноагентные, многоагентные и графовые системы. В разделе 5 рассматриваются области применения агентных RAG, а в разделе 6 обсуждаются инструменты реализации и фреймворки. Раздел 7 посвящен контрольным показателям и наборам данных, а в разделе 8 представлены будущие направления развития агентных RAG-систем.

2 Основа для создания улучшений поиска

2.1 Обзор дополненного поколения (RAG)

Генерация с расширением поиска (RAG) представляет собой значительное достижение в области искусственного интеллекта, объединяя генеративную мощь больших языковых моделей (LLM) с поиском данных в реальном времени. Хотя LLM продемонстрировали исключительные возможности в обработке естественного языка, их зависимость от статических данных предварительного обучения часто приводит к устаревшим или неполным ответам. RAG устраняет это ограничение, динамически получая релевантную информацию из внешних источников и включая ее в процесс генерации, что позволяет своевременно генерировать контекстуально точные и отзывчивые результаты.

2.2 Основные компоненты RAG

Архитектура системы RAG включает в себя три основных компонента (см. Рисунок 1):

получить (данные): Отвечает за запросы к внешним источникам данных, таким как базы знаний, API или векторные базы данных. Усовершенствованные ретриверы используют плотный векторный поиск и модели на основе трансформаторов для повышения точности поиска и семантической релевантности.
укреплять: Обработка полученных данных для извлечения и обобщения наиболее релевантной информации в соответствии с контекстом запроса.
создание: Объедините полученную информацию с предварительно обученными знаниями о LLM, чтобы генерировать последовательные, контекстуально подходящие ответы.

Рисунок 1: Основные компоненты RAG

2.3 Эволюция парадигмы RAG

Область расширенного поиска (Retrieval Augmented Generation, RAG) достигла значительных успехов, чтобы справиться с растущей сложностью реальных приложений, где контекстная точность, масштабируемость и многоступенчатые рассуждения имеют решающее значение. Начав с простого поиска по ключевым словам, они превратились в сложные, модульные и адаптивные системы, способные интегрировать различные источники данных и автономные процессы принятия решений. Эта эволюция подчеркивает растущую потребность в системах RAG для эффективной и действенной обработки сложных запросов.

В этом разделе рассматривается эволюция парадигмы RAG, описываются основные этапы ее развития - простая RAG, расширенная RAG, модульная RAG, графическая RAG и агентная RAG - а также их определяющие характеристики, достоинства и ограничения. Понимая эволюцию этих парадигм, читатель сможет оценить достижения в области поиска и генеративных возможностей, а также их применение в различных областях.

2.3.1 Простой RAG

Простой RAG [23] представляет собой базовую реализацию генерации с расширенным поиском. На рисунке 2 показаны простые RAG для простых рабочих процессов поиска-чтения, сфокусированных на поиске по ключевым словам и статических наборах данных. Эти системы используют простые методы поиска по ключевым словам, такие как TF-IDF и BM25, для извлечения документов из статических наборов данных. Полученные документы затем используются для создания языковых моделей.

Рисунок 2: Обзор Naive RAG.

Простой RAG характеризуется простотой и легкостью реализации и подходит для задач, связанных с запросами на основе фактов с минимальной контекстуальной сложностью. Однако у него есть несколько ограничений:

Отсутствие контекстуальной осведомленностиВ результате поиска документов часто не удается уловить семантические нюансы запроса, так как они опираются на лексическое соответствие, а не на семантическое понимание.
Фрагментация выходных данныхОтсутствие расширенной предварительной обработки или контекстной интеграции часто приводит к бессвязным или слишком общим ответам.
проблема масштабируемости: Методы поиска, основанные на ключевых словах, как правило, плохо работают с большими массивами данных и обычно не могут определить наиболее релевантную информацию.

Несмотря на эти ограничения, простая система RAG обеспечивает критическое доказательство концепции сочетания поиска и генерации, закладывая основу для более сложных парадигм.

2.3.2 Расширенный RAG

Системы расширенного RAG [23] учитывают ограничения простого RAG, объединяя семантическое понимание и улучшенные методы поиска. На рисунке 3 показано семантическое расширение и итеративный, контекстно-ориентированный процесс расширенного RAG в поиске. Эти системы используют модели плотного поиска, такие как плотный поиск по абзацам (DPR), и нейронные алгоритмы ранжирования для повышения точности поиска.

Рисунок 3: Обзор расширенного RAG

Основные характеристики Advanced RAG включают:

Плотный векторный поиск: Запросы и документы представлены в векторном пространстве высокого уровня, что приводит к лучшему семантическому соответствию между запросами пользователя и полученными документами.
переупорядочивание контекста: Нейронная модель упорядочивает найденные документы, чтобы отдать предпочтение наиболее контекстуально значимой информации.
Итеративный поиск: Advanced RAG представляет механизм многоходового поиска, который позволяет рассуждать о сложных запросах по нескольким документам.

Благодаря этим достижениям усовершенствованная RAG подходит для приложений, требующих высокой точности и тонкого понимания, таких как синтез исследований и персонализированные рекомендации. Тем не менее, остаются проблемы вычислительных затрат и ограниченной масштабируемости, особенно при работе с большими наборами данных или многоэтапными запросами.

2.3.3 Модульный RAG

Модульные системы RAG [23] представляют собой новейшее развитие парадигмы RAG с акцентом на гибкость и адаптацию. Эти системы декомпозируют процессы поиска и генерации на отдельные, многократно используемые компоненты, что позволяет оптимизировать работу в конкретной области и адаптировать задачу. На рисунке 4 показана модульная архитектура, демонстрирующая гибридные стратегии поиска, составные процессы и интеграцию внешних инструментов.

Ключевые инновации модульной системы RAG включают в себя:

гибридная стратегия поиска: Комбинирование методов поиска с разреженной структурой (например, Sparse Encoder - BM25) и плотной структурой (например, DPR - Dense Paragraph Retrieval) для достижения максимальной точности при выполнении различных типов запросов.
интеграция инструментовИнтеграция внешних API, баз данных или вычислительных инструментов для решения конкретных задач, таких как анализ данных в реальном времени или вычисления в конкретной области.
Совместимые процессыМодульная система RAG позволяет заменять, дополнять или изменять конфигурацию ретриверов, генераторов и других компонентов, обеспечивая высокую степень адаптации к конкретным условиям использования.

Например, модульная система RAG, предназначенная для финансовой аналитики, может получать информацию о ценах на акции в реальном времени через API, анализировать исторические тенденции с помощью интенсивного поиска и генерировать полезные инвестиционные идеи с помощью специализированной языковой модели. Такая модульность и настраиваемость делает модульную систему RAG хорошо подходящей для решения сложных, многодоменных задач, обеспечивая масштабируемость и точность.

Рисунок 4: Обзор модульной системы RAG

2.3.4 Рисунок RAG

Graph RAG [19] расширяет традиционные системы генерации улучшений поиска за счет интеграции структур данных на основе графов, как показано на рисунке 5. Эти системы используют взаимосвязи и иерархии в графовых данных для улучшения многоходовых рассуждений и контекстного расширения. Интегрируя поиск на основе графов, графовые RAG способны создавать более богатые и точные результаты, особенно для задач, требующих реляционного понимания.

Рисунок RAG характеризуется способностью:

связность узлов: Улавливать и рассуждать об отношениях между сущностями.
Иерархическое управление знаниями: Работа со структурированными и неструктурированными данными с помощью иерархий графов.
контекстно-зависимый: Добавьте понимание реляций с помощью путей графа.

Однако у графика RAG есть некоторые ограничения:

Ограниченная масштабируемость: Зависимость от структуры графа может ограничить масштабируемость, особенно для широкого спектра источников данных.
Зависимость данных: Для получения значимых результатов необходимо высокое качество графов, что ограничивает их применение для неструктурированных или плохо аннотированных наборов данных.
Сложность интеграции: Интеграция графовых данных с неструктурированными поисковыми системами повышает сложность проектирования и реализации.

Graph RAG хорошо подходит для применения в таких областях, как медицинская диагностика и юридические исследования, где рассуждения о структурированных отношениях имеют решающее значение.

Рисунок 5: Обзор графика RAG

2.3.5 Прокси RAG

Агентная система RAG представляет собой смену парадигмы, поскольку в ней появились автономные агенты, способные принимать динамические решения и оптимизировать рабочий процесс. В отличие от статических систем, агентные RAG используют итеративные уточняющие и адаптивные стратегии поиска, чтобы справиться со сложными запросами в реальном времени и с несколькими областями. Эта парадигма использует модульность процесса поиска и генерации, одновременно внедряя автономность на основе агентов.

Ключевые особенности агентного RAG включают:

самоопределениеАгенты самостоятельно оценивают и управляют стратегиями поиска в зависимости от сложности запроса.
Итеративное совершенствование: Интеграция контуров обратной связи для повышения точности поиска и релевантности ответа.
Оптимизация рабочего процессаДинамическое планирование задач для повышения эффективности приложений реального времени.

Несмотря на эти достижения, агентные RAG сталкиваются с рядом проблем:

Сложность координации: Управление взаимодействием между агентами требует сложных механизмов координации.
вычислительные затраты: Использование нескольких агентов повышает требования к ресурсам для сложных рабочих процессов.
ограничения масштабируемости: Несмотря на масштабируемость, динамический характер системы может оказывать давление на большие объемы запросов.

Агентные RAG отлично зарекомендовали себя в таких областях, как поддержка клиентов, финансовая аналитика и адаптивные обучающие платформы, где динамическая адаптивность и контекстуальная точность имеют решающее значение.

2.4 Проблемы и ограничения традиционных систем RAG

Традиционные системы Retrieval Augmented Generation (RAG) значительно расширили возможности больших языковых моделей (LLM) за счет интеграции поиска данных в реальном времени. Однако эти системы по-прежнему сталкиваются с рядом ключевых проблем, которые препятствуют их эффективности в сложных реальных приложениях. Наиболее заметные ограничения связаны с интеграцией контекста, многоступенчатыми рассуждениями, а также проблемами масштабируемости и задержки.

2.4.1 Контекстная интеграция

Даже если системы RAG успешно извлекают релевантную информацию, им часто не удается органично интегрировать ее в генерируемый ответ. Статический характер процесса поиска и ограниченное понимание контекста приводят к фрагментарному, непоследовательному или слишком обобщенному результату.

Например, запрос "Последние достижения в исследовании болезни Альцгеймера и их последствия для раннего лечения" может выдать соответствующие научные работы и медицинские рекомендации. Однако традиционные системы RAG часто не могут синтезировать эти результаты в последовательные объяснения, которые связывают новые методы лечения с конкретными сценариями пациентов. Аналогичным образом, по такому запросу, как "Каковы наилучшие устойчивые методы ведения мелкомасштабного сельского хозяйства в засушливых регионах?", традиционная система может найти документы по общим методам ведения сельского хозяйства, но пропустить критически важные устойчивые методы для засушливых регионов.

Таблица 1. Сравнительный анализ парадигм RAG

Парадигма	Основные характеристики	Сильные стороны
Наивный RAG	- На основе ключевых слов поиск (например, TF-IDF. BM25)	- Простота и легкость реализации - Подходит для запросов, основанных на фактах
Продвинутый RAG	- Модели плотного поиска (например, DPR) - Нейронное ранжирование и повторное ранжирование - Многоходовый поиск	- Высокая точность поиска - Улучшенный контекст актуальность
Модульная система RAG	- Гибридный поиск (разреженный и плотный) - Интеграция инструментов и API - Композитные, специфичные для конкретной области конвейеры	- Высокая гибкость и настраиваемость - Подходит для различных приложений - Масштабируемость
График RAG	- Интеграция структур на основе графов - Многоходовые рассуждения - Контекстное обогащение через узлы	- Возможности реляционных рассуждений - Уменьшение галлюцинаций - Идеально подходит для задач, связанных со структурированными данными
Агенты RAG	- Автономные агенты - Динамическое принятие решений - Итеративное уточнение и рабочий процесс оптимизация	- Адаптация к изменениям в реальном времени - Масштабируемость для решения многодоменных задач - Высокая точность

2.4.2 Многоступенчатые рассуждения

Многие запросы в реальном мире требуют итеративного или многоступенчатого рассуждения - поиска и синтеза информации на нескольких этапах. Традиционные системы RAG часто оказываются не готовы к уточнению поиска на основе промежуточных данных или обратной связи с пользователем, что приводит к неполным или разрозненным ответам.

Пример: сложный запрос, например, "Какие уроки европейской политики в области возобновляемой энергетики можно применить в развивающихся странах и каковы их потенциальные экономические последствия?". Необходимо согласовать множество информации, включая политические данные, контекст для развивающихся регионов и экономический анализ. Традиционные системы RAG часто не в состоянии соединить эти разрозненные элементы в согласованный ответ.

2.4.3 Проблемы масштабируемости и задержки

По мере увеличения количества внешних источников данных запросы и ранжирование больших массивов данных становятся все более вычислительно трудоемкими. Это приводит к значительным задержкам, что подрывает способность системы предоставлять своевременные ответы в приложениях реального времени.

Пример: в таких чувствительных ко времени средах, как финансовая аналитика или поддержка клиентов в режиме реального времени, задержки, связанные с запросами к нескольким базам данных или работой с большими наборами документов, могут снизить общую полезность системы. Например, задержки при поиске рыночных тенденций в высокочастотной торговле могут привести к упущенным возможностям.

2.5 Агентный RAG: смена парадигмы

Традиционные системы RAG с их статичными рабочими процессами и ограниченной адаптивностью часто не справляются с динамичными, многоступенчатыми рассуждениями и сложными задачами реального мира. Благодаря интеграции автономных агентов, способных принимать динамические решения, проводить итеративные рассуждения и адаптивные стратегии поиска, агентные системы RAG преодолевают присущие им ограничения, сохраняя при этом модульность предыдущих парадигм. Эта эволюция позволяет решать более сложные, многодоменные задачи с повышенной точностью и контекстным пониманием, что делает агентные RAG основой для следующего поколения приложений ИИ. В частности, системы RAG на основе агентов сокращают время ожидания благодаря оптимизированным рабочим процессам и постепенно улучшают результаты, решая проблемы, которые долгое время препятствовали масштабируемости и эффективности традиционных RAG.

3 Основные принципы и контекст агентской разведки

Интеллект агентов лежит в основе агентных систем Retrieval Augmented Generation (RAG), позволяя им выйти за рамки статичности и реактивности традиционных RAG. Благодаря интеграции автономных агентов, способных принимать динамические решения, проводить итеративные рассуждения и создавать совместные рабочие процессы, системы RAG на основе агентов демонстрируют большую адаптивность и точность. В этом разделе рассматриваются основные принципы, лежащие в основе агентного интеллекта.

Компоненты агента ИИ. По сути, агент ИИ состоит из (см. рис. 6):

LLM (с определенными ролями и задачами): Служит основным механизмом рассуждений и диалоговым интерфейсом для агента. Он интерпретирует запросы пользователя, генерирует ответы и поддерживает согласованность.
Память (краткосрочная и долгосрочная): Захват контекста и релевантных данных во время взаимодействия. Кратковременная память [25] отслеживает непосредственное состояние диалога, а долговременная память [25] хранит накопленные знания и опыт агента.
Планирование (рефлексия и самокритика)Направление итеративного процесса рассуждений агента с помощью рефлексии, маршрутизации запросов или самокритики [26] обеспечивает эффективную декомпозицию сложных задач [15].
Инструменты (векторный поиск, веб-поиск, API и т. д.): Расширение возможностей агентов, выходящих за рамки генерации текста, для доступа к внешним ресурсам, данным в реальном времени или специализированным вычислениям.

Рисунок 6: Обзор агентов искусственного интеллекта

3.1 Модель прокси

Паттерны агентов [27, 28] предоставляют структурированные способы управления поведением агентов в системах Retrieval Augmented Generation (RAG), основанных на агентах. Эти паттерны позволяют агентам динамически адаптироваться, планировать и сотрудничать, гарантируя, что система сможет точно и масштабируемо решать сложные реальные задачи. Четыре ключевых паттерна лежат в основе рабочего процесса агентов:

3.1.1 Отражение

Рефлексия - это основополагающий шаблон проектирования рабочего процесса агента, который позволяет ему итеративно оценивать и совершенствовать свои результаты. Интегрируя механизм самообратной связи, агент может выявлять и устранять ошибки, несоответствия и области, требующие улучшения, тем самым повышая эффективность выполнения таких задач, как генерация кода, создание текста и вопросы и ответы (как показано на рисунке 7). На практике рефлексия включает в себя побуждение агента к критике своих результатов с точки зрения правильности, стиля и эффективности, а затем включение этой обратной связи в последующие итерации. Внешние инструменты, такие как модульные тесты или веб-поиск, могут дополнительно улучшить этот процесс, подтверждая результаты и выявляя пробелы.

Рисунок 7: Обзор агентурного "Я Отражение

В многоагентных системах размышления могут включать в себя разные роли, например, один агент генерирует результат, а другой его критикует, что способствует совместному совершенствованию. Например, в юридических исследованиях агенты могут итеративно дорабатывать ответы для обеспечения точности и полноты путем повторного анализа найденных прецедентов. Рефлексия показала значительный прирост производительности в таких исследованиях, как Self-Refine [29], Reflexion [30] и CRITIC [26].

3.1.2 Планирование

Планирование [15] - это ключевой шаблон проектирования рабочих процессов агентов, который позволяет им автономно разбивать сложные задачи на более мелкие и управляемые подзадачи. Эта способность критически важна для многоходовых рассуждений и итеративного решения проблем в динамичных и неопределенных сценариях (как показано на рисунке 8).

Рисунок 8: Обзор агентного планирования

Используя планирование, агенты могут динамически определять последовательность шагов, необходимых для достижения больших целей. Такая адаптивность позволяет агентам решать задачи, которые невозможно определить заранее, обеспечивая гибкость в принятии решений. Несмотря на свои возможности, планирование может давать менее предсказуемые результаты, чем детерминированные рабочие процессы, такие как рефлексия. Планирование особенно хорошо подходит для задач, требующих динамической адаптации, когда заранее определенных рабочих процессов недостаточно. По мере развития технологии ее потенциал для создания инновационных приложений в различных областях будет расти.

3.1.3 Использование инструментов

Использование инструментов позволяет агентам расширять свои возможности, взаимодействуя с внешними инструментами, API или вычислительными ресурсами, как показано на рисунке 9. Эта модель позволяет агенту собирать информацию, выполнять вычисления и манипулировать данными, выходящими за рамки его предварительно обученных знаний. Благодаря динамической интеграции инструментов в рабочий процесс агенты могут адаптироваться к сложным задачам и предоставлять более точные и контекстуально релевантные результаты.

Рисунок 9: Обзор использования инструментов

Современные рабочие процессы агентов интегрируют использование инструментов в различные приложения, включая поиск информации, вычислительные рассуждения и взаимодействие с внешними системами. Реализация этой модели получила значительное развитие с развитием возможностей вызова функций GPT-4 и систем, способных управлять доступом к многочисленным инструментам. Эти разработки способствовали созданию сложных рабочих процессов, в которых агенты могут автономно выбирать и выполнять наиболее подходящие для конкретной задачи инструменты.

Несмотря на то, что использование инструментов значительно улучшило рабочие процессы агентов, остаются проблемы с оптимизацией выбора инструментов, особенно при большом количестве доступных вариантов. Для решения этой проблемы были предложены методы, вдохновленные генерацией с расширенным поиском (RAG), такие как выбор на основе эвристики.

3.1.4 Мультиагент

Совместная работа нескольких агентов [16] - это ключевой шаблон проектирования рабочих процессов агентов, который позволяет специализировать задачи и выполнять параллельную обработку. Агенты взаимодействуют друг с другом и обмениваются промежуточными результатами, обеспечивая эффективность и согласованность всего рабочего процесса. Поручая подзадачи специализированным агентам, этот паттерн улучшает масштабируемость и адаптивность сложных рабочих процессов. Мультиагентные системы позволяют разработчикам разбивать сложные задачи на более мелкие и управляемые подзадачи, которые поручаются разным агентам. Такой подход не только повышает эффективность выполнения задач, но и обеспечивает мощную основу для управления сложными взаимодействиями. Каждый агент обладает собственной памятью и рабочим процессом, который может включать использование инструментов, размышления или планирование, что позволяет динамично и совместно решать проблемы (см. Рисунок 10).

Рисунок 10: Обзор MultiAgent

Хотя совместная работа нескольких агентов обладает огромным потенциалом, это гораздо менее предсказуемая парадигма проектирования, чем более зрелые рабочие процессы, такие как рефлексия и использование инструментов. Тем не менее, новые фреймворки, такие как AutoGen, Crew AI и LangGraph, предлагают новые способы реализации эффективных мультиагентных решений.

Эти паттерны являются краеугольным камнем успеха агентных систем RAG, позволяя им динамически адаптировать рабочие процессы поиска и генерации для удовлетворения требований разнообразных динамичных сред. Используя эти паттерны, агенты могут решать итеративные, контекстно-зависимые задачи, выходящие за рамки возможностей традиционных систем RAG.

4 Классификация агентных систем RAG

Агентные системы поиска с дополненной генерацией (RAG) можно разделить на различные архитектурные структуры в зависимости от их сложности и принципов проектирования. К ним относятся одноагентные архитектуры, многоагентные системы и иерархические агентные архитектуры. Каждая структура направлена на решение конкретных задач и оптимизацию производительности в различных приложениях. В данном разделе приводится подробная классификация этих архитектур с указанием их особенностей, преимуществ и ограничений.

4.1 Одноагентный прокси RAG: маршрутизатор

Одноагентные RAG на основе агентов [31] действуют как централизованная система принятия решений, в которой один агент управляет поиском, маршрутизацией и интеграцией информации (как показано на рисунке 11). Такая архитектура упрощает систему, объединяя эти задачи в одном агенте, что делает ее особенно подходящей для сред с ограниченным количеством инструментов или источников данных.

рабочий процесс

Представление и оценка запросов: Процесс начинается, когда пользователь отправляет запрос. Координирующий агент (или главный поисковый агент) получает запрос и анализирует его, чтобы определить наиболее подходящий источник информации.
Выбор источников знаний: В зависимости от типа запроса координирующий агент выбирает из множества вариантов поиска:
- Структурированная база данныхДля запросов, требующих доступа к табличным данным, система может использовать механизм Text-to-SQL, взаимодействующий с такими базами данных, как PostgreSQL или MySQL.
- семантический поиск: При работе с неструктурированной информацией используется векторный поиск для получения соответствующих документов (например, PDF-файлов, книг, организационных документов).
- Поиск в Интернете: Для получения информации в режиме реального времени или широкой контекстной информации система использует инструменты веб-поиска для доступа к последним данным в Интернете.
- рекомендательная система: Для персонализированных или контекстных запросов система использует рекомендательный механизм для предоставления индивидуальных предложений.
Интеграция данных и синтез LLM: После того как соответствующие данные были получены из выбранного источника, они передаются в большую языковую модель (LLM), которая объединяет собранную информацию, интегрируя сведения из нескольких источников в последовательный и контекстуально релевантный ответ.
Генерация выходного сигнала: Наконец, система генерирует исчерпывающий, ориентированный на пользователя ответ на исходный запрос. Ответ представляется в удобном для действий, лаконичном формате и по желанию включает ссылки или ссылки на использованные источники.

Основные характеристики и преимущества

Централизованная простота: Один агент выполняет все задачи поиска и маршрутизации, что упрощает разработку, внедрение и поддержку архитектуры.
Эффективность и оптимизация ресурсов: При меньшем количестве агентов и более простой координации система требует меньше вычислительных ресурсов и может быстрее обрабатывать запросы.
динамическая маршрутизацияАгент оценивает каждый запрос в реальном времени и выбирает наиболее подходящий источник знаний (например, структурированные базы данных, семантический поиск, веб-поиск).
Универсальность инструментаПоддержка множества источников данных и внешних API, что позволяет поддерживать как структурированные, так и неструктурированные рабочие процессы.
Подходит для простых систем: Для приложений с четко определенными задачами или ограниченными требованиями к интеграции (например, поиск файлов, рабочие процессы на основе SQL).

Рисунок 11: Обзор одноагентных РАГ

Примеры использования: поддержка клиентов
привлекать внимание к чему-л.: Можете ли вы сообщить мне статус доставки моего заказа?
Системные процессы (одноагентный рабочий процесс)::
Представление и оценка запросов::
Пользователь отправляет запрос, который получает координирующий агент.
Координировать работу с агентами для анализа запросов и определения наиболее подходящих источников информации.
Выбор источников знаний::
Получение информации об отслеживании из базы данных управления заказами.
Получайте обновления в режиме реального времени от API курьера.
По желанию можно провести поиск в Интернете, чтобы определить местные условия, влияющие на доставку, например, погоду или логистические задержки.
Интеграция данных и синтез LLM::
Передайте соответствующие данные в LLM, который консолидирует информацию в целостный ответ.
Генерация выходного сигнала::
Система генерирует оперативный и лаконичный ответ, позволяющий в режиме реального времени отслеживать обновления и возможные альтернативы.
отзывчивый::
Комплексное реагирование: Ваша посылка в настоящее время находится в пути и, как ожидается, будет доставлена завтра вечером. Отслеживание UPS в режиме реального времени показывает, что она находится в региональном распределительном центре.

4.2 Многоагентная система RAG

Многоагентная RAG [31] представляет собой модульную и масштабируемую эволюцию одноагентной архитектуры, направленную на обработку сложных процессов и разнообразных типов запросов с помощью нескольких специализированных агентов (как показано на рисунке 12). В отличие от того, чтобы полагаться на одного агента для управления всеми задачами - рассуждениями, поиском и генерацией ответов, - система распределяет обязанности между несколькими агентами, каждый из которых оптимизирован для определенной роли или источника данных.

рабочий процесс

Подача запроса: Процесс начинается с запроса пользователя, который поступает к агенту-координатору или главному поисковому агенту. Этот агент действует как центральный координатор и передает запрос специализированному поисковому агенту в соответствии с требованиями запроса.

Рисунок 12: Обзор многоагентных агентных систем RAG

Специализированные поисковые агентыЗапросы назначаются нескольким поисковым агентам, каждый из которых занимается определенным типом источника данных или задачей. Пример:
- Агент 1: Работа со структурированными запросами, например, взаимодействие с базами данных на основе SQL, такими как PostgreSQL или MySQL.
- Агент 2: Управление семантическим поиском для получения неструктурированных данных из таких источников, как PDF-файлы, книги или внутренние документы.
- Агент 3: Сосредоточьтесь на получении публичной информации в режиме реального времени из веб-поиска или API.
- Агент 4Специализируется на рекомендательных системах, которые предоставляют контекстно-значимые предложения, основанные на поведении или профилях пользователей.
Доступ к инструментам и поиск данныхКаждый агент направляет запрос к соответствующему инструменту или источнику данных в своем домене, например:
- векторный поиск: для семантической релевантности.
- Преобразование текста в SQL: Для структурированных данных.
- Поиск в Интернете: Для информирования общественности в режиме реального времени.
- API: Для доступа к внешним службам или собственным системам.

Процесс поиска выполняется параллельно, что позволяет эффективно обрабатывать различные типы запросов.

Интеграция данных и синтез LLMПосле завершения поиска все данные агента передаются в большую языковую модель (LLM), которая объединяет полученную информацию в последовательный и контекстуально релевантный ответ, легко интегрирующий сведения из нескольких источников.
Генерация выходного сигнала: Система генерирует исчерпывающий ответ, который передается пользователю в удобном для действий, лаконичном формате.

Основные характеристики и преимущества

МодулированиеКаждый агент работает независимо, что позволяет плавно добавлять или удалять агентов в зависимости от требований системы.
масштабируемостьПараллельная обработка нескольких агентов позволяет системе эффективно обрабатывать большие объемы запросов.
Специализация задачКаждый агент оптимизирован для определенного типа запроса или источника данных, что повышает точность и релевантность поиска.
эффективность: Поручая задания специальным агентам, система минимизирует узкие места и повышает производительность сложных рабочих процессов.
универсальность: Для применения в различных областях, включая исследования, анализ, принятие решений и поддержку клиентов.

вызов

Сложность координации: Управление межагентным общением и делегированием задач требует сложных механизмов координации.
вычислительные затратыПараллельная обработка нескольких агентов может увеличить расход ресурсов.
интеграция данных: Интегрировать результаты, полученные из разных источников, в согласованный ответ нелегко, и для этого требуются передовые возможности LLM.

Пример использования: многопрофильный научный ассистент
привлекать внимание к чему-л.: Каковы экономические и экологические последствия внедрения возобновляемых источников энергии в Европе?
Системные процессы (мультиагентный рабочий процесс)::
Агент 1: Получение статистических данных из экономической базы данных с помощью SQL-запросов.
Агент 2: Поиск релевантных научных статей с помощью инструментов семантического поиска.
Агент 3: Проведите веб-поиск последних новостей и обновлений политики в области возобновляемых источников энергии.
Агент 4: Обратитесь к реферальной системе, чтобы предложить соответствующий контент, например отчеты или комментарии экспертов.
отзывчивый::
Комплексное реагирование:: "Внедрение возобновляемых источников энергии в Европе привело к сокращению выбросов парниковых газов на 20% за последнее десятилетие, говорится в докладе о политике ЕС. Что касается экономики, то инвестиции в возобновляемые источники энергии позволили создать около 1,2 миллиона рабочих мест, причем значительный рост наблюдается в секторах солнечной и ветровой энергетики. Последние научные исследования также выявили потенциальные компромиссы с точки зрения стабильности энергосистемы и стоимости хранения энергии".

4.3 Иерархическая система RAG на основе агентов

Иерархическая агентная система RAG [17] использует структурированный, многоуровневый подход к поиску и обработке информации, что повышает эффективность и стратегическое принятие решений (как показано на рисунке 13). Агенты организованы в иерархическую структуру, при этом агенты более высокого уровня контролируют и направляют агентов более низкого уровня. Такая структура позволяет принимать многоуровневые решения и гарантирует, что запросы будут обрабатываться наиболее подходящими ресурсами.

Рисунок 13: Иллюстрация иерархического агентского RAG

рабочий процесс

Квитанция об оплате запроса: Пользователь отправляет запрос, который получает агент верхнего уровня, отвечающий за первоначальную оценку и ввод в эксплуатацию.
принятие стратегических решений: Агент верхнего уровня оценивает сложность запроса и решает, каким подчиненным агентам или источникам данных отдать предпочтение. В зависимости от области запроса определенные базы данных, API или инструменты поиска могут считаться более надежными или релевантными.
Делегирование полномочий подчиненномуАгенты верхнего уровня назначают задания агентам нижнего уровня, которые специализируются на определенных методах поиска (например, базы данных SQL, веб-поиск или собственные системы). Эти агенты выполняют поставленные перед ними задачи независимо друг от друга.
Полимеризация и синтезАгенты высокого уровня собирают и интегрируют результаты, полученные от подчиненных агентов, объединяя информацию в согласованные ответы.
Ответная доставка: Окончательный, обобщенный ответ возвращается пользователю, гарантируя, что ответ является полным и контекстуально релевантным.

Основные характеристики и преимущества

Расстановка стратегических приоритетовАгенты верхнего уровня могут определять приоритеты источников данных или задач на основе сложности запросов, надежности или контекста.
масштабируемостьНазначение задач нескольким уровням агентов позволяет обрабатывать очень сложные или многогранные запросы.
Расширение возможностей для принятия решений:: Высокопоставленные агенты осуществляют стратегический надзор для повышения общей точности и последовательности реагирования.

вызов

Сложность координации: Поддержание надежной межагентной связи на нескольких уровнях может увеличить затраты на координацию.
Распределение ресурсов: Нелегко эффективно распределить задачи между уровнями, избегая при этом узких мест.

Пример использования: система финансового анализа
привлекать внимание к чему-л.: Каковы варианты инвестиций в возобновляемые источники энергии с учетом текущих рыночных тенденций?
Системные процессы (Hierarchical Agent Workflow)::
агент на вершине иерархии: Оцените сложность запросов и отдайте предпочтение надежным финансовым базам данных и экономическим показателям перед менее проверенными источниками данных.
Агенты среднего звена: Получение рыночных данных в режиме реального времени (например, цен на акции, показателей отрасли) из собственных API и структурированных баз данных SQL.
Агенты низкого уровняПоиск в Интернете последних объявлений и политики, а также обращение к справочным системам для отслеживания мнений экспертов и анализа новостей.
Полимеризация и синтез: Результаты агрегирования прокси на верхнем уровне, объединяющие количественные данные с политическими соображениями.
отзывчивый::
Комплексное реагирование: "Согласно текущим рыночным данным, за последний квартал акции возобновляемых источников энергии выросли на 15%, что обусловлено в первую очередь благоприятной государственной политикой и высоким интересом инвесторов. Аналитики считают, что ветряной и солнечный секторы, вероятно, продолжат набирать обороты, в то время как новые технологии, такие как "зеленый водород", имеют умеренный риск, но могут предложить высокую доходность."

4.4 Корректирующий RAG по доверенности

Corrective RAG [32] [33] предоставляет возможность самокоррекции результатов поиска, повышая эффективность использования документов и улучшая качество генерации ответов (как показано на рис. 14). Встраивая интеллектуальные агенты в рабочий процесс, Corrective RAG [32] [33] обеспечивает итеративное уточнение контекстных документов и ответов для минимизации ошибок и максимизации релевантности.

Рисунок 14: Обзор агентурно-корректирующего RAG

Корректировка основной идеи RAG: Основной принцип Corrective RAG заключается в его способности динамически оценивать полученные документы, выполнять корректирующие действия и уточнять запрос для повышения качества генерируемого ответа. Корректирующий RAG настраивает свою методологию следующим образом:

Оценка актуальности документов: Полученные документы оцениваются агентом оценки релевантности. Документы ниже порога релевантности запускают шаг коррекции.
Уточнение и расширение запросов: Запросы уточняются агентом для уточнения запросов, который использует семантическое понимание для оптимизации поиска для получения лучших результатов.
Динамическое извлечение информации из внешних источниковЕсли контекст недостаточен, внешний агент поиска знаний выполняет поиск в Интернете или обращается к альтернативным источникам данных, чтобы дополнить найденные документы.
синтез ответа: Вся проверенная и уточненная информация передается агенту синтеза ответов для окончательного формирования ответа.

рабочий процесс: Система Corrective RAG построена на пяти ключевых агентах:

агент контекстного поиска: Отвечает за извлечение исходного контекстного документа из базы данных векторов.
Агент оценки релевантностиОценка релевантности найденных документов и пометка любых нерелевантных или двусмысленных документов для принятия корректирующих мер.
Агент для уточнения запросов: Переписывание запросов для повышения эффективности поиска и использование семантического понимания для оптимизации результатов.
Внешний агент поиска знанийВыполнять поиск в Интернете или обращаться к альтернативным источникам данных, когда контекстной документации недостаточно.
Агент синтеза ответа: Интегрируйте всю подтвержденную информацию в последовательный и точный ответ.

Основные характеристики и преимущества:

Итеративная коррекцияОбеспечьте высокую точность ответа, динамически определяя и исправляя нерелевантные или неоднозначные результаты поиска.
Динамическая адаптация: Интеграция веб-поиска в реальном времени и уточнения запросов для повышения точности поиска.
Модульный прокси-серверКаждый агент выполняет специализированные задачи для обеспечения эффективной и масштабируемой работы.
Фактические гарантииКорректировка RAG сводит к минимуму риск галлюцинаций или дезинформации, проверяя все найденное и созданное содержимое.

Пример использования: научный сотрудник
привлекать внимание к чему-л.: Каковы последние результаты исследований в области генеративного ИИ?
Системные процессы (исправление рабочих процессов RAG)::
Подача запроса: Пользователи отправляют запросы в систему.
контекстный поиск::
агент контекстного поискаИзвлеките исходные документы из базы данных опубликованных работ по генеративному ИИ.
Найденные документы передаются на следующий этап для оценки.
Оценка актуальности:
Агент оценки релевантностиОцените соответствие между документом и запросом.
Классифицируйте документы как релевантные, неоднозначные или нерелевантные. Неактуальные документы помечаются для принятия корректирующих мер.
Корректирующие действия (при необходимости):
Агент для уточнения запросовПереписывание запросов для повышения их конкретности.
Внешний агент поиска знанийПроведите веб-поиск, чтобы получить дополнительные документы и отчеты из внешних источников.
Синтез ответов.
Агент синтеза ответаИнтегрируйте проверенные документы во всесторонние и подробные резюме.
Ответ.
Комплексное реагирование: "Последние результаты исследований в области генеративного ИИ включают диффузионные модели, обучение с подкреплением в задачах "текст-видео", а также достижения в области методов оптимизации для обучения крупномасштабных моделей. Более подробную информацию можно найти в исследованиях, представленных на NeurIPS 2024 и AAAI 2025."

4.5 Адаптивный агентный RAG

Адаптивный поиск с расширенной генерацией (Adaptive RAG) [34] повышает гибкость и эффективность больших языковых моделей (LLM), динамически адаптируя стратегию обработки запроса в зависимости от сложности входящего запроса. В отличие от статических процессов поиска, в Adaptive RAG [35] используются классификаторы для анализа сложности запроса и определения наиболее подходящего подхода - от одноэтапного поиска до многоэтапного рассуждения или даже полного обхода поиска для простых запросов, как показано на рисунке 15.

Рисунок 15: Обзор адаптивной агентурной RAG

Основная идея адаптивного RAG Основной принцип адаптивного RAG заключается в его способности динамически корректировать стратегию поиска в зависимости от сложности запроса. Адаптивный RAG настраивает свой метод следующим образом:

простой запрос:: Для фактических вопросов, требующих дополнительного поиска (например, "Какова температура кипения воды?") : Для фактических вопросов, требующих дополнительного поиска (например, "Какова температура кипения воды?"), система генерирует ответы напрямую, используя уже имеющиеся знания.
простой запрос:: Для умеренно сложных задач, требующих минимального контекста (например, "Как обстоят дела с моим последним счетом за электричество?") , система выполняет одношаговый поиск для получения соответствующих сведений.
сложный запрос:: Для многоуровневых запросов, требующих итеративного рассуждения (например, "Как изменилось население города X за последнее десятилетие и какие факторы этому способствовали?"). , система использует многоступенчатый поиск, постепенно уточняя промежуточные результаты для получения исчерпывающих ответов.

рабочий процесс: Система Adaptive RAG построена на трех основных компонентах:

Роль сортировщика.
- Небольшая языковая модель анализирует запросы, чтобы предсказать их сложность.
- Классификатор обучается с помощью автоматически маркированных наборов данных, полученных из прошлых результатов моделирования и шаблонов запросов.
Динамический выбор стратегии.
- Для простых запросов система избегает лишних поисков и генерирует ответы непосредственно с помощью LLM.
- Для простых запросов он использует одноэтапный процесс поиска для получения релевантного контекста.
- Для сложных запросов он активирует многоступенчатый поиск, чтобы обеспечить итеративное уточнение и расширенное рассуждение.
Интеграция LLM.
- LLM объединяет полученную информацию в целостный ответ.
- Итерационное взаимодействие между LLM и классификатором позволяет уточнять сложные запросы.

Основные характеристики и преимущества.

Динамическая адаптация:: Адаптация стратегий поиска к сложности запроса для оптимизации вычислительной эффективности и точности ответа.
Эффективность использования ресурсов:: Минимизация ненужных накладных расходов при выполнении простых запросов и обеспечение тщательной обработки сложных запросов.
Повышенная точность:: Итеративное уточнение обеспечивает высокую точность решения сложных запросов.
ловкость: Может быть расширен для интеграции дополнительных путей, таких как специфические для домена инструменты или внешние API.

Примеры использования. Помощник по поддержке клиентов
Совет. Почему моя посылка задерживается и какие у меня есть варианты?
Системные процессы (Adaptive RAG Workflow).
Категория запроса.
Классификатор анализирует запрос и определяет, что это сложный запрос, требующий многоэтапных рассуждений.
Динамический выбор стратегии.
Система активирует многоступенчатый процесс поиска, основанный на классификации сложности.
Многоступенчатый поиск.
Получение информации об отслеживании из базы данных заказов.
Получайте обновления статуса в режиме реального времени от API Courier.
Проведите веб-поиск, чтобы узнать о внешних факторах, таких как погодные условия или местные перебои в работе.
Синтез ответов.
LLM объединяет всю полученную информацию в единый комплексный ответ, позволяющий действовать.
Ответ.
Комплексное реагирование: "Ваша посылка была задержана из-за неблагоприятных погодных условий в вашем регионе. В настоящее время она находится в местном распределительном центре и, как ожидается, будет доставлена в течение 2 дней. В качестве альтернативы вы можете забрать ее из центра".

4.6 Агентные РАГ на основе графов

4.6.1 Agent-G: основанная на агентах структура для графовых RAG

Agent-G [8] представляет инновационную архитектуру на основе агентов, которая объединяет базы знаний графов с поиском неструктурированных документов. Объединяя структурированные и неструктурированные источники данных, эта структура повышает точность рассуждений и поиска в системах Retrieval Augmented Generation (RAG). В ней используются модульные библиотеки ретриверов, динамическое взаимодействие агентов и контуры обратной связи для обеспечения высокого качества результатов, как показано на рисунке 16.

Рисунок 16: Обзор Agent-G: агентная структура для графического RAG

Основная идея Agent-G Основной принцип Agent-G заключается в возможности динамического распределения поисковых задач между специализированными агентами, использующими базы знаний графов и текстовые файлы. Agent-G адаптирует свои поисковые стратегии следующим образом:

графическая база знанийИспользование структурированных данных для извлечения отношений, иерархий и связей (например, сопоставление болезни и симптомов в медицинской области).
неструктурированный документ:: Традиционные системы поиска по тексту предоставляют контекстную информацию, дополняющую данные графа.
Модуль "Критика:: Оценка релевантности и качества полученной информации для обеспечения соответствия запросу.
петля обратной связи:: Уточнение поиска и синтеза с помощью итеративной проверки и повторных запросов.

рабочий процессСистема : Agent-G состоит из четырех основных компонентов:

Библиотека ретривера.
- Набор модульных агентов, специализирующихся на поиске данных на основе графов или неструктурированных данных.
- Агент динамически выбирает релевантные источники, основываясь на требованиях запроса.
Модуль критики.
- Проверьте релевантность и качество полученных данных.
- Отметьте результаты с низким уровнем доверия для повторного поиска или уточнения.
Динамическое взаимодействие агентов.
- Агенты, выполняющие конкретные задачи, взаимодействуют между собой для интеграции различных типов данных.
- Обеспечьте согласованный поиск и синтез между рисунками и текстовыми источниками.
Интеграция LLM.
- Обобщите проверенные данные и составьте целостный ответ.
- Итеративная обратная связь от модуля критики обеспечивает согласование с целью запроса.

Основные характеристики и преимущества.

улучшенное мышление: Объедините структурированные отношения на диаграмме с контекстной информацией из неструктурированных документов.
Динамическая адаптация:: Динамическая адаптация стратегий поиска к требованиям запросов.
Повышенная точность: Модуль "Критика" снижает риск появления в ответе неактуальных или некачественных данных.
Масштабируемая модульность:: Поддержка добавления новых агентов для выполнения специализированных задач для повышения масштабируемости.

Примеры использования: медицинская диагностика
Совет. Каковы общие симптомы диабета 2-го типа и как они связаны с болезнями сердца?
Системные процессы (Agent-G Workflow).
Получение и распределение запросов:: Система получает запросы и определяет необходимость использования как граф-структурированных, так и неструктурированных данных для полного ответа на вопрос.
Поисковик диаграмм.
Извлечение взаимосвязи между диабетом 2-го типа и болезнями сердца из графа медицинских знаний.
Определите общие факторы риска, такие как ожирение и гипертония, изучив иерархию графиков и взаимосвязи.
Ретривер документов.
Найдите в медицинской литературе описания симптомов диабета 2-го типа (например, повышенная жажда, частое мочеиспускание, усталость).
Добавьте контекстную информацию, чтобы дополнить выводы на основе графиков.
Модуль критики.
Оцените релевантность и качество найденных данных графиков и документов.
Отметьте результаты с низким уровнем доверия для уточнения или повторного запроса.
синтез ответа:: LLM объединяет данные проверки от ретривера графов и ретривера документов в целостный ответ, обеспечивая соответствие намерениям запроса.
Ответ.
Комплексное реагирование: "Симптомы диабета 2-го типа включают повышенную жажду, частое мочеиспускание и усталость. Исследования показали 50% взаимосвязь между диабетом и сердечно-сосудистыми заболеваниями, в первую очередь благодаря общим факторам риска, таким как ожирение и высокое кровяное давление."

4.6.2 GeAR: Агент расширения графа для генерации дополнений к поисковой выдаче

GeAR [36] представляет собой агент-ориентированную структуру, которая расширяет традиционные системы поиска с расширенным поколением (RAG) за счет интеграции механизмов поиска на основе графов. Используя методы расширения графов и архитектуру на основе агентов, GeAR решает проблемы многоходовых сценариев поиска и улучшает способность системы обрабатывать сложные запросы, как показано на рисунке 17.

Рисунок 17: Обзор GeAR: Graph-Enhanced Agent for Retrieval-Augmented Generation[36].

Основная идея GeAR GeAR улучшает показатели RAG благодаря двум ключевым инновациям:

графическое расширение: Улучшает традиционные базовые ретриверы (например, BM25), расширяя процесс поиска за счет включения данных с графовой структурой, что позволяет системе улавливать сложные связи и зависимости между сущностями.
прокси-фреймворк: Интегрирует архитектуру на основе агентов, которая использует расширения графов для более эффективного управления задачами поиска, позволяя динамически и автономно принимать решения в процессе поиска.

рабочий процесс: Система GeAR функционирует благодаря следующим компонентам:

Рисунок Модуль расширения.
- Интеграция данных на основе графов в процесс поиска позволяет системе учитывать взаимосвязи между объектами в процессе поиска.
- Расширение возможностей базового поисковика по обработке многоходовых запросов за счет включения в пространство поиска связанных сущностей.
Агентный поиск.
- Для управления процессом поиска используется система агентов, позволяющая им динамически выбирать и комбинировать стратегии поиска в зависимости от сложности запроса.
- Агенты могут автономно выбирать путь поиска, используя расширения графа для повышения релевантности и точности найденной информации.
Интеграция LLM.
- Объединение полученной информации с преимуществами расширения графов с возможностями моделирования большого языка (LLM) для создания последовательных и контекстуально релевантных ответов.
- Благодаря такой интеграции процесс генерации вдохновляется как неструктурированными документами, так и структурированными графовыми данными.

Основные характеристики и преимущества.

Улучшенный многоходовый поиск:: Графовые расширения GeAR позволяют системе обрабатывать сложные запросы, требующие рассуждений о множестве взаимосвязанных частей информации.
Принятие решений по доверенности: Прокси-фреймворк позволяет динамически и автономно выбирать стратегии поиска, повышая эффективность и релевантность.
Повышенная точность:: Благодаря интеграции структурированных графовых данных GeAR повышает точность поиска информации и генерирует более точные и контекстуально подходящие ответы.
масштабируемостьМодульная структура агента позволяет интегрировать дополнительные стратегии поиска и источники данных по мере необходимости.

Пример использования: многоходовая викторина
Совет. Кто повлиял на наставника Дж. К. Роулинг?
Системные процессы (GeAR Workflow).
агент на вершине иерархии: Оцените многоходовую природу запроса и определите необходимость сочетания расширения графа и поиска документов для ответа на вопрос.
Рисунок Модуль расширения.
Определите наставника Дж. К. Роулинг как ключевую сущность в запросе.
Проследите литературное влияние наставников, изучив данные структуры "Карта литературных связей".
Агентный поиск.
Агент автономно выбирает расширенный графом путь поиска, чтобы собрать необходимую информацию о влиянии наставника.
Включение дополнительного контекста для получения неструктурированной информации о наставниках и их влиянии с помощью запросов к текстовым источникам данных.
синтез ответа: Используйте LLM для объединения информации, полученной из графа и процесса поиска документов, чтобы сгенерировать ответ, который точно отражает сложные взаимосвязи в запросе.
Ответ.
Комплексное реагирование: "Наставник Дж. К. Роулинг, [имя наставника], испытал сильное влияние [имя автора], который известен своими [известными произведениями или жанром]. Эта связь подчеркивает каскадные связи в истории литературы, где влиятельные идеи часто передаются через несколько поколений писателей".

4.7 Агентские документообороты в агентских РАГ

Агентские документообороты (ADW)[37] расширяет традиционную парадигму Retrieval Augmented Generation (RAG), автоматизируя сквозную работу со знаниями. Эти рабочие процессы организуют сложные документо-ориентированные процессы, которые объединяют разбор документов, поиск, рассуждения и структурированный вывод с помощью интеллектуальных агентов (см. рис. 18). Системы ADW устраняют ограничения интеллектуальной обработки документов (IDP) и RAG, поддерживая состояние, организуя многоэтапные рабочие процессы и применяя специфическую для области логику к документам.

рабочий процесс

Разбор документов и структурирование информации::
- Используйте инструменты корпоративного уровня (например, LlamaParse) для анализа документов с целью извлечения соответствующих полей данных, таких как номера счетов, даты, информация о поставщиках, проводки и условия оплаты.
- Организуйте структурированные данные для последующей обработки.
Межпроцессное поддержание состояния::
- Система поддерживает состояние контекста документа, обеспечивая согласованность и релевантность в многоступенчатых рабочих процессах.
- Отслеживайте прохождение документов через различные этапы обработки.
поиск знаний::
- Получение релевантных ссылок из внешних баз знаний (например, LlamaCloud) или векторных индексов.
- Получайте в режиме реального времени рекомендации по конкретным областям для принятия решений.
Планирование на основе агентов::
- Интеллектуальные агенты применяют бизнес-правила, выполняют многоходовые рассуждения и генерируют действенные рекомендации.
- Организуйте работу таких компонентов, как парсеры, ретриверы и внешние API, чтобы обеспечить бесшовную интеграцию.
Формирование практических результатов::
- Выходные данные представлены в структурированном формате, адаптированном к конкретным случаям использования.
- Обобщение рекомендаций и извлеченных идей в краткие отчеты, пригодные для практического применения.

Рисунок 18: Обзор агентных документооборотов (ADW) [37].

Пример использования: рабочий процесс оплаты счетов-фактур
привлекать внимание к чему-л.: Создайте отчет о рекомендациях по оплате на основе представленных счетов и соответствующих условий договора с поставщиком.
Системные процессы (рабочий процесс ADW)::
Разбор счетов-фактур для извлечения ключевых деталей, таких как номер счета, дата, информация о поставщике, проводки и условия оплаты.
Получите соответствующие контракты с поставщиками, чтобы проверить условия оплаты и определить любые применимые скидки или требования к соответствию.
Сформируйте отчет с рекомендациями по оплате, включающий первоначальную сумму к оплате, возможные скидки за досрочную оплату, анализ влияния на бюджет и стратегические действия по оплате.
отзывчивый: Консолидированный ответ: "Счет INV-2025-045 на сумму $15,000.00 был обработан. При оплате до 2025-04-10 предоставляется скидка за досрочную оплату в размере 2%, что уменьшает сумму к оплате до $14,700.00. Поскольку промежуточный итог превышает $10,000.00, была применена скидка за оптовый заказ в размере 5%. Рекомендуется одобрить досрочную оплату, чтобы сэкономить 21 т.р. и обеспечить своевременное выделение средств на предстоящие этапы проекта."

Основные характеристики и преимущества

Поддержание состояния: Отслеживайте контекст документа и этапы рабочего процесса, чтобы обеспечить согласованность всех процессов.
многошаговое программирование: Работа со сложными рабочими процессами, включающими множество компонентов и внешних инструментов.
Интеллект, специфичный для конкретной областиПрименяйте разработанные бизнес-правила и рекомендации для получения точных рекомендаций.
масштабируемость: Поддержка крупномасштабной обработки документов с модульной и динамической интеграцией агентов.
Повышение производительностиАвтоматизация повторяющихся задач при одновременном повышении компетентности человека в принятии решений.

4.8 Сравнительный анализ агент-ориентированных систем RAG

В таблице 2 представлен всесторонний сравнительный анализ трех архитектурных схем: традиционной RAG, агентной RAG и агентного документооборота (ADW). Анализ подчеркивает их сильные и слабые стороны, а также оптимальные сценарии, что дает ценную информацию для применения в различных случаях.

Таблица 2: Сравнительный анализ: традиционный RAG против агентного RAG против агентного документооборота (ADW)

характеристика	Традиционный RAG	Прокси RAG	Документооборот на основе агентов (ADW)
пересчет (например, результатов выборов)	Изолированные задачи поиска и генерации	Совместная работа нескольких агентов и рассуждения	Ориентированные на документы сквозные рабочие процессы
Поддержание контекста	ограничения	Реализация с помощью модулей памяти	Поддержание статуса в многоступенчатом рабочем процессе
Динамическая адаптация	минимальный	ваш (почетный)	Приспособление к документообороту
Организация рабочего процесса	хиатус	Организация мультиагентных задач	Интегрированная многоступенчатая обработка документов
Использование внешних инструментов/API	Базовая интеграция (например, инструменты поиска)	Расширение с помощью инструментов (например, API и баз знаний)	Глубокая интеграция с бизнес-правилами и инструментами для конкретных областей
масштабируемость	Ограничивается небольшими наборами данных или запросами	Масштабируемая мультиагентная система	Масштабируемые многопрофильные рабочие процессы в масштабах предприятия
сложное умозаключение	Базовый (например, простая викторина)	Многоступенчатые рассуждения с использованием агентов	Структурированные рассуждения по документам
основное применение	Система вопросов и ответов, поиск знаний	Мультидисциплинарные знания и рассуждения	Проверка контрактов, обработка счетов, анализ претензий
доминирование	Простая и быстрая настройка	Высокая точность, совместные рассуждения	Сплошная автоматизация, интеллектуальные возможности для конкретных областей
вызов	Плохое понимание контекста	Сложность координации	Накладные расходы ресурсов, стандартизация месторождений

Сравнительный анализ показывает эволюционную траекторию от традиционной RAG к агентной RAG и агентному документообороту (ADW). В то время как традиционная RAG предлагает преимущества простоты и легкости развертывания для базовых задач, агентная RAG обеспечивает расширенные возможности рассуждений и масштабируемость за счет взаимодействия нескольких агентов. ADW опирается на эти достижения, предоставляя надежные, ориентированные на документы рабочие процессы, которые облегчают сквозную автоматизацию и интеграцию с процессами, специфичными для конкретной области. Понимание сильных сторон и ограничений каждого фреймворка имеет решающее значение для выбора архитектуры, которая наилучшим образом соответствует конкретным потребностям приложений и операционным требованиям.

5 Применение прокси RAG

Агентные системы поиска и дополненного генерирования (RAG) демонстрируют преобразующий потенциал в различных областях. Сочетая поиск данных в реальном времени, генеративные возможности и автономное принятие решений, эти системы решают сложные, динамичные и мультимодальные задачи. В этом разделе рассматриваются ключевые приложения RAG на основе агентов, подробно описывается, как эти системы формируют такие области, как поддержка клиентов, здравоохранение, финансы, образование, юридические процессы и творческие индустрии.

5.1 Поддержка клиентов и виртуальные помощники

Системы RAG на основе агентов революционизируют систему поддержки клиентов, позволяя решать вопросы в режиме реального времени с учетом контекста. Традиционные чат-боты и виртуальные помощники часто опираются на статичные базы знаний, что приводит к получению общих или устаревших ответов. В отличие от них, системы RAG на основе агентов динамически извлекают наиболее релевантную информацию, адаптируются к контексту пользователя и генерируют персонализированные ответы.

Пример использования: повышение продаж рекламы в Twitch [38]

Например, для оптимизации продаж рекламы Twitch использует агентский стиль работы с RAG на Amazon Bedrock. Система динамически извлекает данные о рекламодателях, исторические показатели кампаний и статистику аудитории для создания подробных рекламных предложений, что значительно повышает эффективность работы.

Ключевые преимущества:

Повышение качества ответов: Персонализированные и контекстуально релевантные ответы повышают вовлеченность пользователей.
Операционная эффективность: Снижение нагрузки на агентов службы поддержки, работающих вручную, за счет автоматизации сложных запросов.
Возможность адаптации в режиме реального времениДинамическая интеграция изменяющихся данных, таких как перебои в обслуживании в режиме реального времени или обновление цен.

5.2 Медицинское лечение и персонализированная медицина

В здравоохранении сочетание данных о конкретном пациенте с последними медицинскими исследованиями имеет решающее значение для принятия обоснованных решений. Агентные системы RAG позволяют добиться этого, получая в режиме реального времени клинические рекомендации, медицинскую литературу и истории болезни пациентов, чтобы помочь врачам в диагностике и планировании лечения.

Примеры использования: краткое описание случаев с пациентами [39]

Агентные системы RAG применяются для составления кратких историй болезни пациентов. Например, интегрируя электронные медицинские карты (ЭМК) и современную медицинскую литературу, система генерирует исчерпывающие резюме для врачей, чтобы они могли быстрее принимать более обоснованные решения.

Ключевые преимущества:

Индивидуальный уход: Адаптация рекомендаций к потребностям отдельных пациентов.
эффективность использования времени: Упростите поиск нужных исследований и сэкономьте драгоценное время медицинских работников.
точность: Убедитесь, что рекомендации основаны на новейших доказательствах и параметрах, учитывающих особенности пациента.

5.3 Юридический и договорной анализ

Системы RAG, основанные на агентах, пересматривают способы выполнения юридических процессов, предоставляя инструменты для быстрого анализа документов и принятия решений.

Примеры использования: проверка договоров [40]

Система RAG в стиле юридического агента анализирует контракты, извлекает ключевые положения и выявляет потенциальные риски. Сочетая возможности семантического поиска и отображения юридических знаний, она автоматизирует громоздкий процесс проверки договоров, обеспечивая соблюдение требований и снижая риски.

Ключевые преимущества:

выявление рисков: Автоматически отмечает пункты, отклоняющиеся от стандартных.
эффективность: Сокращение времени, затрачиваемого на процесс рассмотрения контрактов.
масштабируемость: Одновременная работа с большим количеством контрактов.

5.4 Анализ финансов и рисков

Агентные системы RAG меняют финансовую индустрию, предоставляя информацию в режиме реального времени для принятия инвестиционных решений, анализа рынка и управления рисками. Эти системы объединяют потоки данных в реальном времени, исторические тенденции и прогнозное моделирование для получения действенных результатов.

Примеры использования: обработка претензий по автострахованию [41]

В автостраховании агентская система RAG автоматизирует обработку претензий. Например, получая данные о полисе и объединяя их с данными о ДТП, он генерирует рекомендации по страховым случаям, обеспечивая при этом соблюдение нормативных требований.

Ключевые преимущества:

анализ в реальном времени: Предоставляет информацию, основанную на рыночных данных в режиме реального времени.
Снижение рисков: Выявление потенциальных рисков с помощью предиктивной аналитики и многоступенчатых рассуждений.
Расширение возможностей для принятия решенийСочетание исторических данных и данных реального времени для разработки комплексной стратегии.

5.5 Образование

Образование - еще одна область, в которой агентные системы RAG добились значительных успехов. Эти системы обеспечивают адаптивное обучение, генерируя объяснения, учебные материалы и обратную связь, которые адаптируются к прогрессу и предпочтениям ученика.

Примеры использования: создание исследовательских работ [42]

В высших учебных заведениях RAG на основе агентов используется для помощи исследователям, синтезируя ключевые результаты из нескольких источников. Например, исследователи, задающие вопрос "Каковы последние достижения в области квантовых вычислений?" получат краткое резюме со ссылками, что повысит качество и эффективность их работы.

Ключевые преимущества:

Индивидуальные учебные программы: Адаптируйте содержание к потребностям и уровню успеваемости отдельных учеников.
Увлекательное взаимодействие: Обеспечьте интерактивные объяснения и индивидуальную обратную связь.
масштабируемость: Поддерживает широкомасштабное развертывание для различных образовательных сред.

5.6 Приложения для улучшения графиков в мультимодальных рабочих процессах

Graph Enhanced Agent-based RAG (GEAR) сочетает в себе графовые структуры и механизмы поиска и особенно эффективен в мультимодальных рабочих процессах, где взаимосвязанные источники данных имеют решающее значение.

Пример использования: проведение маркетинговых исследований

GEAR способен синтезировать текст, изображения и видео для использования в маркетинговых кампаниях. Например, запрос "Каковы новые тенденции в производстве экологически чистых продуктов?" генерирует подробный отчет с предпочтениями покупателей, анализом конкурентов и мультимедийным контентом.

Ключевые преимущества:

мультимодальные возможности: Интеграция текстовых, графических и видеоданных для получения комплексного результата.
Повышенная креативность: Генерировать инновационные идеи и решения в области маркетинга и развлечений.
Динамическая адаптацияАдаптация к меняющимся тенденциям рынка и потребностям клиентов.

Агентные системы RAG используются в широком спектре приложений, демонстрируя свою универсальность и трансформационный потенциал. От персонализированной поддержки клиентов до адаптивного образования и мультимодальных рабочих процессов с использованием графов - эти системы решают сложные, динамичные и наукоемкие задачи. Благодаря интеграции поискового, генеративного и агентного интеллекта системы RAG на основе агентов прокладывают путь к следующему поколению приложений ИИ.

6 Инструменты и структуры для агентных RAG

Агентные системы поиска и генерации (RAG) представляют собой значительную эволюцию в объединении поиска, генерации и интеллекта агентов. Эти системы расширяют возможности традиционных RAG за счет интеграции принятия решений, реконструкции запросов и адаптивных рабочих процессов. Следующие инструменты и фреймворки обеспечивают мощную поддержку для разработки агентных систем RAG, которые отвечают сложным требованиям реальных приложений.

Ключевые инструменты и рамки:

LangChain и LangGraphLangChain [43] предоставляет модульные компоненты для построения конвейеров RAG, легко интегрируя ретриверы, генераторы и внешние инструменты. LangGraph дополняет его, представляя процессы на основе графов, которые поддерживают циклы, сохранение состояния и взаимодействие человека и компьютера, что позволяет создавать сложные механизмы оркестровки и самокоррекции в агентных системах.
LlamaIndex[44] Агентный документооборот (ADW) компании LlamaIndex обеспечивает сквозную автоматизацию обработки документов, поиска и структурированных рассуждений. Она представляет собой архитектуру мета-агентов, в которой субагенты управляют меньшими наборами документов, а такие задачи, как анализ соответствия и контекстное понимание, координируются через агентов верхнего уровня.
Трансформеры с обнимающимися лицами и QdrantВ проекте : Hugging Face [45] представлены предварительно обученные модели для задач встраивания и генерации, а в проекте Qdrant [46] рабочий процесс поиска дополнен возможностями адаптивного векторного поиска, позволяющего агентам оптимизировать производительность путем динамического переключения между методами разреженных и плотных векторов.
CrewAI и AutoGencrewAI [47] поддерживает иерархические и последовательные процессы, мощные системы памяти и интеграцию инструментов. ag2 [48] (ранее известная как AutoGen [49, 50]) отличается превосходной совместной работой с несколькими агентами благодаря усовершенствованной генерации кода, выполнению инструментов и поддержке принятия решений.
OpenAI Swarm Framework: образовательный фреймворк, разработанный для обеспечения эргономичной, легкой мультиагентной оркестровки [51] с акцентом на автономность агентов и структурированное сотрудничество.
Агентный RAG с вершинным искусственным интеллектомVertex AI [52], разработанный компанией Google, легко интегрируется с агентной системой Retrieval Augmentation Generation (RAG), обеспечивая платформу для создания, развертывания и масштабирования моделей машинного обучения, используя при этом передовые возможности ИИ для создания мощных, учитывающих контекст поисковых систем и процессов принятия решений.
Amazon Bedrock для агентных RAG: Amazon Bedrock [38] предоставляет мощную платформу для реализации основанных на агентах рабочих процессов Retrieval Augmentation Generation (RAG).
IBM Watson и агентурные системы RAGВ watsonx.ai [53] компании IBM реализована поддержка создания агентных RAG-систем, например, с использованием модели Granite-3-8B-Instruct для ответа на сложные запросы и повышения точности ответов за счет интеграции внешней информации.
Neo4j и векторные базы данных: Neo4j, известная база данных графов с открытым исходным кодом, отлично справляется со сложными реляционными и семантическими запросами. В дополнение к Neo4j такие векторные базы данных, как Weaviate, Pinecone, Milvus и Qdrant, обеспечивают эффективные возможности поиска и извлечения информации по сходству и составляют основу высокопроизводительного рабочего процесса по созданию дополнений к поиску (RAG) на основе агентов.

7 Контрольные показатели и наборы данных

Существующие эталоны и наборы данных дают ценные сведения для оценки систем Retrieval Augmented Generation (RAG), в том числе систем с агентным и графовым дополнением. Некоторые из них специально разработаны для RAG, другие были адаптированы для тестирования возможностей поиска, вывода и генерации в различных сценариях. Эти наборы данных очень важны для тестирования компонентов поиска, вывода и генерации системы RAG. В таблице 3 представлены некоторые ключевые наборы данных для оценки RAG, основанные на последующих задачах.

Эталоны играют ключевую роль в стандартизации оценки систем RAG, предоставляя структурированные задачи и показатели. Особенно актуальны следующие эталоны:

BEIR (Benchmarking for Information Retrieval): универсальный эталон, предназначенный для оценки производительности встроенных моделей в различных задачах информационного поиска, охватывающий 17 наборов данных, относящихся к областям биоинформатики, финансов и вопросов и ответов [54].
MS MARCO (Microsoft Machine Reading Comprehension): Ориентированный на ранжирование абзацев и вопросы и ответы, этот эталон широко используется для решения интенсивных поисковых задач в системах RAG [55].
TREC (конференция по текстовому поиску, трек глубокого обучения): Предоставление наборов данных для поиска абзацев и документов, подчеркивающих качество моделей ранжирования в поисковом конвейере [56].
MuSiQue (многоходовый последовательный опрос): эталон для многоходовых рассуждений по множеству документов, подчеркивающий важность поиска и синтеза информации из разных контекстов [57].
2WikiMultihopQA: набор данных, разработанный для задачи многоходовой оценки качества по двум статьям Википедии, сфокусированный на способности соединять знания из нескольких источников [58].
AgentG (агентный RAG для объединения знаний): Бенчмарки, специально разработанные для агентных задач RAG, оценивающие динамический синтез информации из нескольких баз знаний [8].
HotpotQA: многоходовый эталон QA, требующий поиска и рассуждений во взаимосвязанных контекстах, подходящий для оценки сложных рабочих процессов RAG [59].
RAGBench: Крупномасштабный, интерпретируемый эталон, содержащий 100 000 примеров в различных отраслях промышленности, с системой оценки TRACe для получения действенных показателей RAG [60].
BERGEN (бенчмаркинг генерации улучшений поиска): Библиотека для систематического бенчмаркинга RAG-систем с помощью стандартизированных экспериментов [61].
Набор инструментов FlashRAG: реализует 12 методов RAG и включает 32 эталонных набора данных для поддержки эффективной и стандартизированной оценки RAG [62].
GNN-RAG: Этот эталон оценивает производительность систем RAG на основе графов в задачах предсказания на уровне узлов и краев, фокусируясь на качестве поиска и производительности вывода в Knowledge Graph Quizzing (KGQA) [63].

Таблица 3: Задачи и наборы данных, оцениваемые RAG (адаптировано из [23])

форма	Тип миссии	Наборы данных и ссылки
Вопросы и ответы (QA)	Контроль качества одиночных прыжков	Естественные вопросы (NQ) [64], TriviaQA [65], SQuAD [66], Веб-вопросы (WebQ) [67], PopQA [68], MS MARCO [55]
	Многоходовая проверка качества	HotpotQA[59], 2WikiMultiHopQA[58], MuSiQue[57]
	длинные вопросы и ответы	ELI5 [69], NarrativeQA (NQA) [70], ASQA [71], QMSum [72]
	Контроль качества с учетом специфики домена	Qasper [73], COVID-QA [74], CMB/MMCU Medical [75]
	QA с множественным выбором	QUALITY [76], ARC (ссылки нет), CommonSenseQA [77]
	Рисунок QA	GraphQA [78]
Вопросы и ответы на основе графиков	Метаэкстракция теории событий	WikiEvent[79], RAMS[80]
	Диалог с открытым доменом	Wizards of Wikipedia (WoW)[81]
диалоги	Индивидуальный диалог	KBP [82], DuleMon [83]
	Диалог, ориентированный на выполнение задач	CamRest[84]
	Персонализированный контент	Набор данных Amazon (игрушки, спорт, красота) [85]
Рекомендуемое обоснование		HellaSwag [86], CommonSenseQA [77].
здравый смысл	Рассуждения CoT	CoT Reasoning [87], CSQA [88]
остальное	сложное умозаключение	MMLU (без ссылки), WikiText-103[64]
	понимание языка
	Проверка фактов/валидация	FEVER [89], PubHealth [90]
рефераты	Краткое изложение стратегии QA Текст	StrategyQA [91]
	краткое содержание текста	WikiASP [92], XSum [93]
Генерация текста	длинная аннотация	NarrativeQA (NQA) [70], QMSum [72]
категоризация текста	история	Биографический набор данных (без ссылки), SST-2 [94]
	Общая классификация анализа настроения
Поиск по коду	Поиск программ	VioLens [95], TREC [56], CodeSearchNet [96]
прочность	надежность поиска	NoMIRACL [97]
	Надежность языкового моделирования	WikiText-103 [98]
математика	математическое мышление	GSM8K [99]
машинный перевод	задача перевода	JRC-Acquis [100]

8 Заключение

Агентные системы поиска с расширенной генерацией (RAG) представляют собой революционное достижение в области искусственного интеллекта, которое преодолевает ограничения традиционных систем RAG за счет интеграции автономных агентов. Используя интеллект агентов, эти системы получают возможность динамического принятия решений, итеративных рассуждений и совместных рабочих процессов, что позволяет им решать сложные реальные задачи с большей точностью и адаптивностью.

В данном обзоре рассматривается эволюция систем RAG от начальных реализаций до продвинутых парадигм, таких как модульная RAG, с указанием вклада и ограничений каждой парадигмы. Интеграция агентов в процессы RAG стала ключевым событием, приведшим к появлению систем RAG на основе агентов, которые преодолевают статичность рабочих процессов и ограниченную контекстную адаптивность. Приложения в здравоохранении, финансах, образовании и творческих отраслях демонстрируют преобразующий потенциал этих систем, демонстрируя их способность предоставлять персонализированные решения в реальном времени и с учетом контекста.

Несмотря на перспективность, системы RAG на основе агентов сталкиваются с проблемами, которые требуют дальнейших исследований и инноваций. Для обеспечения надежного и ответственного развертывания необходимо решить проблемы сложности координации, масштабируемости и задержки в многоагентных архитектурах, а также этические соображения. Кроме того, существенным препятствием является отсутствие эталонов и наборов данных, предназначенных для оценки возможностей агентов. Разработка методов оценки, позволяющих учесть уникальные аспекты агентных RAG, такие как взаимодействие нескольких агентов и динамическая адаптивность, имеет решающее значение для развития этой области.

В перспективе слияние генерации с расширенным поиском и агентного интеллекта способно переопределить роль ИИ в динамичных и сложных средах. Решив эти проблемы и изучив будущие направления, исследователи и практики смогут раскрыть весь потенциал систем RAG на основе агентов, проложив путь к преобразующим приложениям в различных отраслях и сферах. Поскольку системы ИИ продолжают развиваться, агентный RAG служит краеугольным камнем для создания адаптивных, контекстно-ориентированных и эффективных решений, отвечающих потребностям быстро меняющегося мира.

библиография

[1] Шервин Минаи, Томаш Миколов, Нарджес Никзад, Мейсам Ченаглу, Ричард Сошер, Ксавье Аматриен и
Цзяньфэн Гао. Большие языковые модели: обзор, 2024.
[2] Адити Сингх. Исследование языковых моделей: всесторонний обзор и анализ. в 2023 г. Международная конференция по методологии исследований в области управления знаниями и искусственного интеллекта. Управление знаниями, искусственный интеллект и телекоммуникации.
Инженерия (RMKMATE), страницы 1-4, 2023.
[3] Wayne Xin Zhao, Kun Zhou, Junyi Li, Tianyi Tang, Xiaolei Wang, Yupeng Hou, Yingqian Min, Beichen Zhang.
Цзюньцзе Чжан, Зикан Дун, Ифань Ду, Чэнь Ян, Юшуо Чэнь, Чжипэн Чэнь, Цзиньхао Цзян, Руйян Рен.
Ифань Ли, Синьюй Тан, Зиканг Лю, Пейю Лю, Цзянь-Юнь Ни и Цзи-Ронг Вэнь. Обзор больших языков
модели, 2024.
[4] Сумит Кумар Дам, Чонг Сон Хонг, Юй Цяо и Чаонин Чжан. Полный обзор аи на базе llm.
чатботы, 2024.
[5] Адити Сингх. Обзор генераторов ai text-to-image и ai text-to-video. in 2023 4th International Conference
по искусственному интеллекту, робототехнике и управлению (AIRC), стр. 32-36, 2023.
[6] Aditi Singh, Abul Ehtesham, Gaurav Kumar Gupta, Nikhil Kumar Chatta, Saket Kumar, and Tala Talaei Khoei.
Изучение оперативной инженерии: систематический обзор и swot-анализ, 2024.
[7] Lei Huang, Weijiang Yu, Weitao Ma, Weihong Zhong, Zhangyin Feng, Haotian Wang, Qianglong Chen, Weihua
Peng, Xiaocheng Feng, Bing Qin, and Ting Liu. Обзор галлюцинаций в больших языковых моделях: принципы,
Таксономия, проблемы и открытые вопросы. ACM Transactions on Information Systems, ноябрь 2024.
[8] Meng-Chieh Lee, Qi Zhu, Costas Mavromatis, Zhen Han, Soji Adeshina, Vassilis N. Ioannidis, Huzefa Rangwala.
и Кристос Фалутсос. agent-g: агентурный фреймворк для расширенного поиска графов, 2024.
[9] Penghao Zhao, Hailin Zhang, Qinhan Yu, Zhengren Wang, Yunteng Geng, Fangcheng Fu, Ling Yang, Wentao
Чжан, Цзе Цзян и Бин Цуй. Поиск-дополнение для генерируемого аи-контента: обзор, 2024.
[10] Zhengbao Jiang, Frank F. Xu, Luyu Gao, Zhiqing Sun, Qian Liu, Jane Dwivedi-Yu, Yiming Yang, Jamie Callan.
и Грэм Нойбиг. активный поиск дополненного поколения, 2023.
[11] Yikun Han, Chunjiang Liu, and Pengfei Wang. A comprehensive survey on vector database: Storage and retrieval
техника, вызовы, 2023 год.
[12] Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhiyuan Chen, Jiakai Tang.
Сюй Чэнь, Янкай Линь, Уэйн Синь Чжао, Чжэвэй Вэй и Джиронг Вэнь. Обзор больших языковых моделей на основе
Frontiers of Компьютер Наука, 18(6), март 2024.
[13] Aditi Singh, Saket Kumar, Abul Ehtesham, Tala Talaei Khoei, and Deepshikha Bhati. large language modeldriven immersive agent. in 2024 IEEE World AI IoT Congress (AIIoT), pages 0619-0624, 2024.
[14] Мэтью Ренце и Эрхан Гювен. Саморефлексия в llm-агентах: влияние на эффективность решения задач, 2024.
[15] Xu Huang, Weiwen Liu, Xiaolong Chen, Xingmei Wang, Hao Wang, Defu Lian, Yasheng Wang, Ruiming Tang.
Понимание планирования агентов llm: обзор, 2024 год.
[16] Taicheng Guo, Xiuying Chen, Yaqi Wang, Ruidi Chang, Shichao Pei, Nitesh V. Chawla, Olaf Wiest, and
Сянлян Чжан. Мультиагенты на основе больших языковых моделей: обзор прогресса и проблем, 2024.
[17] Чидакш Равуру, Сагар Шринивас Сахинана и Венкатарамана Рункана. агентский поиск-дополнение
генерация для анализа временных рядов, 2024 год.
[18] Цзе Хуанг и Кевин Чен-Чуан Чанг. К рассуждениям в больших языковых моделях: обзор, 2023.
[19] Boci Peng, Yun Zhu, Yongchao Liu, Xiaohe Bo, Haizhou Shi, Chuntao Hong, Yan Zhang, and Siliang Tang.
Графический поиск-дополненное поколение: обзор, 2024.
[20] Адити Сингх, Абул Эхтешам, Сайфуддин Махмуд и Чон Хун Ким. Революционная помощь в области психического здоровья
через langchain: путешествие с большой языковой моделью. In 2024 IEEE 14th Annual Computing and
Семинар и конференция по коммуникациям (CCWC), страницы 0073-0078, 2024.
[21] Гаурав Кумар Гупта, Адити Сингх, Сиджо Валаяккад Маникандан и Абул Эхтешам.
потенциал больших языковых моделей в распознавании симптомов распространенных заболеваний, 2024.
[22] Aditi Singh, Abul Ehtesham, Saket Kumar, Gaurav Kumar Gupta, and Tala Talaei Khoei. Encouraging responsible
Использование генеративных ай в образовании: подход к обучению на основе вознаграждения. В книге Тим Шлиппе, Эрик К. К. Ченг и
Тяньчжун Ван, редакторы, Искусственный интеллект в образовательных технологиях: новое развитие и инновации
Практика, стр. 404-413, Сингапур, 2025 г. Springer Nature Singapore.
[23] Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Meng Wang, and
Хаофен Ванг. Генерация с расширением поиска для больших языковых моделей: обзор, 2024.
[24] Владимир Карпухин, Барлас Огуз, Севон Мин, Патрик Льюис, Леделл Ву, Сергей Едунов, Даньци Чен и Вэнь ˘.
Тау Йи. Поиск плотных отрывков для ответов на вопросы с открытым доменом, 2020.
[25] Zeyu Zhang, Xiaohe Bo, Chen Ma, Rui Li, Xu Chen, Quanyu Dai, Jieming Zhu, Zhenhua Dong, and Ji-Rong
Вен. Обзор механизма памяти больших агентов на основе языковых моделей, 2024.
[26] Zhibin Gou, Zhihong Shao, Yeyun Gong, Yelong Shen, Yujiu Yang, Nan Duan, and Weizhu Chen. Critic: Large
Языковые модели могут самокорректироваться с помощью инструментальной интерактивной критики, 2024.
[27] Адити Сингх, Абул Эхтешам, Сакет Кумар и Тала Талаи Кхои. Усовершенствование ай-систем с помощью агентских рабочих процессов
паттерны в большой языковой модели. В 2024 IEEE World AI IoT Congress (AIIoT), pages 527-532, 2024.
[28] DeepLearning.AI. Как агенты могут повысить эффективность работы llm. https://www.deeplearning.ai/the-batch/
how-agents-can-improve-llm-performance/?ref=dl-staging-website.ghost.io, 2024. accessed: 2025-01-13.
[29] Aman Madaan, Niket Tandon, Prakhar Gupta, Skyler Hallinan, Luyu Gao, Sarah Wiegreffe, Uri Alon, Nouha
Дзири, Шримай Прабхумойе, Имин Ян, Шашанк Гупта, Бодхисаттва Прасад Маджумдер, Кэтрин Херманн.
Шон Уэллек, Амир Язданбахш и Питер Кларк. selfrefine: Iterative refinement with self-feedback, 2023.
[30] Noah Shinn, Federico Cassano, Edward Berman, Ashwin Gopinath, Karthik Narasimhan, and Shunyu Yao.
Reflexion: языковые агенты с вербальным обучением с подкреплением, 2023.
[31] Блог Weaviate. Что такое агентурная тряпка? https://weaviate.io/blog/what-is-agentic-rag#:~:text=is%
20Agentic%20RAG%3F-,%E2%80%8B,of%20the%20non%2Dagentic%20pipeline. Accessed: 2025-01-14.
[32] Shi-Qi Yan, Jia-Chen Gu, Yun Zhu, and Zhen-Hua Ling. Corrective retrieval augmented generation, 2024.
[33] LangGraph CRAG Tutorial. langgraph crag: Contextualised retrieval-augmented generation tutorial. https.
//langchain-ai.github.io/langgraph/tutorials/rag/langgraph_crag/. Accessed: 2025-01-14.
[34] Soyeong Jeong, Jinheon Baek, Sukmin Cho, Sung Ju Hwang, and Jong C. Park. Adaptive-rag: learning to adapt
поиск-дополнение больших языковых моделей за счет сложности вопросов, 2024.
[35] LangGraph Adaptive RAG Tutorial. langgraph adaptive rag: Adaptive retrieval-augmented generation tutorial. https://langchain-ai.github.io /langgraph/tutorials/rag/langgraph_adaptive_rag/.
Accessed: 2025-01-14.
[36] Zhili Shen, Chenxin Diao, Pavlos Vougiouklis, Pascual Merita, Shriram Piramanayagam, Damien Graux, Dandan
Ту, Зерен Цзян, Руофей Лай, Ян Рен и Джефф З. Пан. Gear: Агент с графическим расширением для поиска с дополнением
поколение, 2024.
[37] LlamaIndex. Внедрение агентских документооборотов. https://www.llamaindex.ai/blog/
introducing-agentic-document-workflows, 2025. accessed: 2025-01-13.
[38] AWS Machine Learning Blog. как twitch использовал агентный рабочий процесс с rag на amazon
bedrock для повышения продаж рекламы. https://aws.amazon.com/blogs/machine-learning/
how-twitch-used-agentic-workflow-with-rags-on-amazon-bedrock-to-supercharge-ad-sales/,
2025. Accessed: 2025-01-13.
[39] LlamaCloud Demo Repository. рабочий процесс составления истории болезни пациента с использованием llamacloud. https.
//github.com/run-llama/llamacloud-demo/blob/main/examples/document_workflows/
patient_case_summary/patient_case_summary.ipynb, 2025. accessed: 2025-01-13.
[40] Демо-репозиторий LlamaCloud. рабочий процесс рассмотрения договоров с использованием llamacloud. https://github.com/
run-llama/llamacloud-demo/blob/main/examples/document_workflows/contract_review/
contract_review.ipynb, 2025. accessed: 2025-01-13.
[41] LlamaCloud Demo Repository. процесс рассмотрения претензий по автострахованию с использованием llamacloud. https.
//github.com/run-llama/llamacloud-demo/blob/main/examples/document_workflows/auto_
insurance_claims/auto_insurance_claims.ipynb, 2025. accessed: 2025-01-13.
[42] LlamaCloud Demo Repository. рабочий процесс создания отчета об исследовании с помощью llamacloud.
https://github.com/run-llama/llamacloud-demo/blob/main/examples/report_generation/
research_paper_report_generation.ipynb, 2025. accessed: 2025-01-13.
[43] LangGraph Agentic RAG Tutorial. langgraph agentic rag: Nodes and edges tutorial. https://langchain-ai.
github.io/langgraph/tutorials/rag/langgraph_agentic_rag/#nodes-and-edges. accessed.
2025-01-14.
[44] Блог LlamaIndex. агентурная тряпка с llamaindex. https://www.llamaindex.ai/blog/
agentic-rag-with-llamaindex-2721b8a49ff6. Accessed: 2025-01-14.
[45] Hugging Face Cookbook. agentic rag: Turbocharge your retrieval-augmented generation with query reformulation and self-query. https:// Huggingface.co/learn/cookbook/en/agent_rag. Accessed: 2025-01-14.
[46] Qdrant Blog. agentic rag: combining rag with agents for enhanced information retrieval. https://qdrant.
tech/articles/agentic-rag/. Accessed: 2025-01-14.
[47] crewAI Inc. crewai: Репозиторий github для ai-проектов. https://github.com/crewAIInc/crewAI, 2025.
Accessed: 2025-01-15.
[48] AG2AI Contributors. Ag2: A github repository for advanced generative ai research. https://github.com/
ag2ai/ag2, 2025. accessed: 2025-01-15.
[49] Qingyun Wu, Gagan Bansal, Jieyu Zhang, Yiran Wu, Beibin Li, Erkang Zhu, Li Jiang, Xiaoyun Zhang, Shaokun
Чжан, Цзялэ Лю, Ахмед Хассан Авадалла, Райен Уайт, Даг Бургер и Чи Ванг. Автоген: Включение
llm-приложения нового поколения с помощью мультиагентной системы взаимодействия. 2023.
[50] Shaokun Zhang, Jieyu Zhang, Jiale Liu, Linxin Song, Chi Wang, Ranjay Krishna, and Qingyun Wu. Training
агенты языковых моделей без модификации языковых моделей. ICML'24, 2024.
[51] OpenAI. Рой: Легкий мультиагентный оркестровый фреймворк. https://github.com/openai/swarm.
Accessed: 2025-01-14.
[52] LlamaIndex Documentation. агентурная тряпка, использующая вершину ai. https://docs.llamaindex.ai/en/stable/
examples/agent/agentic_rag_using_vertex_ai/. Accessed: 2025-01-14.
[53] IBM Granite Community. Agentic rag: Ai агенты с моделями ibm granite. https://github.com/
ibm-granite-community/granite-snack-cookbook/blob/main/recipes/AI-Agents/Agentic_
RAG.ipynb. Accessed: 2025-01-14.
[54] Nandan Thakur, Nils Reimers, Andreas Rücklé, Abhishek Srivastava, and Iryna Gurevych. Beir: A heterogenous
эталон для оценки моделей информационного поиска с нулевым результатом, 2021.
[55] Payal Bajaj, Daniel Campos, Nick Craswell, Li Deng, Jianfeng Gao, Xiaodong Liu, Rangan Majumder, Andrew
Макнамара, Бхаскар Митра, Три Нгуен, Мир Розенберг, Ся Сонг, Алина Стоика, Саурабх Тивари и Тонг
Ванг. ms marco: набор данных по машинному пониманию чтения, созданный человеком, 2018.
[56] Nick Craswell, Bhaskar Mitra, Emine Yilmaz, Daniel Campos, Jimmy Lin, Ellen M. Voorhees, and Ian Soboroff.
Обзор трека глубокого обучения trec 2022. на конференции по текстовому поиску (TREC). NIST, TREC, март 2023 года.
[57] Harsh Trivedi, Niranjan Balasubramanian, Tushar Khot, and Ashish Sabharwal. musique: multihop questions
с помощью одноходовой композиции вопросов, 2022.
[58] Ксань Хо, Ань-Хоа Дуонг Нгуен, Саку Сугавара и Акико Аизава. Создание многоходового набора данных qa
для комплексной оценки шагов рассуждения, 2020.
[59] Zhilin Yang, Peng Qi, Saizheng Zhang, Yoshua Bengio, William W. Cohen, Ruslan Salakhutdinov, and Christopher D. Manning. hotpotqa: A dataset for разнообразных, объяснимых многоходовых ответов на вопросы, 2018.
[60] Robert Friel, Masha Belyi, and Atindriyo Sanyal. Ragbench: Explainable benchmark for retrieval-augmented
Системы генерации, 2024.
[61] Дэвид Рау, Эрве Дежан, Надежда Чиркова, Тибо Формаль, Шуай Ванг, Василина Никоулина и Стефан
Клинчант. Берген: библиотека бенчмаркинга для генерации с расширенным поиском, 2024.
[62] Jiajie Jin, Yutao Zhu, Xinyu Yang, Chenghao Zhang, and Zhicheng Dou. Flashrag: модульный набор инструментов для эффективного
исследования в области поиска и дополненного поколения, 2024.
[63] Costas Mavromatis and George Karypis. Gnn-rag: Graph neural retrieval for large language model reasoning.
2024.
[64] Том Квятковски, Дженнимария Паломаки, Оливия Редфилд, Майкл Коллинз, Анкур Парих, Крис Альберти, Даниэль
Эпштейн, Илия Полосухин, Джейкоб Девлин, Кентон Ли, Кристина Тутанова, Ллион Джонс, Мэтью Келси, Минг-Вей
Чанг, Эндрю М. Дай, Якоб Ушкорейт, Куок Ле и Слав Петров. Естественные вопросы: эталон для вопросов
Transactions of the Association for Computational Linguistics, 7:452-466, 2019.
[65] Mandar Joshi, Eunsol Choi, Daniel S. Weld, and Luke Zettlemoyer. triviaqa: a large scale distantly supervised
набор данных challenge dataset для понимания прочитанного, 2017.
[66] Пранав Раджпуркар, Цзянь Чжан, Константин Лопырев и Перси Лян. Squad: 100 000+ вопросов для машинной обработки.
понимание текста, 2016.
[67] Джонатан Берант, Эндрю К. Чоу, Рой Фростиг и Перси Лян. Семантический разбор freebase на основе пар "вопрос-ответ". конференция по эмпирическим методам обработки естественного языка 2013. Methods in Natural Language Processing, 2013.
[68] Алекс Маллен, Акари Асаи, Виктор Чжун, Раджарши Дас, Дэниел Хашаби и Ханнане Хаджиширзи. когда не стоит
Доверительные языковые модели: исследование эффективности параметрического и непараметрического запоминания. в Анна Роджерс,
Джордан Бойд-Грабер и Наоаки Окадзаки, редакторы, Материалы 61-го ежегодного собрания Ассоциации за
Computational Linguistics (Volume 1: Long Papers), pages 9802-9822, Toronto, Canada, July 2023.
для вычислительной лингвистики.
[69] Анджела Фан, Ясин Жернит, Этан Перес, Дэвид Гранжье, Джейсон Уэстон и Майкл Аули. Eli5: длинная форма
Ответы на вопросы, 2019 год.
[70] Tomáš Kociský, Jonathan Schwarz, Phil Blunsom, Chris Dyer, Karl Moritz Hermann, Gábor Melis, and Edward ˇ.
Грефенштетте. испытание на понимание прочитанного с помощью narrativeqa. 2017.
[71] Иван Стельмах, И Луань, Бхуван Дхингра и Минг-Вей Чанг. Asqa: Фактоидные вопросы в длинной форме
ответы, 2023.
[72] Минг Чжун, Да Инь, Тао Ю, Ахмад Заиди, Мутетия Мутума, Рахул Джха, Ахмед Хасан Авадалла, Асли
Celikyilmaz, Yang Liu, Xipeng Qiu, and Dragomir Radev. QMSum: новый бенчмарк для запросов на основе
Резюме многодоменных встреч. стр. 5905-5921, июнь 2021.
[73] Прадип Дасиги, Кайл Ло, Из Белтаги, Арман Кохан, Ной А. Смит и Мэтт Гарднер. набор данных вопросов и ответов по поиску информации, закрепленных в исследовательских работах. в Кристина Тутанова, Анна Румшиски, Люк
Зеттлемойер, Дилек Хаккани-Тур, Из Белтаги, Стивен Бетард, Райан Коттерелл, Танмой Чакраборти и Ичао
Чжоу, редакторы, Материалы 2021 конференции Североамериканского отделения Ассоциации за
Computational Linguistics: Human Language Technologies, pages 4599-4610, Online, June 2021.
для вычислительной лингвистики.
[74] Тимо Мёллер, Энтони Рейна, Рагхаван Джаякумар и Мальте Питш. COVID-QA: система ответов на вопросы.
Набор данных для COVID-19. в ACL 2020 Workshop on Natural Language Processing for COVID-19 (NLP-COVID),.
2020.
[75] Xidong Wang, Guiming Hardy Chen, Dingjie Song, Zhiyi Zhang, Zhihong Chen, Qingying Xiao, Feng Jiang.
Цзяньцюань Ли, Сян Вань, Бэнью Ван и Хайчжоу Ли. Cmb: комплексный медицинский справочник на китайском языке.
2024.
[76] Ричард Юаньчже Панг, Алисия Пэрриш, Нитиш Джоши, Никита Нангия, Джейсон Пханг, Анжелика Чен, Вишах
Padmakumar, Johnny Ma, Jana Thompson, He He, and Samuel R. Bowman. качество: ответы на вопросы с
длинные тексты для ввода, да!, 2022.
[77] Алон Талмор, Джонатан Херциг, Николас Лури и Джонатан Берант. commonsenseQA: система ответов на вопросы
в Джилл Бурштейн, Кристи Доран и Тамар Солорио, редакторы.
Материалы конференции 2019 года Североамериканского отделения Ассоциации вычислительной техники.
Лингвистика: технологии человеческого языка, том 1 (длинные и короткие доклады), страницы 4149-4158, Миннеаполис, США.
Миннесота, июнь 2019 г. Ассоциация вычислительной лингвистики.
[78] Xiaoxin He, Yijun Tian, Yifei Sun, Nitesh V. Chawla, Thomas Laurent, Yann LeCun, Xavier Bresson, and Bryan
Hooi. g-retriever: генерация с расширением поиска для понимания текстовых графов и ответов на вопросы.
2024.
[79] Sha Li, Heng Ji, and Jiawei Han. Document-level event argument extraction by conditional generation, 2021.
[80] Сет Эбнер, Патрик Ся, Райан Калкин, Кайл Роулинс и Бенджамин Ван Дурм. Многосложный аргумент
связь, 2020.
[81] Эмили Динан, Стивен Роллер, Курт Шустер, Анджела Фан, Майкл Аули и Джейсон Уэстон. волшебник википедии.
Разговорные агенты, основанные на знаниях, 2019.
[82] Hongru Wang, Minda Hu, Yang Deng, Rui Wang, Fei Mi, Weichao Wang, Yasheng Wang, Wai-Chung Kwan.
Ирвин Кинг и Кам-Фай Вонг. Большие языковые модели как планировщик источников для персонализированных знаний, основанных на знаниях
диалог, 2023 год.
[83] Xinchao Xu, Zhibin Gou, Wenquan Wu, Zheng-Yu Niu, Hua Wu, Haifeng Wang, and Shihang Wang. Long time
разговор с открытым доменом с долговременной памятью персоны, 2022 год.
[84] Tsung-Hsien Wen, Milica Gašic, Nikola Mrkši´ c, Lina M. Rojas-Barahona, Pei-Hao Su, Stefan Ultes, David ´
Вандайк и Стив Янг. Условная генерация и обучение по снимкам в нейронных диалоговых системах.
Материалы конференции 2016 года по эмпирическим методам обработки естественного языка, страницы 2153-2162, , в материалах конференции 2016 года по эмпирическим методам обработки естественного языка.
Остин, Техас, ноябрь 2016 г. Ассоциация вычислительной лингвистики.
[85] Руининг Хе и Джулиан МакОли. Взлеты и падения: моделирование визуальной эволюции модных тенденций с помощью одноклассовых моделей.
Совместная фильтрация. Материалы 25-й Международной конференции по Всемирной паутине, WWW '16, стр.
507-517, Республика и Кантон Женева, CHE, 2016 г. Международные конференции по Всемирной паутине Steering
Комитет.
[86] Rowan Zellers, Ari Holtzman, Yonatan Bisk, Ali Farhadi, and Yejin Choi. HellaSwag: Can a machine really
Анна Корхонен, Дэвид Траум и Ллуис Маркес, редакторы, Материалы 57-й сессии Комиссии по правам человека.
Ежегодная встреча Ассоциации вычислительной лингвистики, стр. 4791-4800, Флоренция, Италия, июль 2019 г.
Ассоциация вычислительной лингвистики.
[87] Seungone Kim, Se June Joo, Doyoung Kim, Joel Jang, Seonghyeon Ye, Jamin Shin, and Minjoon Seo.
Коллекция cot: улучшение обучения языковых моделей с нулевым и малым количеством выстрелов с помощью тонкой настройки цепочки мыслей,
2023.
[88] Амрита Саха, Вардаан Пахуджа, Митеш М. Кхапра, Картик Санкаранараянан и Саратх Чандар. Комплекс
Последовательные ответы на вопросы: обучение связным парам вопросов-ответов с помощью знаний
Граф. 2018.
[89] James Thorne, Andreas Vlachos, Christos Christodoulopoulos, and Arpit Mittal. FEVER: a large-scale dataset for
извлечение фактов и верификация. в Мэрилин Уокер, Хенг Джи и Аманда Стент, редакторы, Труды 2018 г.
Конференция Североамериканского отделения Ассоциации вычислительной лингвистики: человеческий язык
Technologies, Volume 1 (Long Papers), pages 809-819, New Orleans, Louisiana, June 2018. association for
Вычислительная лингвистика.
[90] Нима Котонья и Франческа Тони. Объяснимая автоматизированная проверка фактов для утверждений о здоровье населения, 2020.
[91] Мор Гева, Даниэль Хашаби, Элад Сегал, Тушар Хот, Дэн Рот и Джонатан Берант. пользовался ли Аристотель ноутбуком?
эталон ответов на вопросы с неявными стратегиями рассуждений, 2021.
[92] Hiroaki Hayashi, Prashant Budania, Peng Wang, Chris Ackerson, Raj Neervannan, and Graham Neubig. Wikiasp.
Набор данных для многодоменного аспектного обобщения, 2020.
[93] Шаши Нараян, Шей Б. Коэн и Мирелла Лапата. Не надо подробностей, только краткое содержание!
конволюционные нейронные сети для экстремального суммирования, 2018.
[94] Ричард Сошер, Алекс Перелыгин, Жан Ву, Джейсон Чуанг, Кристофер Д. Мэннинг, Эндрю Нг и Кристофер
Поттс. Рекурсивные глубокие модели для семантической композиции над древовидным банком смыслов. в Дэвид Яровски,
Тимоти Болдуин, Анна Корхонен, Карен Ливеску и Стивен Бетард, редакторы, Труды 2013 г.
Конференция по эмпирическим методам обработки естественного языка, стр. 1631-1642, Сиэтл, Вашингтон.
США, октябрь 2013 г. Ассоциация вычислительной лингвистики.
[95] Sourav Saha, Jahedul Alam Junaed, Maryam Saleki, Arnab Sen Sharma, Mohammad Rashidujjaman Rifat.
Мохамед Рахути, Саид Иштиак Ахмед, Набил Мохаммед и Мохаммад Рухул Амин. Вио-линза: новый
Набор данных аннотированных постов в социальных сетях, приводящих к различным формам коммунального насилия, и его оценка.
Фиродж Алам, Судипта Кар, Шаммур Абсар Чоудхури, Фариг Садек и Рухул Амин, редакторы, Труды
Первого семинара по обработке языка бангла (BLP-2023), стр. 72-84, Сингапур, декабрь 2023 г.
Ассоциация вычислительной лингвистики.
[96] Hamel Husain, Ho-Hsiang Wu, Tiferet Gazit, Miltiadis Allamanis, and Marc Brockschmidt. Codesearchnet
вызов: оценка состояния семантического поиска кода, 2020.
[97] Nandan Thakur, Luiz Bonifacio, Xinyu Zhang, Odunayo Ogundepo, Ehsan Kamalloo, David Alfonso-Hermelo.
Сяогуань Ли, Кунь Лю, Боксинг Чен, Мехди Резаголизаде и Джимми Лин. "Знать, когда не знаешь".
Многоязычный набор данных оценки релевантности для надежного поиска с расширенной генерацией, 2024.
[98] Стивен Мерити, Кайминг Сьонг, Джеймс Брэдбери и Ричард Сочер. модели смеси указателей, 2016.
[99] Karl Cobbe, Vineet Kosaraju, Mohammad Bavarian, Mark Chen, Heewoo Jun, Lukasz Kaiser, Matthias Plappert.
Джерри Двурек, Джейкоб Хилтон, Рейичиро Накано, Кристофер Хессе и Джон Шульман. обучение верификаторов для
решать математические задачи, 2021.
[100] Ralf Steinberger, Bruno Pouliquen, Anna Widiger, Camelia Ignat, Tomaž Erjavec, Dan Tufi¸s, and Dániel Varga.
JRC-Acquis: многоязычный выровненный параллельный корпус с 20+ языками. В Николетта Кальцолари, Халид
Choukri, Aldo Gangemi, Bente Maegaard, Joseph Mariani, Jan Odijk, and Daniel Tapias, editors, Proceedings of the
Пятая международная конференция по языковым ресурсам и оценке (LREC'06), Генуя, Италия, май 2006 г.
Европейская ассоциация языковых ресурсов (ELRA).

База знаний по искусственному интеллекту

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Творческое рисование в искусственном интеллекте для писателей: полное руководство

Практические уроки по искусственному интеллекту Код #

2 года назад

055.8K

Рекламные сообщения для ресторанов - Ultimate Marketing Copy ChatGPT Prompts

Утилитарные команды искусственного интеллекта

2 года назад

045.9K

Поисковые API слишком дороги, как мне самому создать бесплатную поисковую систему?

Ответы ИИ

1 год назад

061.3K

Cline+MCP быстро создает рабочие процессы агентов: примеры из реальной практики

Практические уроки по искусственному интеллекту

1 год назад

063.2K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

Интеллектуальное агентное извлечение расширенной генерации: обзор технологии Agentic RAG

рефераты

1 Введение

2 Основа для создания улучшений поиска

2.1 Обзор дополненного поколения (RAG)

2.2 Основные компоненты RAG

2.3 Эволюция парадигмы RAG

2.3.1 Простой RAG

2.3.2 Расширенный RAG

2.3.3 Модульный RAG

2.3.4 Рисунок RAG

2.3.5 Прокси RAG

2.4 Проблемы и ограничения традиционных систем RAG

2.4.1 Контекстная интеграция

2.4.2 Многоступенчатые рассуждения

2.4.3 Проблемы масштабируемости и задержки

2.5 Агентный RAG: смена парадигмы

3 Основные принципы и контекст агентской разведки

3.1 Модель прокси

3.1.1 Отражение

3.1.2 Планирование

3.1.3 Использование инструментов

3.1.4 Мультиагент

4 Классификация агентных систем RAG

4.1 Одноагентный прокси RAG: маршрутизатор

рабочий процесс

Основные характеристики и преимущества

Примеры использования: поддержка клиентов

4.2 Многоагентная система RAG

рабочий процесс

Основные характеристики и преимущества

вызов

Пример использования: многопрофильный научный ассистент

4.3 Иерархическая система RAG на основе агентов

рабочий процесс

Основные характеристики и преимущества

вызов

Пример использования: система финансового анализа

4.4 Корректирующий RAG по доверенности

Основные характеристики и преимущества:

4.5 Адаптивный агентный RAG

4.6 Агентные РАГ на основе графов

4.6.1 Agent-G: основанная на агентах структура для графовых RAG

4.6.2 GeAR: Агент расширения графа для генерации дополнений к поисковой выдаче

4.7 Агентские документообороты в агентских РАГ

Пример использования: рабочий процесс оплаты счетов-фактур

Основные характеристики и преимущества

4.8 Сравнительный анализ агент-ориентированных систем RAG

5 Применение прокси RAG

5.1 Поддержка клиентов и виртуальные помощники

Пример использования: повышение продаж рекламы в Twitch [38]

Ключевые преимущества:

5.2 Медицинское лечение и персонализированная медицина

Примеры использования: краткое описание случаев с пациентами [39]

Ключевые преимущества:

5.3 Юридический и договорной анализ

Примеры использования: проверка договоров [40]

Ключевые преимущества:

5.4 Анализ финансов и рисков

Примеры использования: обработка претензий по автострахованию [41]

Ключевые преимущества:

5.5 Образование

Примеры использования: создание исследовательских работ [42]

Ключевые преимущества:

5.6 Приложения для улучшения графиков в мультимодальных рабочих процессах

Пример использования: проведение маркетинговых исследований

Ключевые преимущества:

6 Инструменты и структуры для агентных RAG

Ключевые инструменты и рамки:

7 Контрольные показатели и наборы данных

8 Заключение

библиография

LangGraph: структура для создания и выполнения агентов ИИ на основе топологии направленных ациклических графов

Момент Шиншиллы и момент o3: эволюция закона масштаба для больших языковых моделей

Похожие статьи

Творческое рисование в искусственном интеллекте для писателей: полное руководство

Рекламные сообщения для ресторанов - Ultimate Marketing Copy ChatGPT Prompts

Поисковые API слишком дороги, как мне самому создать бесплатную поисковую систему?

Cline+MCP быстро создает рабочие процессы агентов: примеры из реальной практики

Нет комментариев