Вводный курс Microsoft AI Agent: Agentic RAG

Информация о курсеОпубликовано 1 год назад Круг обмена ИИ

53.2K 00

В этом курсе представлен всеобъемлющий обзор агентурного поиска-дополнения (Agentic Retrieval-Augmented Generation). RAG), развивающаяся парадигма ИИ, в которой большие языковые модели (LLM) автономно планируют свои дальнейшие действия, получая информацию из внешних источников. В отличие от статичной модели "поиск - чтение", агентный RAG включает в себя итеративные обращения к LLM, перемежающиеся вызовами инструментов или функций и структурированным выводом. Система оценивает результаты, оптимизирует запрос, при необходимости вызывает другие инструменты и продолжает этот цикл до тех пор, пока не будет найдено удовлетворительное решение.

краткое содержание

В этом курсе будут рассмотрены следующие темы:

Понимание агентурного RAG. Узнайте о новой парадигме в искусственном интеллекте, когда большие языковые модели (LLM) автономно планируют свои дальнейшие действия, извлекая информацию из внешних источников данных.
Освоение итеративной модели "создатель-проверяющий". Понимание цикла итеративных обращений к LLM, перемежающихся с вызовами инструментов или функций и структурированным выводом, призвано улучшить корректность и справиться с плохо отформатированными запросами.
Изучите практическое применение. Определите сценарии, в которых Agentic RAG проявляет себя наилучшим образом, например, в средах, где "правильность стоит на первом месте", в сложных взаимодействиях с базами данных и в расширенных рабочих процессах.

цель обучения

Пройдя этот курс, вы будете знать, как/понимать:

Понимание агентурного RAG. Узнайте о новой парадигме в искусственном интеллекте, когда большие языковые модели (LLM) автономно планируют свои дальнейшие действия, извлекая информацию из внешних источников данных.
Итеративная модель "создатель-проверяющий". Разберитесь в концепции итеративных вызовов циклов LLM, перемежающихся с вызовами инструментов или функций и структурированными выводами, предназначенными для улучшения корректности и решения проблем с плохо отформатированными запросами.
Владеет процессом рассуждения. Понимание того, что система обладает способностью в процессе рассуждений принимать решения о том, как подойти к решению проблемы, не полагаясь на заранее определенные пути.
Рабочий процесс. Узнайте, как модели Agentic могут принимать независимые решения для получения отчетов о тенденциях рынка, выявления данных о конкурентах, сопоставления внутренних показателей продаж, обобщения результатов и оценки стратегий.
Итерационные циклы, интеграция инструментов и память. Поймите, как системы опираются на циклические схемы взаимодействия для поддержания состояния и памяти на разных этапах, чтобы избежать повторения циклов и принимать обоснованные решения.
Работа с режимами отказа и самокоррекция. Изучите надежные механизмы самокоррекции системы, включая итерации и повторные запросы, использование диагностических инструментов и зависимость от человеческого контроля.
Границы агента. Поймите ограничения агентного RAG, уделяя особое внимание автономности, зависимости от инфраструктуры и соблюдению защитных барьеров.
Практические примеры использования и ценность. Определите сценарии, в которых Agentic RAG проявляет себя наилучшим образом, например, в средах, где "правильность стоит на первом месте", в сложных взаимодействиях с базами данных и в расширенных рабочих процессах.
Управление, прозрачность и доверие. Понять важность управления и прозрачности, включая объяснимые причины, контроль предвзятости и человеческий надзор.

Что такое агентурный RAG?

Агентное извлечение и дополненная генерация (Agentic Retrieval-Augmented Generation, Agentic RAG) - это развивающаяся парадигма ИИ, в которой большие языковые модели (LLM) автономно планируют свои дальнейшие действия, извлекая информацию из внешних источников. В отличие от статичной модели "извлекать - читать", Agentic RAG предполагает итеративные обращения к LLM, перемежающиеся вызовами инструментов или функций и структурированным выводом. Система оценивает результаты, оптимизирует запрос, при необходимости вызывает другие инструменты и продолжает этот цикл до тех пор, пока не будет найдено удовлетворительное решение. Эта итерационная модель "создатель-проверяющий" улучшает корректность, обрабатывает неправильно оформленные запросы и обеспечивает высокое качество результатов.

Система активно управляет процессом рассуждений, переписывая неудачные запросы, выбирая различные методы поиска и интегрируя различные инструменты (например, векторный поиск в Azure AI Search, базы данных SQL или пользовательские API), прежде чем определить ответ. Отличительной особенностью агентной системы является то, что она может управлять процессом рассуждений. Традиционные реализации RAG опираются на заранее определенные пути, но агентные системы самостоятельно определяют порядок шагов, основываясь на качестве найденной информации.

Определение агентурного поиска-дополнения (Agentic Retrieval-Augmented Generation, Agentic RAG)

Агентная генерация с извлечением и дополнением (Agentic Retrieval-Augmented Generation, Agentic RAG) - это новая парадигма в разработке ИИ, в которой LLM не только извлекают информацию из внешних источников данных, но и автономно планируют свои дальнейшие действия. В отличие от статичной модели "получить - прочитать" или сложных последовательностей подсказок, Agentic RAG включает в себя итеративные циклы вызовов LLM, перемежающиеся вызовами инструментов или функций и структурированными выводами. На каждом шаге система оценивает полученные результаты, решает, нужно ли оптимизировать запрос, при необходимости вызывает другие инструменты и продолжает этот цикл до тех пор, пока не будет получено удовлетворительное решение.

Этот итеративный подход "maker-checker" предназначен для улучшения корректности, обработки плохо отформатированных запросов к структурированным базам данных (например, NL2SQL) и обеспечения сбалансированных, высококачественных результатов. Вместо того чтобы полагаться исключительно на сложные цепочки подсказок, система активно управляет процессом рассуждений. Она может переписывать неудачные запросы, выбирать различные методы поиска и интегрировать различные инструменты (например, векторный поиск в Azure AI Search, базы данных SQL или пользовательские API), прежде чем выработать окончательный ответ. Это устраняет необходимость в слишком сложных механизмах оркестровки. Вместо этого относительно простой цикл "вызов LLM → использование инструмента → вызов LLM → ..." может дать сложный и хорошо обоснованный результат.

Владейте процессом рассуждения

Отличительная черта, которая делает систему "агентной", - это ее способность к собственному процессу рассуждений. Традиционные реализации RAG часто полагаются на человека, который предопределяет путь модели: цепочка мыслей, определяющая, что и когда нужно получить. Но если система действительно агентная, она сама решает, как подойти к решению проблемы. Она не просто выполняет скрипты, а самостоятельно определяет порядок шагов, основываясь на качестве найденной информации. Например, если ее попросят разработать стратегию запуска продукта, она не станет полагаться на подсказку, в которой подробно описан весь процесс исследования и принятия решений. Вместо этого агентская модель принимает решение самостоятельно:

Используйте Bing Web Grounding для получения отчетов о текущих рыночных тенденциях.
Используйте Azure AI Search для поиска релевантных данных о конкурентах.
Используйте базу данных Azure SQL Database, чтобы связать исторические показатели внутренних продаж.
Синтезируйте аналитику в целостную стратегию с помощью службы Azure OpenAI.
Стратегии оцениваются на предмет пробелов или несоответствий, и при необходимости предлагается провести еще один раунд поиска. Все эти шаги (оптимизация запроса, выбор источников, итерации до получения "удовлетворительного" ответа) определяются моделью, а не пишутся человеком.

Итерационные циклы, интеграция инструментов и память

Агентская система опирается на циклическую модель взаимодействия:

Первый звонок. Цели пользователя (т.е. его подсказки) представляются LLM.
Вызов инструмента. Если модель обнаруживает недостающую информацию или неоднозначные инструкции, она выбирает инструмент или метод поиска (например, векторный запрос к базе данных (например, гибридный поиск частных данных в Azure AI Search) или структурированный вызов SQL), чтобы собрать больше контекста.
Оценка и оптимизация. Проанализировав полученные данные, модель решает, достаточно ли информации. Если ее недостаточно, она оптимизирует запрос, пробует разные инструменты или корректирует свой подход.
Повторяйте до тех пор, пока не получите удовлетворение. Этот цикл продолжается до тех пор, пока модель не определит, что у нее достаточно ясности и доказательств, чтобы представить окончательный, хорошо обоснованный ответ.
Память и состояние. Поскольку система сохраняет состояние и память на протяжении всех этапов, она может вспомнить предыдущие попытки и их результаты, избегая повторения циклов и принимая более обоснованные решения по ходу работы.

Со временем это создает развивающееся чувство понимания, которое позволяет модели справляться со сложными многоэтапными задачами без необходимости постоянного вмешательства человека или переделки подсказок.

Работа с режимами отказа и самокоррекция

Автономность Agentic RAG также включает в себя мощный механизм самокоррекции. Когда система заходит в тупик (например, получает нерелевантный документ или неправильно оформленный запрос), она может:

Итерация и повторные запросы. Вместо того чтобы возвращать малозначимые ответы, модель пробует новые стратегии поиска, переписывает запросы к базе данных или рассматривает альтернативные наборы данных.
Использование диагностических инструментов. Система может вызывать дополнительные функции, призванные помочь ей отладить шаги по выводу или подтвердить корректность полученных данных. Такие инструменты, как Azure AI Tracing, помогут обеспечить надежную наблюдаемость и мониторинг.
Полагаться на ручной контроль. При высоком риске или повторяющихся неудачах модель может отметить неопределенность и запросить руководство у человека. После того как человек предоставит корректирующую обратную связь, модель сможет перенять этот опыт в будущем.

Такой итеративный и динамичный подход позволяет постоянно совершенствовать модель, гарантируя, что это не просто одноразовая система, а система, способная учиться на ошибках, допущенных в ходе конкретной сессии.

Границы агента

Хотя агентурный RAG автономен в своих задачах, он не эквивалентен ИИ общего назначения. Его "агентские" возможности ограничены инструментами, источниками данных и политиками, предоставленными человеческими разработчиками. Он не может изобретать собственные инструменты или выходить за границы заданной области. Вместо этого он способен динамически управлять имеющимися ресурсами. Ключевые отличия от более продвинутых форм ИИ включают:

Автономия в определенных областях. Агентные системы RAG нацелены на достижение определенных пользователем целей в известных областях, используя такие стратегии, как переписывание запросов или выбор инструментов для улучшения результатов.
Инфраструктурные зависимости. Возможности системы зависят от инструментов и данных, которые интегрируют разработчики. Она не может преодолеть эти границы без вмешательства человека.
Уважение к ограждению. Кодекс этики, правила соответствия и бизнес-стратегии остаются важными. Свобода агента всегда зависит от мер безопасности и механизмов надзора (надеемся?).

Практические примеры использования и ценность

Agentic RAG отлично проявляет себя в сценариях, требующих итеративной оптимизации и точности:

Среда, ориентированная на "правильность". При проверке соответствия нормативным требованиям, анализе нормативных документов или юридических исследований агентские модели могут итеративно проверять факты, обращаться к нескольким источникам и переписывать запросы до тех пор, пока не будет получен тщательно проверенный ответ.
Сложные взаимодействия с базами данных. При работе со структурированными данными, когда запросы часто не работают или нуждаются в настройке, системы могут использовать Azure SQL или Microsoft Fabric OneLake для автономной оптимизации запросов, чтобы конечный результат соответствовал намерениям пользователя.
Расширенный рабочий процесс. Длительные сессии могут меняться по мере поступления новой информации, и Agentic RAG может постоянно интегрировать новые данные, меняя стратегии по мере получения новых сведений о проблемном пространстве.

Управление, прозрачность и доверие

Поскольку эти системы становятся все более автономными в своих рассуждениях, управление и прозрачность имеют решающее значение:

Интерпретируемое рассуждение. Модели могут предоставлять аудиторский след запросов, которые они делают, источников, к которым они обращаются, и шагов, которые они предпринимают, чтобы прийти к своим выводам. Такие инструменты, как Azure AI Content Safety и Azure AI Tracing / GenAIOps, помогают поддерживать прозрачность и снижать риски.
Контроль отклонений и поиск равновесия. Разработчики могут корректировать стратегии поиска, чтобы обеспечить учет сбалансированных и репрезентативных источников данных, и использовать Azure Machine Learning для настройки моделей для продвинутых организаций, занимающихся наукой о данных, регулярно проверяя результаты для выявления предвзятости или искаженных моделей.
Руководство по надзору и соблюдению требований. Агентский RAG не заменяет ручную оценку при принятии решений, связанных с высоким риском, а дополняет ее, предоставляя возможность более тщательной проверки.

Очень важно иметь инструменты, которые обеспечивают четкую запись операций. Без них отладка многоэтапного процесса может быть очень сложной. Пример запуска агента можно найти в Literal AI (компания, создавшая Chainlit):

вынести вердикт

Агентный RAG представляет собой естественную эволюцию в подходе систем ИИ к сложным задачам, требующим больших объемов данных. Применяя циклическую модель взаимодействия, автономно выбирая инструменты и оптимизируя запросы до получения высококачественных результатов, системы превращаются из статичных систем, выполняющих подсказки, в более адаптивные, принимающие решения с учетом контекста. Несмотря на то, что они все еще связаны определенными человеком инфраструктурами и этическими нормами, эти агентские возможности обеспечивают более богатое, динамичное и, в конечном счете, более полезное взаимодействие ИИ для предприятий и конечных пользователей.