本课程全面概述了 Agentic Retrieval-Augmented Generation (Agentic RAG),这是一种新兴的 AI 范式,其中大语言模型 (LLMs) 在从外部来源获取信息的同时,自主规划其下一步行动。与静态的“检索-然后-阅读”模式不同,Agentic RAG 涉及对 LLM 的迭代调用,穿插着工具或函数调用以及结构化输出。系统会评估结果、优化查询、在需要时调用其他工具,并持续此循环,直到获得满意的解决方案。
简介
本课程将涵盖以下内容:
- 理解 Agentic RAG: 了解 AI 领域的新兴范式,其中大语言模型 (LLMs) 在从外部数据源提取信息的同时,自主规划其下一步行动。
- 掌握迭代的“制造者-检查者”模式: 理解迭代调用 LLM 的循环,穿插着工具或函数调用以及结构化输出,旨在提高正确性并处理格式错误的查询。
- 探索实际应用: 确定 Agentic RAG 大放异彩的场景,例如“正确性优先”的环境、复杂的数据库交互和扩展的工作流程。
学习目标
完成本课程后,你将了解如何/理解:
- 理解 Agentic RAG: 了解 AI 领域的新兴范式,其中大语言模型 (LLMs) 在从外部数据源提取信息的同时,自主规划其下一步行动。
- 迭代的“制造者-检查者”模式: 掌握迭代调用 LLM 的循环的概念,穿插着工具或函数调用以及结构化输出,旨在提高正确性并处理格式错误的查询。
- 拥有推理过程: 理解系统拥有其推理过程的能力,决定如何处理问题,而不依赖于预定义的路径。
- 工作流程: 了解 Agentic 模型如何独立决定检索市场趋势报告、识别竞争对手数据、关联内部销售指标、综合分析结果并评估策略。
- 迭代循环、工具集成和记忆: 了解系统如何依赖循环交互模式,在各个步骤中保持状态和记忆,以避免重复循环并做出明智的决策。
- 处理失败模式和自我纠正: 探索系统强大的自我纠正机制,包括迭代和重新查询、使用诊断工具以及依靠人工监督。
- Agent 的边界: 了解 Agentic RAG 的局限性,重点关注特定领域的自主性、基础设施依赖性和对护栏的尊重。
- 实际用例和价值: 确定 Agentic RAG 大放异彩的场景,例如“正确性优先”的环境、复杂的数据库交互和扩展的工作流程。
- 治理、透明度和信任: 了解治理和透明度的重要性,包括可解释的推理、偏差控制和人工监督。
什么是 Agentic RAG?
Agentic Retrieval-Augmented Generation (Agentic RAG) 是一种新兴的 AI 范式,其中大语言模型 (LLMs) 在从外部来源提取信息的同时,自主规划其下一步行动。与静态的“检索-然后-阅读”模式不同,Agentic RAG 涉及对 LLM 的迭代调用,穿插着工具或函数调用以及结构化输出。系统会评估结果、优化查询、在需要时调用其他工具,并持续此循环,直到获得满意的解决方案。这种迭代的“制造者-检查者”模式可以提高正确性、处理格式错误的查询并确保高质量的结果。
系统主动拥有其推理过程,重写失败的查询,选择不同的检索方法,并集成多个工具(例如 Azure AI Search 中的向量搜索、SQL 数据库或自定义 API),然后最终确定其答案。Agentic 系统的显著特点是它能够拥有自己的推理过程。传统的 RAG 实现依赖于预定义的路径,但 Agentic 系统会根据其找到的信息质量自主确定步骤的顺序。
定义 Agentic Retrieval-Augmented Generation (Agentic RAG)
Agentic Retrieval-Augmented Generation (Agentic RAG) 是 AI 开发中的一种新兴范式,其中 LLMs 不仅从外部数据源提取信息,还自主规划其下一步行动。与静态的“检索-然后-阅读”模式或精心设计的提示序列不同,Agentic RAG 涉及对 LLM 的迭代调用循环,穿插着工具或函数调用以及结构化输出。在每一步,系统都会评估其获得的结果,决定是否优化其查询,在需要时调用其他工具,并持续此循环,直到获得满意的解决方案。
这种迭代的“制造者-检查者”操作方式旨在提高正确性,处理对结构化数据库的格式错误的查询 (例如 NL2SQL),并确保平衡、高质量的结果。系统不是仅仅依赖于精心设计的提示链,而是主动拥有其推理过程。它可以重写失败的查询,选择不同的检索方法,并集成多个工具(例如 Azure AI Search 中的向量搜索、SQL 数据库或自定义 API),然后最终确定其答案。这消除了对过于复杂的编排框架的需求。相反,一个相对简单的“LLM 调用 → 工具使用 → LLM 调用 → …”循环可以产生复杂且有理有据的输出。
拥有推理过程
使系统具有“Agentic”的显著特点是它能够拥有自己的推理过程。传统的 RAG 实现通常依赖于人类预先定义模型的路径:一个思维链,概述要检索的内容和时间。但是,当一个系统真正具有 Agentic 时,它会在内部决定如何处理问题。它不仅仅是执行脚本;它会根据其找到的信息质量自主确定步骤的顺序。例如,如果要求它创建产品发布策略,它不会仅仅依赖于一个详细说明整个研究和决策工作流程的提示。相反,Agentic 模型会独立决定:
- 使用 Bing Web Grounding 检索当前市场趋势报告。
- 使用 Azure AI Search 识别相关的竞争对手数据。
- 使用 Azure SQL Database 关联历史内部销售指标。
- 通过 Azure OpenAI Service 将分析结果综合为具有凝聚力的策略。
- 评估策略是否存在差距或不一致之处,并在必要时提示进行另一轮检索。所有这些步骤(优化查询、选择来源、迭代直到对答案“满意”)都由模型决定,而不是由人类预先编写的。
迭代循环、工具集成和记忆
Agentic 系统依赖于循环交互模式:
- 初始调用: 用户的目标 (即用户提示) 被呈现给 LLM。
- 工具调用: 如果模型识别出缺失的信息或模糊的指令,它会选择一个工具或检索方法(例如向量数据库查询 (例如 Azure AI Search 对私有数据的混合搜索) 或结构化 SQL 调用)来收集更多上下文。
- 评估和优化: 在审查返回的数据后,模型会决定信息是否足够。如果不够,它会优化查询、尝试不同的工具或调整其方法。
- 重复直到满意: 此循环持续进行,直到模型确定它有足够的清晰度和证据来提供最终的、经过充分推理的响应。
- 记忆和状态: 由于系统在各个步骤中保持状态和记忆,它可以回忆起先前的尝试及其结果,避免重复循环并在进行过程中做出更明智的决策。
随着时间的推移,这会产生一种不断发展的理解感,使模型能够处理复杂的多步骤任务,而无需人工持续干预或重新设计提示。
处理失败模式和自我纠正
Agentic RAG 的自主性还包括强大的自我纠正机制。当系统遇到死胡同(例如检索到不相关的文档或遇到格式错误的查询)时,它可以:
- 迭代和重新查询: 模型不会返回低价值的响应,而是尝试新的搜索策略、重写数据库查询或查看替代数据集。
- 使用诊断工具: 系统可以调用额外的函数,旨在帮助它调试其推理步骤或确认检索数据的正确性。Azure AI Tracing 等工具将有助于实现强大的可观察性和监控。
- 依靠人工监督: 对于高风险或重复失败的情况,模型可能会标记不确定性并请求人工指导。一旦人工提供了纠正反馈,模型就可以在未来采纳该经验。
这种迭代和动态的方法使模型能够持续改进,确保它不仅仅是一个一次性系统,而是一个可以从给定会话中的失误中学习的系统。
Agent 的边界
尽管 Agentic RAG 在任务中具有自主性,但它并不等同于通用人工智能。它的“Agentic”能力仅限于人类开发人员提供的工具、数据源和策略。它无法发明自己的工具或超出已设定的领域边界。相反,它擅长动态编排手头的资源。与更高级的 AI 形式的主要区别包括:
- 特定领域的自主性: Agentic RAG 系统专注于在已知领域内实现用户定义的目标,采用查询重写或工具选择等策略来改善结果。
- 基础设施依赖性: 系统的能力取决于开发人员集成的工具和数据。如果没有人工干预,它无法超越这些边界。
- 尊重护栏: 道德准则、合规规则和业务策略仍然非常重要。Agent 的自由始终受到安全措施和监督机制的约束 (希望如此?)
实际用例和价值
Agentic RAG 在需要迭代优化和精确性的场景中大放异彩:
- “正确性优先”的环境: 在合规性检查、法规分析或法律研究中,Agentic 模型可以重复验证事实、查阅多个来源并重写查询,直到生成经过彻底审查的答案。
- 复杂的数据库交互: 在处理结构化数据时,查询可能经常失败或需要调整,系统可以使用 Azure SQL 或 Microsoft Fabric OneLake 自主优化其查询,确保最终检索与用户的意图一致。
- 扩展的工作流程: 随着新信息的出现,较长时间运行的会话可能会发生变化。Agentic RAG 可以持续整合新数据,随着对问题空间的了解越来越多而改变策略。
治理、透明度和信任
随着这些系统在其推理中变得更加自主,治理和透明度至关重要:
- 可解释的推理: 模型可以提供其进行的查询、查阅的来源以及得出结论所采取的推理步骤的审计跟踪。Azure AI Content Safety 和 Azure AI Tracing / GenAIOps 等工具可以帮助保持透明度并降低风险。
- 偏差控制和平衡检索: 开发人员可以调整检索策略以确保考虑平衡、有代表性的数据源,并使用 Azure Machine Learning 为高级数据科学组织定制模型,定期审计输出以检测偏差或倾斜模式。
- 人工监督和合规性: 对于敏感任务,人工审查仍然至关重要。Agentic RAG 并不能取代高风险决策中的人工判断,而是通过提供更彻底审查的选项来增强人工判断。
拥有提供清晰操作记录的工具至关重要。没有它们,调试多步骤过程可能会非常困难。请参阅 Literal AI (Chainlit 背后的公司) 提供的 Agent 运行示例:
结论
Agentic RAG 代表了 AI 系统处理复杂的、数据密集型任务方式的自然演进。通过采用循环交互模式、自主选择工具并优化查询,直到获得高质量的结果,系统从静态的提示跟随转变为更具适应性、上下文感知的决策者。虽然仍然受到人类定义的基础设施和道德准则的约束,但这些 Agentic 能力为企业和最终用户提供了更丰富、更动态,最终也更有用的 AI 交互。