微软 AI Agent 入门课程：Agentic RAG

2.1K 00

本课程全面概述了 Agentic Retrieval-Augmented Generation (Agentic RAG)，这是一种新兴的 AI 范式，其中大语言模型 (LLMs) 在从外部来源获取信息的同时，自主规划其下一步行动。与静态的“检索-然后-阅读”模式不同，Agentic RAG 涉及对 LLM 的迭代调用，穿插着工具或函数调用以及结构化输出。系统会评估结果、优化查询、在需要时调用其他工具，并持续此循环，直到获得满意的解决方案。

简介

本课程将涵盖以下内容：

理解 Agentic RAG: 了解 AI 领域的新兴范式，其中大语言模型 (LLMs) 在从外部数据源提取信息的同时，自主规划其下一步行动。
掌握迭代的“制造者-检查者”模式: 理解迭代调用 LLM 的循环，穿插着工具或函数调用以及结构化输出，旨在提高正确性并处理格式错误的查询。
探索实际应用: 确定 Agentic RAG 大放异彩的场景，例如“正确性优先”的环境、复杂的数据库交互和扩展的工作流程。

学习目标

完成本课程后，你将了解如何/理解：

理解 Agentic RAG: 了解 AI 领域的新兴范式，其中大语言模型 (LLMs) 在从外部数据源提取信息的同时，自主规划其下一步行动。
迭代的“制造者-检查者”模式: 掌握迭代调用 LLM 的循环的概念，穿插着工具或函数调用以及结构化输出，旨在提高正确性并处理格式错误的查询。
拥有推理过程: 理解系统拥有其推理过程的能力，决定如何处理问题，而不依赖于预定义的路径。
工作流程: 了解 Agentic 模型如何独立决定检索市场趋势报告、识别竞争对手数据、关联内部销售指标、综合分析结果并评估策略。
迭代循环、工具集成和记忆: 了解系统如何依赖循环交互模式，在各个步骤中保持状态和记忆，以避免重复循环并做出明智的决策。
处理失败模式和自我纠正: 探索系统强大的自我纠正机制，包括迭代和重新查询、使用诊断工具以及依靠人工监督。
Agent 的边界: 了解 Agentic RAG 的局限性，重点关注特定领域的自主性、基础设施依赖性和对护栏的尊重。
实际用例和价值: 确定 Agentic RAG 大放异彩的场景，例如“正确性优先”的环境、复杂的数据库交互和扩展的工作流程。
治理、透明度和信任: 了解治理和透明度的重要性，包括可解释的推理、偏差控制和人工监督。

什么是 Agentic RAG?

Agentic Retrieval-Augmented Generation (Agentic RAG) 是一种新兴的 AI 范式，其中大语言模型 (LLMs) 在从外部来源提取信息的同时，自主规划其下一步行动。与静态的“检索-然后-阅读”模式不同，Agentic RAG 涉及对 LLM 的迭代调用，穿插着工具或函数调用以及结构化输出。系统会评估结果、优化查询、在需要时调用其他工具，并持续此循环，直到获得满意的解决方案。这种迭代的“制造者-检查者”模式可以提高正确性、处理格式错误的查询并确保高质量的结果。

系统主动拥有其推理过程，重写失败的查询，选择不同的检索方法，并集成多个工具（例如 Azure AI Search 中的向量搜索、SQL 数据库或自定义 API），然后最终确定其答案。Agentic 系统的显著特点是它能够拥有自己的推理过程。传统的 RAG 实现依赖于预定义的路径，但 Agentic 系统会根据其找到的信息质量自主确定步骤的顺序。

定义 Agentic Retrieval-Augmented Generation (Agentic RAG)

Agentic Retrieval-Augmented Generation (Agentic RAG) 是 AI 开发中的一种新兴范式，其中 LLMs 不仅从外部数据源提取信息，还自主规划其下一步行动。与静态的“检索-然后-阅读”模式或精心设计的提示序列不同，Agentic RAG 涉及对 LLM 的迭代调用循环，穿插着工具或函数调用以及结构化输出。在每一步，系统都会评估其获得的结果，决定是否优化其查询，在需要时调用其他工具，并持续此循环，直到获得满意的解决方案。

这种迭代的“制造者-检查者”操作方式旨在提高正确性，处理对结构化数据库的格式错误的查询 (例如 NL2SQL)，并确保平衡、高质量的结果。系统不是仅仅依赖于精心设计的提示链，而是主动拥有其推理过程。它可以重写失败的查询，选择不同的检索方法，并集成多个工具（例如 Azure AI Search 中的向量搜索、SQL 数据库或自定义 API），然后最终确定其答案。这消除了对过于复杂的编排框架的需求。相反，一个相对简单的“LLM 调用 → 工具使用 → LLM 调用 → …”循环可以产生复杂且有理有据的输出。

拥有推理过程

使系统具有“Agentic”的显著特点是它能够拥有自己的推理过程。传统的 RAG 实现通常依赖于人类预先定义模型的路径：一个思维链，概述要检索的内容和时间。但是，当一个系统真正具有 Agentic 时，它会在内部决定如何处理问题。它不仅仅是执行脚本；它会根据其找到的信息质量自主确定步骤的顺序。例如，如果要求它创建产品发布策略，它不会仅仅依赖于一个详细说明整个研究和决策工作流程的提示。相反，Agentic 模型会独立决定：

使用 Bing Web Grounding 检索当前市场趋势报告。
使用 Azure AI Search 识别相关的竞争对手数据。
使用 Azure SQL Database 关联历史内部销售指标。
通过 Azure OpenAI Service 将分析结果综合为具有凝聚力的策略。
评估策略是否存在差距或不一致之处，并在必要时提示进行另一轮检索。所有这些步骤（优化查询、选择来源、迭代直到对答案“满意”）都由模型决定，而不是由人类预先编写的。

迭代循环、工具集成和记忆

Agentic 系统依赖于循环交互模式：

初始调用: 用户的目标 (即用户提示) 被呈现给 LLM。
工具调用: 如果模型识别出缺失的信息或模糊的指令，它会选择一个工具或检索方法（例如向量数据库查询 (例如 Azure AI Search 对私有数据的混合搜索) 或结构化 SQL 调用）来收集更多上下文。
评估和优化: 在审查返回的数据后，模型会决定信息是否足够。如果不够，它会优化查询、尝试不同的工具或调整其方法。
重复直到满意: 此循环持续进行，直到模型确定它有足够的清晰度和证据来提供最终的、经过充分推理的响应。
记忆和状态: 由于系统在各个步骤中保持状态和记忆，它可以回忆起先前的尝试及其结果，避免重复循环并在进行过程中做出更明智的决策。

随着时间的推移，这会产生一种不断发展的理解感，使模型能够处理复杂的多步骤任务，而无需人工持续干预或重新设计提示。

处理失败模式和自我纠正

Agentic RAG 的自主性还包括强大的自我纠正机制。当系统遇到死胡同（例如检索到不相关的文档或遇到格式错误的查询）时，它可以：

迭代和重新查询: 模型不会返回低价值的响应，而是尝试新的搜索策略、重写数据库查询或查看替代数据集。
使用诊断工具: 系统可以调用额外的函数，旨在帮助它调试其推理步骤或确认检索数据的正确性。Azure AI Tracing 等工具将有助于实现强大的可观察性和监控。
依靠人工监督: 对于高风险或重复失败的情况，模型可能会标记不确定性并请求人工指导。一旦人工提供了纠正反馈，模型就可以在未来采纳该经验。

这种迭代和动态的方法使模型能够持续改进，确保它不仅仅是一个一次性系统，而是一个可以从给定会话中的失误中学习的系统。

Agent 的边界

尽管 Agentic RAG 在任务中具有自主性，但它并不等同于通用人工智能。它的“Agentic”能力仅限于人类开发人员提供的工具、数据源和策略。它无法发明自己的工具或超出已设定的领域边界。相反，它擅长动态编排手头的资源。与更高级的 AI 形式的主要区别包括：

特定领域的自主性: Agentic RAG 系统专注于在已知领域内实现用户定义的目标，采用查询重写或工具选择等策略来改善结果。
基础设施依赖性: 系统的能力取决于开发人员集成的工具和数据。如果没有人工干预，它无法超越这些边界。
尊重护栏: 道德准则、合规规则和业务策略仍然非常重要。Agent 的自由始终受到安全措施和监督机制的约束 (希望如此?)

实际用例和价值

Agentic RAG 在需要迭代优化和精确性的场景中大放异彩：

“正确性优先”的环境: 在合规性检查、法规分析或法律研究中，Agentic 模型可以重复验证事实、查阅多个来源并重写查询，直到生成经过彻底审查的答案。
复杂的数据库交互: 在处理结构化数据时，查询可能经常失败或需要调整，系统可以使用 Azure SQL 或 Microsoft Fabric OneLake 自主优化其查询，确保最终检索与用户的意图一致。
扩展的工作流程: 随着新信息的出现，较长时间运行的会话可能会发生变化。Agentic RAG 可以持续整合新数据，随着对问题空间的了解越来越多而改变策略。

治理、透明度和信任

随着这些系统在其推理中变得更加自主，治理和透明度至关重要：

可解释的推理: 模型可以提供其进行的查询、查阅的来源以及得出结论所采取的推理步骤的审计跟踪。Azure AI Content Safety 和 Azure AI Tracing / GenAIOps 等工具可以帮助保持透明度并降低风险。
偏差控制和平衡检索: 开发人员可以调整检索策略以确保考虑平衡、有代表性的数据源，并使用 Azure Machine Learning 为高级数据科学组织定制模型，定期审计输出以检测偏差或倾斜模式。
人工监督和合规性: 对于敏感任务，人工审查仍然至关重要。Agentic RAG 并不能取代高风险决策中的人工判断，而是通过提供更彻底审查的选项来增强人工判断。

拥有提供清晰操作记录的工具至关重要。没有它们，调试多步骤过程可能会非常困难。请参阅 Literal AI (Chainlit 背后的公司) 提供的 Agent 运行示例：

结论

Agentic RAG 代表了 AI 系统处理复杂的、数据密集型任务方式的自然演进。通过采用循环交互模式、自主选择工具并优化查询，直到获得高质量的结果，系统从静态的提示跟随转变为更具适应性、上下文感知的决策者。虽然仍然受到人类定义的基础设施和道德准则的约束，但这些 Agentic 能力为企业和最终用户提供了更丰富、更动态，最终也更有用的 AI 交互。