近期,Model Context Protocol (MCP) 在 AI 领域引发了广泛关注。这项技术旨在解决一个核心问题:如何让用户在不控制底层 Agent 的情况下,为其扩展工具能力? 围绕 MCP 的实际效用,LangChain 首席执行官 Harrison Chase 与 LangGraph 负责人 Nuno Campos 展开了一场深入的讨论。
MCP 的核心价值:为不可控 Agent 扩展工具
Harrison Chase 认为,MCP 的价值在于它能够为用户提供一种向他们无法直接控制的 Agent 添加工具的方式。他以 Claude Desktop、Cursor 和 Windsurf 等应用为例,指出用户在使用这些产品时,无法直接修改底层 Agent 的逻辑,Agent 所能使用的工具也仅限于内置的少数几个。
然而,用户可能希望为这些 Agent 增加额外的工具,以满足更个性化的需求。例如,用户可能希望为代码编辑器 Cursor 集成一个特定的代码分析工具,或者为 Claude Desktop 添加一个自定义的知识库访问工具。为了实现这一目标,就需要一种通用的协议,使得 Agent 能够识别并调用这些外部工具。MCP 的出现正是为了解决这个问题。
Harrison 进一步指出,MCP 对于非开发者构建 Agent 也具有重要意义。 随着 Agent 构建逐渐普及,越来越多的领域专家希望参与到 Agent 的创建过程中。 这些专家可能不具备深厚的编程技能,但他们拥有丰富的领域知识和对工具的特定需求。MCP 可以让他们在无需修改 Agent 核心逻辑的情况下,为其配置所需的工具,从而降低 Agent 构建的门槛。
Harrison 敏锐地捕捉到了 MCP 的潜在价值,即填补现有 Agent 工具生态的一个重要空白。 在 Agent 技术快速发展的今天,用户对 Agent 功能的个性化需求日益增长。 MCP 如果能够有效降低工具集成的复杂性,无疑将加速 Agent 技术的普及,并催生更多创新应用场景。 尤其对于非开发者而言,更友好的工具扩展方式将极大地释放他们的创造力,推动 AI 应用的 democratization。
实用性挑战:Agent 定制与工具集成
Nuno Campos 对 MCP 的实用性提出了质疑。 他认为,Agent 的设计需要与所使用的工具紧密结合。 简单地为 Agent 添加工具,而不对 Agent 的系统提示甚至架构进行相应的调整,往往难以达到理想的效果。
Nuno 承认,如果用户只是想替换掉 Windsurf 等应用中内置的 Web 搜索工具,MCP 或许能够发挥作用。 但他认为,这并非 MCP 最有价值的应用场景。 真正吸引人的用例是,用户能够通过注入一个“神奇的工具”来赋予 Cursor 等应用开发者都未曾设想过的全新能力。 然而,在实际应用中,这种情况很难发生。
Nuno 强调,在大多数生产环境中,为了确保 Agent 能够有效地利用工具,必须对 Agent 的系统消息,甚至整体架构进行精细的调整,使其与可用的工具集相匹配。
Nuno 的观点则更偏向于技术务实主义。 他指出了工具集成并非简单的“即插即用”,Agent 的效能很大程度上取决于其与工具的协同程度。 这实际上点出了当前 AI Agent 技术发展的一个普遍挑战:如何在高灵活性的工具扩展与 Agent 性能的最优化之间取得平衡。 Nuno 的担忧并非空穴来风,许多开发者在使用大型语言模型时,都体会过 prompt engineering 的重要性,以及系统架构对最终效果的深刻影响。
可靠性与用户期望的权衡
Harrison 承认,基于 MCP 集成工具的 Agent 可能无法达到 99% 的可靠性。 但他认为,即使 Agent 的可靠性稍有不足,也可能仍然具有实用价值。 他指出,工具描述和使用说明固然重要,但以下几点也不容忽视:
- MCP 包含工具定义,优秀的 MCP 服务器能够提供比用户自行编写的更完善的工具描述。
- MCP 允许加入提示语,用户可以通过提示语来指导 Agent 如何使用工具。
- 随着底层模型能力的不断提升,开箱即用的工具调用 Agent 的性能也会越来越好。
Harrison 认为,虽然仅仅依靠 MCP 集成和通用的工具调用 Agent 无法构建出像 Cursor 这样完善的产品,但 MCP 在某些场景下仍然具有价值,例如内部或个人 Agent 的构建。
对 Nuno 的质疑,Harrison 展现出更乐观的态度。 他承认 MCP 可能无法在所有场景下都达到完美,但他强调了“够用就好”的实用主义原则。 在技术发展的初期阶段,过分追求完美往往会限制创新。 Harrison 的观点也符合技术迭代的规律,即先快速推出可用版本,然后在实践中不断改进。 此外,他对模型能力提升的信心,也反映了当前 AI 领域的一个普遍共识:模型能力的持续提升将不断拓展 Agent 的应用边界。
模型能力与用户期望的同步提升
Nuno 反驳道,LangGraph 的工具调用基准测试表明,即使是针对特定工具集量身定制了架构和提示的 Agent,当前的模型在调用正确工具时,成功率也仅有约 50%。 一个半数时间都无法正确工作的个人 Agent,其实用性令人怀疑。
Nuno 认同模型能力会不断提升,但用户期望也会随之水涨船高。 他引用 Jeff Bezos 的话语:“顾客总是对现状不满,他们的期望永无止境。” 如果开发者掌握了包括 UI、提示、架构和工具在内的整个技术栈,或许能够满足用户不断增长的期望。 否则,前景堪忧。
Nuno 进一步用数据说话,指出了当前模型在工具调用方面的局限性。 50% 的成功率无疑是一个令人担忧的数字,特别是在追求高效率和高可靠性的生产环境中。 同时,Nuno 也从用户期望的角度提出了更高的要求。 技术进步不仅要提升能力,更要跟上用户不断增长的期望值。 这实际上是对 MCP 以及所有 AI Agent 技术提出了一个更高的标准:不仅要能用,更要好用,并且能够持续满足用户日益增长的需求。
长尾效应与 Zapier 类比
Harrison 仍然对模型能力的提升充满信心。 他认为,无论当前 Agent 的成功率如何,未来都只会不断提高。 他强调,评估 MCP 的价值,不应将其与精心打磨的 Agent 相比较。 MCP 的真正价值在于它能够实现大量的长尾连接和集成。
Harrison 将 MCP 比作 Zapier,Zapier 能够连接电子邮件、Google Sheets 和 Slack 等各种应用,用户可以利用 Zapier 创建无数的工作流,而不可能为每一种工作流都开发一个完善的 Agent。 借助 MCP,用户可以创建自己的 Zapier 版本,实现各种个性化的集成。
Harrison 巧妙地将 MCP 的定位从“高性能的通用 Agent 工具平台” 转向了“长尾场景的连接器”。 Zapier 的类比非常贴切,指出了 MCP 的潜在应用场景并非是替代现有 Agent 解决方案,而是在更广泛、更个性化的长尾需求中发挥价值。 这种思路的转变,实际上降低了对 MCP 技术成熟度的要求,也使其更容易在短期内找到应用场景。 长尾理论在互联网领域已经被反复验证,如果 MCP 能够抓住长尾需求,同样有可能获得成功。
与 LangChain 工具的差异
Nuno 指出,LangChain 已经拥有一个包含 500 个工具的库,但这些工具在生产环境中的使用频率并不高。 这些工具都按照相同的协议实现,与任何模型兼容,并且可以自由替换。 他质疑 MCP 的优势何在?难道仅仅是因为 MCP 采用了需要用户在本地终端运行大量服务器,且仅兼容桌面应用的“独特形式”吗? 这在他看来并非优势。 他认为,Zapier 可能是 MCP 潜力的上限。
Harrison 认为,LangChain 工具与 MCP 工具的区别在于,LangChain 工具主要面向 Agent 开发者,而 MCP 则主要面向无法开发 Agent 的用户。 MCP 的目标是为用户提供一种向他们无法控制的 Agent 添加工具的途径。 此外,MCP 也使得非开发者能够为其使用的 Agent 添加工具,而 LangChain 工具则更侧重于开发者。 非开发者的数量远超开发者,这才是 MCP 的潜在市场。
对于 MCP 当前的形态,Harrison 也承认存在不足。 但他相信 MCP 的形态会不断改进。 他设想,未来的 MCP 应用可以实现一键安装,无需在本地终端运行服务器,并且可以通过 Web 应用访问。 这才是 MCP 的发展方向。
Nuno 从 LangChain 自身的工具生态出发,质疑 MCP 的必要性。 他提出的问题很直接:如果 LangChain 已经提供了大量的工具,但使用率不高,那么 MCP 又如何能解决这个问题? Harrison 则从用户群体的差异化角度给出了回应,他认为 MCP 的目标用户与 LangChain 工具的用户有所不同。 这种区分用户群体的策略,有助于更精准地定位 MCP 的市场,并避免与现有工具生态的直接竞争。 “非开发者” 这个群体的确非常庞大,如果 MCP 能够有效服务好这部分用户,市场潜力依然可观。
MCP 的未来:类比 Custom GPTs 和 Plugins
Nuno 总结 Harrison 的观点,认为 MCP 需要变得更像 OpenAI 的 Custom GPTs,才能证明当前的炒作是合理的。 然而,Custom GPTs 的受欢迎程度也并不高。 他反问道,Custom GPTs 缺失了什么,而 MCP 又拥有什么?
Harrison 认为,MCP 更像是 OpenAI 曾经推出但最终失败的 Plugins。 他承认自己对 Plugins 的体验已经模糊,但他认为:
- MCP 的生态系统已经远大于 Plugins 的生态系统。
- 模型的能力已经得到显著提升,能够更好地利用这些工具。
Nuno 对 MCP 的生态系统规模表示怀疑。 他在一个随机找到的目录中只发现了 893 个 MCP 服务器。 他认为 Harrison 可能只是根据 Twitter 时间线上提及 MCP 的推文数量来判断生态系统的大小。
Nuno 认为,如果 MCP 想要超越 AI 发展史上的一个脚注,就必须进行以下改进:
- 降低复杂性:工具协议为何需要同时处理提示和 LLM 完成?
- 简化实现难度:服务工具的协议为何需要双向通信? Nuno 认为,接收服务器日志并非充分理由。
- 支持服务器部署:无状态协议是关键,不应因为构建 LLM 应用而忘记在线扩展的最佳实践。 一旦支持服务器部署,身份验证等其他问题也会随之出现。
- 弥补质量损失:将随机工具插入到对这些工具一无所知的 Agent 中,必然会带来质量上的损失,需要找到方法弥补。
Harrison 承认 Nuno 的质疑有一定道理, 并再次将问题抛给 Twitter 社区,发起投票,询问大家认为 MCP 是昙花一现还是未来的标准。
总而言之,Model Context Protocol (MCP) 作为一种新兴技术,试图在 Agent 工具扩展性方面带来新的突破。 尽管目前 MCP 仍面临诸多挑战,但其潜在价值和未来发展方向仍然值得关注。
观点
Model Context Protocol (MCP) 不太可能成为未来的标准。 对 MCP 的前景,我个人感到悲观。
MCP 想要解决的问题固然有意义,但其实际效果可能不佳。 Harrison Chase 认为 MCP 有助于用户扩展 Agent 工具,这想法初衷虽好,但用户或许并无此需求。 用户可能更倾向于直接使用完善的产品,而非自行添加工具。
Nuno Campos 的质疑颇有道理。 他指出,工具与 Agent 需良好配合才能奏效。 MCP 协议可能对此考虑不足, 仅简单连接工具或不足以使 Agent 有效利用。 当前大模型在工具调用上仍有局限, 指望 MCP 构建高效工具平台或过于乐观。
MCP 的实现方式也显复杂。 本地运行服务器、仅限桌面应用,用户体验不佳。 AI 应用趋向云端化、轻便化, MCP 若不改进,恐难被用户接受。
OpenAI 的 Plugins 及 Custom GPTs 均未成功, 已预示工具扩展平台之路不易。 MCP 欲求超越,但恐怕难以如愿,或将如 Plugins 般被快速遗忘。
因此,MCP 或仅为 AI 发展中短暂现象,难成未来主流。 虽有实验价值,然 Harrison Chase 的目标实难实现。 相比之下, 提升大模型自身能力, 或构建更垂直的 Agent 应用,可能更实际有效。
总而言之, MCP 不太可能取得成功, 或许仅是一场炒作。 我对 MCP 的未来深感怀疑。 探索 MCP 虽有益, 但其最终成功概率不高。