未来已来：深度解读 “模型即产品” 时代

45.2K 00

过去几年，关于人工智能下一阶段发展方向的讨论从未停歇：Agent 化？更强推理能力？抑或是真正的多模态融合？各种猜想层出不穷，预示着 AI 领域即将迎来新的变革。

现在，我认为是时候给出一个明确的判断了：“模型即产品” 的时代已经到来。 这不仅仅是一种趋势，更是对当前 AI 发展格局的深刻洞察。

无论是学术研究的前沿动态，还是商业市场的实际走向，所有的迹象都在清晰地指向这个变革性的方向。

通用模型规模扩张遭遇瓶颈： 通用大模型的 “越大越好” 发展模式，正逐渐显露出其局限性。这不仅仅是技术层面上的挑战，更是经济效益上的考量。正如 GPT-4 之后的行业讨论所揭示的，模型能力提升与算力成本增长之间，并非简单的线性关系，而是日益扩大的剪刀差。模型能力可能仅以线性速度增长，但训练和运行这些庞然大物的成本，却呈指数级攀升。即使像 OpenAI 这样拥有强大技术和资源的公司，也难以找到能够覆盖其巨额投入的商业模式，更不用说其他厂商。这预示着，单纯依赖模型参数规模的扩张，来无限提升 AI 能力的时代可能已经结束。 我们需要寻找更高效、更经济、更可持续的 AI 发展路径。
定向训练异军突起，效果远超预期： 与通用模型发展受阻形成鲜明对比的是，“定向训练 (Opinionated Training)” 方法展现出惊人的潜力。这种训练范式，强调针对特定任务和应用场景，对模型进行精细化调优和训练。强化学习 (Reinforcement Learning) 和推理 (Reasoning) 技术的融合，更是为定向训练注入了新的活力。我们看到，模型不再是简单地 “学习数据”，而是真正开始 “学会任务”。这是一种质的飞跃，标志着 AI 发展思路的转变。无论是小型模型在数学领域的惊艳表现，还是代码模型从代码生成器向代码库自治管理者的进化，亦或是 Claude 在几乎零信息输入下玩转复杂游戏的案例，都证明了定向训练的强大威力。 这种 “小而精”、“专而强” 的模型发展路线，或将成为未来 AI 应用的主流。
模型推理成本断崖式下降： 曾经被视为 AI 应用 “拦路虎” 的推理成本问题，如今也得到了极大的缓解。得益于 DeepSeek 等公司在模型优化和推理加速方面的突破性进展，AI 模型的部署和应用门槛大幅降低。 DeepSeek 的最新研究表明，现有的 GPU 算力，理论上已经可以满足全球数十亿人，每人每天使用前沿模型处理 1 万 tokens 的需求。 这意味着，算力不再是制约 AI 普及的关键因素，AI 大规模应用的时代正在加速到来。 对于模型提供商而言，仅仅依靠出售 tokens 这种 “按量计费” 的商业模式，显然已经无法充分挖掘 AI 模型的价值。他们必须将目光投向价值链的更高端，例如提供更垂直、更专业的模型服务和解决方案。

这种种迹象都在表明，AI 产业的发展重心，正在从 “通用大模型” 转向 “模型即产品” 的新范式。这不仅是一次技术路线的调整，更是一场商业模式和产业格局的深刻变革。 传统的 “应用为王” 理念，可能需要重新审视。 长期以来，投资者和创业者都将目光聚焦于 AI 应用层，认为应用创新才是 AI 商业化的关键。然而，在 “模型即产品” 的时代，应用层或许会成为最先被自动化和颠覆的环节。 未来的竞争焦点，将聚焦于模型本身，谁能拥有更先进、更高效、更专业的模型，谁就能在 AI 竞争中占据制高点。

未来模型的形态：专业化、垂直化、服务化

过去几周，我们已经看到了 “模型即产品” 范式下，涌现出的两款代表性产品：OpenAI 的 DeepResearch 和 Anthropic 的 Claude 3.7 Sonnet。这两款产品，都体现了新一代模型的发展趋势，预示着未来模型可能呈现出的形态。

OpenAI 的 DeepResearch，自发布以来就引发了广泛关注，但也伴随着不少误读。很多人将其简单地理解为 GPT-4 的一个 “套壳” 应用，或是基于 GPT-4 的搜索增强工具。 但事实远非如此。 OpenAI 实际上是训练了一个全新的模型，专门用于研究和信息检索任务。 DeepResearch 并非一个依赖外部搜索引擎或工具调用的 “工作流”，而是一个真正意义上的 “研究型语言模型 (Research Language Model)”。它具备端到端的自主搜索、浏览、信息整合和报告生成能力，无需任何外部干预。使用过 DeepResearch 的用户，都能明显感受到它与传统 LLM 或聊天机器人的巨大差异。它生成的报告，结构清晰、论证严谨、信息溯源可靠，体现出远超传统搜索工具和 LLM 的专业性和深度。

相比之下，市面上其他号称 “Deep Search” 的产品，例如 Perplexity 和 Google 的相关功能，则显得相形见绌。正如 Hanchung Lee 所指出的，这些产品本质上仍然是基于通用模型，进行一些简单的微调和功能叠加，缺乏针对搜索任务的深度优化和系统性设计。 DeepResearch 的出现，标志着 “模型即产品” 理念的初步落地，也为我们展示了专业化、垂直化模型的发展方向。

Anthropic 也在积极布局 “模型即产品” 战略，并对 Agent 模型提出了独到的见解。他们在去年 12 月发布了一篇研究报告，对 Agent 模型进行了重新定义。 Anthropic 认为，真正的 Agent 模型，应该具备 “自主性 (Autonomy)”，能够独立完成目标任务，而不是仅仅作为工作流中的一个环节。与 DeepResearch 类似，Anthropic 强调 Agent 模型应该在 “内部 (Internally)” 完成任务执行的全过程，包括动态规划任务流程、自主选择和调用工具等，而不是依赖预设的代码路径和外部编排。

当前市面上涌现出大量的 Agent 创业公司，但它们所构建的 “Agent”，大多仍停留在 “工作流 (Workflow)” 层面。这些 “Agent” 本质上是预先定义好的一系列代码流程，将 LLM 和各种工具串联起来，按照固定的步骤执行任务。这种 “伪 Agent” 方案，虽然在某些垂直领域可能具有一定的应用价值，但与 Anthropic 和 OpenAI 所定义的 “真 Agent” 相比，仍存在本质的差距。 真正的自主系统，必须从模型层面进行重塑和创新，才能实现质的飞跃。

Anthropic Claude 3.7 的发布，进一步印证了 “模型即产品” 的发展趋势。 Claude 3.7 是一款针对复杂代码场景进行深度优化的模型。在代码生成、代码理解、代码编辑等方面，Claude 3.7 都展现出卓越的性能。尤其值得关注的是，即使是像 Devin 这样高度复杂和智能化的 “AI 程序员” 工作流，在 Claude 3.7 的加持下，也能在 SWE 基准测试中取得显著的提升。 这表明，模型本身的强大能力，才是构建优秀应用的关键。 与其花费大量精力去设计复杂的工作流和外部工具，不如将资源投入到模型本身的研发和优化上。

Pleias 团队在 RAG (Retrieval-Augmented Generation) 领域的探索，也体现了 “模型即产品” 的思路。传统的 RAG 系统，通常由多个相互独立又彼此耦合的工作流环节构成，例如数据路由、文本分块、结果重排序、查询理解、查询扩展、上下文融合、搜索优化等等。这些环节之间缺乏有机的整合，导致系统整体脆弱性较高，维护和优化成本也居高不下。 Pleias 团队正在尝试利用最新的训练技术，将 RAG 系统中的各个环节 “模型化”，构建两个核心模型：一个负责数据预处理和知识库构建，另一个负责信息检索、内容生成和报告输出。这两个模型相互协作，共同完成 RAG 的全流程任务。这种方案，需要全新的模型架构设计、精细化的合成数据管线和定制化的强化学习奖励函数，是真正的技术创新和研究突破。 通过 “模型化” RAG 系统，可以极大地简化系统架构，提升系统性能和稳定性，降低部署和维护成本，最终实现 RAG 技术的规模化应用。

总而言之，“模型即产品” 的核心理念在于 “转移复杂性 (Displacing Complexity)”。将原本需要在应用层解决的复杂问题，通过模型训练的方式，提前在模型层面进行处理和消化。模型在训练阶段，预先学习和适应各种复杂场景和极端情况，从而使得模型部署和应用变得更加简单高效。 未来，AI 产品的核心价值，将更多地体现在模型本身，而非应用层的花哨功能和复杂工作流。 模型训练者将成为价值创造和价值捕获的主导者。 Anthropic Claude 的目标，正是要颠覆和取代当前基于工作流的 “伪 Agent” 系统，例如 LlamaIndex 提供的基础 Agent 框架。他们希望通过更强大的模型，实现更智能、更自主、更易用的 AI 应用。

未来已来：深度解读 “模型即产品” 时代
将被如下更先进的模型架构所取代：

“模型即产品” 时代的生存法则：自研模型，或被模型吞噬？

再次强调，大型 AI 实验室的战略布局并非 “秘密行动”，而是清晰而公开的。尽管在某些方面，他们的策略可能显得不够透明，但其核心意图却昭然若揭： 他们将从模型层出发，向上渗透到应用层，构建端到端的 AI 产品和服务，并力图在价值链中占据主导地位。 这种趋势的商业影响是深远的。 Databricks 的 Gen AI 副总裁 Naveen Rao 的观点，可谓一针见血：

未来 2-3 年内，所有闭源 AI 模型提供商都将逐步停止直接销售 API 接口。只有开源模型，才会继续通过 API 的形式对外提供服务。闭源模型提供商的目标，是构建具有独特竞争力的非通用 AI 能力，而为了交付这些能力，他们需要打造极致的用户体验和应用界面。 未来的 AI 产品，将不再仅仅是模型本身，而是一个集成了模型、应用界面和特定功能的完整应用。

这意味着，过去那种模型提供商和应用开发者 “分工合作” 的蜜月期，已经宣告结束。 应用开发者，尤其是那些依赖第三方模型 API 构建应用的 “封装器 (Wrapper)” 公司，正面临着前所未有的生存挑战。 未来，AI 产业的竞争格局，可能朝着以下几个方向演变：

模型提供商自研应用，抢占市场份额： Claude Code 和 DeepSearch 的出现，已经预示着模型提供商正在积极拓展应用领域。 DeepSearch 没有对外开放 API 接口，而是被整合到 OpenAI 的高级订阅服务中，成为提升服务价值的核心功能。 Claude Code 则是一个轻量级的终端集成工具，方便开发者直接在代码编辑器中使用 Claude 3.7 模型。 这些举动表明，模型提供商正在加速构建自己的应用生态，直接面向用户提供服务，抢占市场份额。 值得注意的是，一些应用封装器，例如 Cursor，在接入 Claude 3.7 模型后，反而出现了性能下降和用户流失的情况。这进一步印证了 “模型即产品” 的观点： 真正的 AI Agent，关注的是如何最大化发挥模型自身的能力，而不是迁就和适配已有的工作流。
应用封装器转型，发力模型自研： 面对模型提供商的 “降维打击”，一些头部应用封装器，已经开始积极寻求转型，试图构建自己的模型训练能力。尽管这些公司在模型训练方面起步较晚，实力相对薄弱，但它们也在积极布局。例如，Cursor 强调其小型代码自动补全模型的价值； WindSurf 拥有内部的低成本代码模型 Codium； Perplexity 则长期依赖自研的分类器进行流量路由，并开始训练自己的 DeepSeek 变体，用于搜索增强。 这些举动表明，应用封装器们已经意识到，仅仅依靠 “API 调用” 模式，难以在未来的竞争中立足，必须掌握一定的模型自研能力，才能保持竞争力。
小型封装器何去何从？UI 创新或成突围关键： 对于数量众多的中小应用封装器而言，未来的生存空间将更加狭窄。如果大型模型实验室全面收缩 API 服务，这些小型封装器可能会被迫转向更加中立的第三方推理服务提供商。 在模型能力趋同的情况下，UI (User Interface) 和用户体验 (User Experience) 的创新，或将成为小型封装器突围的关键。 长期以来，UI 的价值在 AI 领域被严重低估。随着通用模型的功能越来越强大，模型部署和应用流程日益简化，优秀的用户界面，将成为提升产品竞争力，吸引用户的关键因素。 尤其是在 RAG 等应用场景中，模型能力可能不再是决定性因素，而易用性、交互性和用户体验，将变得更加重要。

简而言之，对于大多数应用封装器而言，未来面临着一个 “二选一” 的生存困境： 要么转型成为模型训练者 (Training)，要么最终被模型拥有者吞噬 (Being Trained On)。 目前，这些应用封装器所做的工作，在某种程度上，都成为了大型模型实验室的 “免费市场调研” 和 “免费数据标注”。因为用户的所有交互数据和反馈，最终都会流向模型提供商，帮助他们改进模型，优化产品，进一步巩固其市场地位。

应用封装器的未来走向，很大程度上也取决于投资者的态度和认知。 令人担忧的是，当前的投资环境，似乎对模型训练领域存在一定的 “偏见”。 许多投资者仍然固守 “应用为王” 的传统观念，对模型训练的价值和潜力认识不足。这种投资 “错配”，可能会阻碍 AI 技术的健康发展，甚至导致西方 AI 产业在未来的竞争中落后。一些应用封装器，可能也因此不得不 “隐藏” 自己在模型训练方面的努力，以免被投资者误解为 “不务正业”。例如，Cursor 的小型模型和 Codium，至今都缺乏充分的宣传和推广。 这种 “重应用，轻模型” 的投资导向，需要引起业界的深刻反思和警惕。

被低估的强化学习：AI 未来竞争的关键

当前 AI 投资领域，普遍存在一种 “强化学习价值被低估 (Reinforcement Learning was not priced in)” 的现象。这种现象的背后，是投资界对 AI 技术发展趋势的认知偏差，以及对强化学习技术战略意义的忽视。

风险投资机构在 AI 领域的投资决策，通常基于以下几个假设：

应用层是价值洼地，模型层只是基础设施： 投资者普遍认为，AI 的真正价值体现在应用层，应用创新才是颠覆现有市场的关键。模型层只是提供 API 接口的基础设施，不具备核心竞争力。
模型 API 价格将持续下降，应用封装器将持续受益： 投资者预期，模型提供商为了扩大市场份额，将不断降低 API 调用价格，从而提升应用封装器的盈利空间。
闭源模型 API 足以满足所有应用需求： 投资者相信，基于闭源模型 API 构建的应用，能够满足各种场景的需求，即使在对数据安全和自主可控性要求较高的敏感行业，也能找到合适的解决方案。
模型训练投入大、周期长、风险高，不如直接购买 API： 投资者普遍认为，自建模型训练能力，是一项 “吃力不讨好” 的投资。模型训练需要巨额资金、漫长周期和高技术门槛，风险远高于直接购买模型 API，快速开发应用。

然而，以上这些假设，在 “模型即产品” 的时代背景下，都显得越来越站不住脚。 我担心，如果投资界继续抱持这些过时的观念，可能会错失 AI 发展的战略机遇，甚至导致市场资源的错误配置。 当前的 AI 投资热潮，可能演变成一场 “冒险的赌博”，一次 “未能准确评估最新技术发展 (尤其是强化学习) 的市场失灵”。

风险投资基金 (VC)，本应在投资组合中寻求 “非相关性 (Uncorrelated)”。 VC 的目标，不是跑赢 S&P500 指数，而是构建多元化的投资组合，降低整体风险，确保在经济下行周期，仍然有部分投资能够获得回报。 模型训练，恰恰符合 “非相关性” 投资的特征。 在西方主要经济体面临衰退风险的大背景下，AI 模型训练领域，蕴藏着巨大的创新和增长潜力，与宏观经济周期的关联性较弱。 然而，模型训练公司却普遍面临融资困境，这与风险投资的本质逻辑是相悖的。 Prime Intellect 是为数不多的西方 AI 模型训练初创公司，具备发展成为前沿 AI 实验室的潜力。尽管他们在技术上取得了诸多突破，包括训练出首个去中心化 LLM，但其融资规模，却与普通的 “套壳” 应用公司相差无几。 这种 “劣币驱逐良币” 的现象，令人深思。

除了少数几家大型实验室外，目前的 AI 模型训练生态系统，仍然非常脆弱和边缘化。 全球范围内，专注于模型训练的创新公司，屈指可数。 Prime Intellect、Moondream、Arcee、Nous、Pleias、Jina、HuggingFace 预训练团队 (规模很小) 等，几乎构成了开源 AI 模型训练领域的全部力量。再加上 Allen AI、EleutherAI 等少数几家学术机构，他们共同构建和维护着当前开源 AI 训练基础设施的基石。在欧洲，我了解到，有 7-8 个 LLM 项目，计划基于 Pleias 团队开发的 Common Corpus 语料库和预训练工具进行模型训练。 开源社区的蓬勃发展，在一定程度上弥补了商业投资的不足，但也难以从根本上解决模型训练生态系统面临的挑战。

OpenAI 似乎也敏锐地意识到了 “垂直强化学习 (Vertical RL)” 的重要性。近期，有消息传出，OpenAI 高层对硅谷创业圈 “轻 RL，重应用” 的现状表示不满。据推测，这一信息很可能来自 Sam Altman 本人，并可能在下一期 YC 创业营中有所体现。 这预示着，OpenAI 的合作策略，可能正在发生转变。 未来，OpenAI 选择的合作伙伴，可能不再仅仅是 API 客户，而是参与到模型早期训练阶段的 “合作承包商”。 模型训练，将从幕后走向台前，成为 AI 竞争的核心环节。

“模型即产品” 的时代，意味着 AI 创新模式的转变。 单打独斗的时代已经过去，开放合作、协同创新，将成为主流。 搜索和代码领域，之所以能够率先实现 “模型即产品” 的落地，很大程度上是因为这两个领域的应用场景相对成熟，市场需求明确，技术路径清晰，容易快速 “摘取低垂的果实”。像 Cursor 这样的创新产品，可以在短短几个月内快速迭代和发布。然而，面向未来的更多高价值 AI 应用场景，例如 rule-based 系统智能化升级等，仍然处于早期探索阶段，技术挑战巨大，市场需求尚不明朗，难以通过 “短平快” 的方式实现突破。这些领域，需要拥有跨学科背景和高度专注的小型团队，进行长期而深入的研发投入。 这些 “小而美” 的创新团队，或将成为未来 AI 产业的重要生力军，并有可能在完成早期技术积累后，被大型科技公司收购，实现价值变现。 用户界面 (UI) 领域，也可能涌现出类似的合作模式。一些专注于 UI 创新的公司，可以通过与大型模型实验室建立战略合作关系，获得闭源专用模型的独家 API 访问权限，共同打造具有差异化竞争力的 AI 产品。

在 “模型即产品” 的大潮中，DeepSeek 的战略布局，无疑更具前瞻性和野心。 DeepSeek 的目标，不仅仅是 “模型即产品”，而是 “模型即通用基础设施层”。 与 OpenAI 和 Anthropic 类似，DeepSeek 创始人连文峰也公开阐述了 DeepSeek 的发展愿景：

我们认为，当前阶段是 技术创新的爆发期，而非应用爆发期。只有当一个完整的 AI 上下游产业生态系统建立起来，DeepSeek 才没有必要亲自去做应用。当然，如果需要，DeepSeek 也可以做应用，但这并非首要任务。 DeepSeek 的核心战略，始终是坚持技术创新，构建强大的 AI 通用基础设施平台。

在 “模型即产品” 时代，如果仅仅将目光局限于应用层，无异于 “用上一代战争的将领，来指挥下一代战争”。令人担忧的是，西方 AI 产业界，似乎仍然沉浸在 “应用为王” 的旧思维模式中，对 AI 发展的新趋势，缺乏足够的认知和准备。 或许很多人还没有意识到，AI 领域的 “战争”，已经悄然进入了新的阶段。 谁能率先拥抱 “模型即产品” 的新范式，谁就能在未来的 AI 竞争中赢得先机。