DeepSeek风暴背后：吴恩达警示开放模型竞赛将重塑中美AI价值观版图

39.6K 00

亲爱的朋友们，

本周 DeepSeek 引发的热议让许多人清晰地看到几个重要趋势：(i) 中国在生成式AI领域正迎头赶上美国，这对AI供应链产生重大影响；(ii) 开放权重模型正在使基础模型层商品化，为应用开发者创造机会；(iii) 扩大规模并非AI进步的唯一途径。尽管业界高度关注和炒作算力，但算法创新正在快速降低训练成本。

大约一周前，中国公司深度求索（DeepSeek）发布了 DeepSeek-R1 ，这款在基准测试中表现可与 OpenAI o1 相媲美的模型以MIT许可协议开放权重。上周在达沃斯，许多非技术背景的商业领袖都向我询问此事。周一股市出现"DeepSeek抛售潮"：英伟达等多家美国科技公司股价暴跌（截至撰稿时已部分回升）。

我认为DeepSeek促使人们意识到以下几点：

中国生成式AI正缩小与美国的差距。当2022年11月ChatGPT发布时，美国在生成式AI领域显著领先中国。人们的认知转变较慢，因此近期仍有中美两国的朋友认为中国处于落后。但事实上，这一差距在过去两年已快速缩小。通过通义千问（我的团队已使用数月）、 Kimi 、 InternVL 和 DeepSeek 等中国模型，中国明显正在缩小差距，在视频生成等领域甚至曾暂时领先。

令我振奋的是，DeepSeek-R1以开放权重形式发布，并附有详细技术报告。相比之下，多家美国公司通过炒作"AI灭绝人类"等假设性风险来推动限制开源的政策。现在显而易见，开源/开放权重模型已成为AI供应链的关键部分：众多企业将采用这些模型。若美国继续阻碍开源，中国将主导该供应链环节，最终多数企业将使用更体现中国而非美国价值观的模型。

开放权重模型正在使基础模型层商品化。正如我先前所述，大语言模型Token价格正快速下降，开放权重加速了这一趋势并为开发者提供更多选择。OpenAI o1每百万输出Token收费60美元，而DeepSeek R1仅需2.19美元。这近30倍的价差使降价趋势引发广泛关注。

训练基础模型并出售API访问的业务充满挑战。该领域许多公司仍在寻求收回高昂训练成本的途径。文章"AI的6000亿美元难题"对此挑战阐述精辟（但需要明确，我认为基础模型公司的工作卓有成效且期待其成功）。相较而言，基于基础模型构建应用程序蕴含着大量商业机遇。既然他人已投入数十亿训练模型，你仅需数美元即可获取这些模型来开发客服聊天机器人、邮件摘要工具、AI医生、法律文档助手等应用。

AI进步不仅依赖规模扩张。扩大模型规模推动进步的论调甚嚣尘上。平心而论，我曾是规模论的早期倡导者。多家公司通过鼓吹"资本越多就能(i)扩大规模且(ii)稳定提升性能"的叙事筹集数十亿美元。这导致业界过度聚焦规模扩张，而忽视其他多种进步途径。受美国AI芯片禁令推动，DeepSeek团队不得不在性能较弱的H800 GPU上进行大量优化创新，最终使模型训练成本（不计研究投入）控制在600万美元以内。

这是否真会降低算力需求仍有待观察。有时商品单价下降反而导致总支出增加。我认为长期来看，人类对智能和算力的需求几乎没有上限，因此即使成本降低，人类仍将消耗更多智能资源。

社交媒体对DeepSeek进展的解读众说纷纭，如同罗夏墨迹测试般映射出不同立场。我认为DeepSeek-R1的地缘政治影响尚未完全显现，但它确为AI应用开发者带来福音。我的团队已开始头脑风暴，这些新创意只有借助开放的先进推理模型才能实现。现在仍是构建AI应用的黄金时期！