AI个人学习
和实操指南

DeepSeek风暴背后:吴恩达警示开放模型竞赛将重塑中美AI价值观版图

亲爱的朋友们,

本周 DeepSeek 引发的热议让许多人清晰地看到几个重要趋势:(i) 中国在生成式AI领域正迎头赶上美国,这对AI供应链产生重大影响;(ii) 开放权重模型正在使基础模型层商品化,为应用开发者创造机会;(iii) 扩大规模并非AI进步的唯一途径。尽管业界高度关注和炒作算力,但算法创新正在快速降低训练成本。


大约一周前,中国公司深度求索(DeepSeek)发布了 DeepSeek-R1 ,这款在基准测试中表现可与 OpenAI o1 相媲美的模型以MIT许可协议开放权重。上周在达沃斯,许多非技术背景的商业领袖都向我询问此事。周一股市出现"DeepSeek抛售潮":英伟达等多家美国科技公司股价暴跌(截至撰稿时已部分回升)。

我认为DeepSeek促使人们意识到以下几点:

中国生成式AI正缩小与美国的差距。当2022年11月ChatGPT发布时,美国在生成式AI领域显著领先中国。人们的认知转变较慢,因此近期仍有中美两国的朋友认为中国处于落后。但事实上,这一差距在过去两年已快速缩小。通过 通义千问 (我的团队已使用数月)、 Kimi 、 InternVL 和 DeepSeek 等中国模型,中国明显正在缩小差距,在视频生成等领域甚至曾暂时领先。

令我振奋的是,DeepSeek-R1以开放权重形式发布,并附有详细技术报告。相比之下,多家美国公司通过炒作"AI灭绝人类"等假设性风险来推动限制开源的政策。现在显而易见,开源/开放权重模型已成为AI供应链的关键部分:众多企业将采用这些模型。若美国继续阻碍开源,中国将主导该供应链环节,最终多数企业将使用更体现中国而非美国价值观的模型。

开放权重模型正在使基础模型层商品化。正如我先前所述,大语言模型Token价格正快速下降,开放权重加速了这一趋势并为开发者提供更多选择。OpenAI o1每百万输出Token收费60美元,而DeepSeek R1仅需2.19美元。这近30倍的价差使降价趋势引发广泛关注。

DeepSeek风暴背后:吴恩达警示开放模型竞赛将重塑中美AI价值观版图-1

训练基础模型并出售API访问的业务充满挑战。该领域许多公司仍在寻求收回高昂训练成本的途径。文章"AI的6000亿美元难题"对此挑战阐述精辟(但需要明确,我认为基础模型公司的工作卓有成效且期待其成功)。相较而言,基于基础模型构建应用程序蕴含着大量商业机遇。既然他人已投入数十亿训练模型,你仅需数美元即可获取这些模型来开发客服聊天机器人、邮件摘要工具、AI医生、法律文档助手等应用。

AI进步不仅依赖规模扩张。扩大模型规模推动进步的论调甚嚣尘上。平心而论,我曾是规模论的早期倡导者。多家公司通过鼓吹"资本越多就能(i)扩大规模且(ii)稳定提升性能"的叙事筹集数十亿美元。这导致业界过度聚焦规模扩张,而忽视其他多种进步途径。受美国AI芯片禁令推动,DeepSeek团队不得不在性能较弱的H800 GPU上进行大量优化创新,最终使模型训练成本(不计研究投入)控制在600万美元以内。

这是否真会降低算力需求仍有待观察。有时商品单价下降反而导致总支出增加。我认为长期来看,人类对智能和算力的需求几乎没有上限,因此即使成本降低,人类仍将消耗更多智能资源。

社交媒体对DeepSeek进展的解读众说纷纭,如同罗夏墨迹测试般映射出不同立场。我认为DeepSeek-R1的地缘政治影响尚未完全显现,但它确为AI应用开发者带来福音。我的团队已开始头脑风暴,这些新创意只有借助开放的先进推理模型才能实现。现在仍是构建AI应用的黄金时期!

未经允许不得转载:首席AI分享圈 » DeepSeek风暴背后:吴恩达警示开放模型竞赛将重塑中美AI价值观版图

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文