AI个人学习
和实操指南
讯飞绘镜

朱啸虎:大模型创业“伪需求”,商业化才是真信仰

去年初,朱啸虎接受了张小珺的采访。

彼时,月之暗面刚刚完成 10 亿美元融资,用户增长数据一路绝尘。OpenAI 发布 Sora 了技术报告和演示视频,整个 AI 圈再次狂欢。


那时最流行的话题,是中国与美国相差几个月,开源能否追上闭源,阿里又投资了谁家大模型 ……

而朱啸虎已经开始拷问大模型的商业模式,推演大模型创业公司的最终结局,提醒关注中国独特的数据优势,以及反复警告自造血别烧钱 ……也是那时,朱啸虎与月之暗面的论战,还在水下。

原文被反复转发和讨论。十个月后回看,朱啸虎的大部分预测已经应验,当然也有意外,而这正是时间的动人之处。

 

我信仰 AGI,但我信仰应用啊,我信仰能马上商业化的

腾讯新闻《潜望》:你是什么时候确定,你不会投场上任何一家中国大模型公司的?

朱啸虎:我们一看就知道,这个肯定没戏。

腾讯新闻《潜望》:一看就知道是什么时候?

朱啸虎:他们出来融的时候。我们一开始就说了,我就不看好大模型。

腾讯新闻《潜望》:第一家你看的谁?

朱啸虎:我都不愿意去聊,你知道吗?这没有意义——这些公司,要场景没场景,要数据没数据,你说它有什么价值?而且一上来估值这么贵。

“AI 四小龙” (商汤、旷视、云从、依图) 投资人赚钱的没几个,对吧?回到大模型,结果可能还不如“四小龙”。“四小龙”早年还是有些黄金时代的,一开始收入上去算挺快。大模型你有啥收入啊?

旷视(2011)、依图(2012)、商汤(2014)、云从(2015)这四家计算机视觉公司,凭借着深度学习技术爆发和国内安防建设的双重东风,一举成为 2016 - 2018 年中国 AI 领域最耀眼的独角兽群体。

然而,我们现在谈起「AI四小龙」时,更多是唏嘘:差异化不足的同赛道竞争,商业化不足的落地场景,AI 技术创业公司的发展何其艰难。

更何况,突破发展、融资、上市等重重关隘之后,等待它们的还有一家早已扎根的传统巨头——海康威视。

按照朱啸虎的观点,上述历史正在大模型时代加速重演,只不过换了一批新的创业公司,而它们对手则是资源更多、决心更大的字节和阿里。

 

关键是我就现在问你一个很扎心的问题:GPT-4 你要不要投入做科研?你做 GPT-4 科研至少砸四五千万美金。

腾讯新闻《潜望》:(做科研)到 GPT-5?

朱啸虎:不是,到 GPT-4!!GPT-5 要几亿美金!

2024 年 7 月,SemiAnalysis 发长文介绍了 GPT-4 架构、参数量等信息,并估算 GPT-4 单次训练成本高达 6300 万美元。

2024 年 12 月,WSJ 报道称,GPT-5 至少进行过两轮训练,每轮耗时数月,仅一轮计算成本就接近 5 亿美元。

此外,2024 年 4 月,斯坦福 HAI 发布 Artificial Intelligence Index Report 2024,报告估算 OpenAI GPT-4 训练成本为 7800 万美元,Google Gemini Ultra 训练成本为 1.91 亿美元。

 

关键是万一你砸了四五千万美金做出来,别人开源了呢?你不是全白砸了?这个是很扎心的问题。现在中国大部分公司,有几个敢真的砸钱去研发 GPT-4 的?

今天到 GPT-3.5,大家都差不多,但 GPT-4 是要做一些研究的,不是那么简单,现在还不完全是工程问题。那你万一砸下去,又等别人开源了,你不是全都白砸钱?大厂肯定要自己做。创业公司你敢吗?

国产大模型目前整体水平位于 GPT-3.5 与 GPT-4 之间,且大部分通用大模型更新节奏已经明显变慢。

 

腾讯新闻《潜望》:都说要做。

朱啸虎:真的敢砸钱的,心里肯定很虚的。

 

腾讯新闻《潜望》:你在 2023 年上半年决定不投大模型公司的时候,压力大吗?另一家没有参投大模型公司的基金,就表示压力挺大。毕竟大部分一线美元基金都入场了。

朱啸虎:不大啊。为什么压力很大?中国 VC 从来没有靠共识赚过钱。

投资人 be like:2023 年拿不到份额,压力大;2024 不知道怎么退出,压力大。

 

腾讯新闻《潜望》:也有从业者说,如果你在 2023 年上半年承认自己不看好大模型,会被视作没有信仰。

朱啸虎:什么叫没有信仰?哈哈哈哈哈。

腾讯新闻《潜望》:不信仰 AGI(通用人工智能)。

朱啸虎:不,我信仰 AGI,但我信仰应用啊,我信仰能马上商业化的。

2025 年初,Sam Altman 在个人博客发表长文,宣告 OpenAI 已经掌握 AGI 构建方式,并开始向 superintelligence 迈进。

但是,就在 2024 年 3 月,Sam Altman 接受 Lex Friedman 专访时表示,包括 Ilya Sutskever 在内的所有人,都还没有构建出真正的 AGI。

他预测,可能到 2030 年(或者更早),人类可以构建出一些强大的、具备特定能力的系统,它们在某些方面能接近或达到 AGI 水平。实现 AGI 是复杂且充满挑战的。

所以,发生了什么事,让 Sam Altman 对 AGI 的预期从 2030 年快速缩短到了 2025 年?或者说,那些信仰 AGI 的人具体是在信仰什么?

 

 

 

“马上能变现!马上能变现!”

腾讯新闻《潜望》:你过去一年投了哪些 AIGC 公司?

朱啸虎:很多不一定是过去这一年投的,但它转型做 AIGC 反而很好,我们再追加投资。

有个做 AI 视频面试的,2023 年做得非常好。这让我很吃惊!去年招聘市场很冷,但它 AI 视频面试比 2022 年翻了一倍以上。哈哈。招多少人我不知道,但面试还是要面的。校招面试成本很贵啊,现在用 AI 可以降低成本。

这种场景很多。本来做微信私域营销,现在可以用 AI 取代人——用 LLaMA 训练两三个月,至少做到人类 Top 30水平,马上去掉 50% 人工销售。中国在这方面场景远远领先美国。

这家公司是近屿智能,成立于 2017 年,是一家以 AI + RPA + BI 技术为核心的人力资源科技公司,创始人兼 CEO 是方小雷。

2019 年,公司获得金沙江创投的天使轮融资,随后获得科大讯飞、英诺天使、黑马基金等投资。2024 年,公司完成 A 轮融资,由智望资本领投,金沙江创投跟投。

 

FancyTech,你知道吗?我给你看看。AIGC 视频广告,这个很酷的。他们产品做得特别效果好,而且马上能变现。2022 年我们投的时候才 1000 多万收入,去年 5000 多万了,涨了五六倍,都是盈利的。

你说这个在美国能做吗?美国根本做不出来!Pika(一家全球炙手可热的 AI 视频生成公司)今天根本做不出来的!

FancyTech(时代涌现)成立于 2020 年,基于自研视频行业模型 Deep Video 为消费行业客户提供高效稳定的 AIGC 解决方案,特别是奢侈品、时尚、快消等行业。

2022年,公司先后完成了 Pre-A 轮和 A 轮融资。2023年,完成近亿元 B 轮融资,DCM 领投,老股东金沙江创投、华山资本等跟投。

2024 年 7 月,42 章经某期播客的嘉宾是 FancyTech 创始人 William。出乎意料的,公司前员工和前实习生们在播客评论区开始团建,指出 FancyTech 内部种种管理乱象,并引发了一阵舆论风波,这期播客后续也被下架。

一个月之后,朱啸虎在某次采访里做出回应:我们为什么看好这些(公司),就是靠 100% AI 是做不到的,必须要靠着外包,把它最后那部分效果做出来,创业公司才能守得住。

这份回应与他的投资逻辑是自洽的。但是!舆论最关注的 FancyTech 公司内部管理混乱的问题,并没有触及啊 🤪

 

腾讯新闻《潜望》:如果底层是大模型能力,上面应用公司构建的壁垒是什么?

朱啸虎:数据啊,美国没有产品短视频数据。在美国看亚马逊、Shopify,还是基于照片。所有的电商,美国基于照片。中国过去三年全部转成短视频了。

腾讯新闻《潜望》:可是其他中国公司看到效果好,可以立马抄一家。

朱啸虎:抄很难的,它比别人领先一年。

很多垂直领域,都要积累数据、积累优化。他们 60% - 70% 客户授权监控效果,就知道哪些视频适合淘宝,哪些适合小红书,哪些适合抖音,有闭环数据反馈。后面追不容易。

二是销售管理能力。大部分大模型创始人不知道怎么管销售。不懂商业化、不懂管销售,那你做什么?

2023 年,主流声音对国产大模型发展的预期非常悲观,观点之一就是「中国数据质量落后」。

也有不同的声音。

比如,考虑到 2C 应用的数据积累、垂直行业的应用场景,中国则是更占优势的。因为国内有字节、拼多多、美团等大量成功的 2C 公司,而美国在 2013 年之后的投资集中于 2B 的 SaaS 公司,成功的 C 端应用公司数量及数据规模都非常有限。

最早听到这个观点,可以追溯到 2023 年 12 月,是 42 章经与莫傑麟的一期播客对谈。事实验证了这些顶级投资人判断的前瞻性。

 

腾讯新闻《潜望》:你没有投 to C 项目?

朱啸虎:to C 有的,还有点早。to B 马上能商业化,基本不用烧钱。昨天我们投的一个公司说:AIGC PMF,你十个人找不到,投一百个人同样找不到。和人数、成本没关系的。

你不要去砸钱。砸钱做 AIGC,不可能的!关键是找不找得到 PMF。你如果找到 PMF,不用砸几千万美金去砸个大模型,成本不高,拿 LLaMA 训练两三个月足够了。像我们(投)的公司都不需要多少张卡,最差的就一张卡。Fancy 可能十几张卡,现在收入高了,所以到一百多张卡。

朱啸虎一直以来的投资逻辑就是:找到花几十万、一百万、两百万就能验证到底有没有用户需求的产品。

然后,他把这套投资逻辑,完整带进了 AI 时代。

 

腾讯新闻《潜望》:Sora 横空出世,会对这些项目形成降维打击吗?

朱啸虎:还是会帮助。我们生成的视频,是大模型不可能 100% 做的,有部分人工、部分 AI。今天大模型,尤其用 Transformer 这种结构一出来有幻觉和偏差,必然要整合到工作流,需要人工修改,去 fine-tuning。

你一定要做成 AI 100% 做不了的东西,这才是中国的机会,100% 大模型能做的很快就被颠覆掉,你现在做的都是浪费。

很多开发者和产品团队,应该会沉痛地表示认可。

毕竟过去两年,大模型上下文长度从最初 GPT-3 的 4K 增长到了 GPT-4 的 32K,代码生成能力从最初的简单补全突飞猛进到了半自动编程,生成的图像从主体不稳定到现在可以精准控制 ……

经常一觉醒来,新发布的大模型已经开始在各群喜提「wocao」。

如果团队错误预判了技术进步的方向,在大模型未来演进的射程之内修修补补,就注定所有的努力终将是徒劳。

 

腾讯新闻《潜望》:所以在中国的 AIGC 机会第一波爆发在企业服务,可以这么理解?

朱啸虎:短期内肯定做 to B,起来快。iPhone、大哥大、电脑出来的时候,都是 to B 先用啊。马上能提高生产力、见到效果。企业愿意花钱。

to C 要见到 iPhone 3 时刻。就像当年移动互联网 to C 应用爆发是 Multi-Touch(多点触控),想不到的,对吧?愤怒的小鸟和切西瓜是 Multi-Touch 出来以后,才成为全球爆款。

大模型到底在什么点让 to C 应用爆发,不知道。今天说“个人助理”都是技术人员的想象。我就问你,有几个人需要个人助理?都是典型的伪需求!

我们对未来 Super App 的唯一共识,就是不知道它是个啥。

一种观点是,ChatGPT 本身就是一个 Super App:发布仅 5 天,用户量就突破 100 万;发布两个月后,用户量突破 1 亿;目前周活跃用户超过 2.5 亿,有史以来增长最快&最有影响力的 App 之一。国内对应 App 则是 豆包、Kimi 等等。

不过,海外独角兽对此的预测是:Chatbot 仍将是包容性最强,用户受众最广的前端交互,但 Chatbot 的竞争在 2024 年结束了,2025 年各模型公司要在全新的产品形态上竞赛。

另一种观点是,人人都需要一个近乎全能的 AI 助手。罗永浩最近推出的 J1 Assistant,功能和交互已经初具雏形。但就像上文提到的,朱啸虎认为这是一个典型的伪需求。

 

腾讯新闻《潜望》:这些 to B 公司在 AI 上训练达到什么效果,会实现指数级提高?

朱啸虎:很简单,见到客户第一面就能签单。见面签单,是一个考核指标,就是 PMF。

以前企服为什么难?销售周期长,半年,所以销售增长难。现在你给客户创造数量级价值提升。定制化那就没戏了,就是标准化服务、第一面 POC(Proof of Concept,概念验证)、第二面正式合同。

PMF,Product-Market Fit,产品-市场契合点。

这个概念最早的提出者是 Marc Andreessen。

2007 年,他在一篇博客里写道「Product-market fit means being in a good market with a product that can satisfy that market」。通俗点说就是找到了真实的需求点。

自那之后,围绕 PMF 诞生了很多理论。

比如,Sean Ellis 提出「40% 法则」,即如果无法再继续使用某产品,超过 40% 用户表示非常失望,产品就达到了 PMF。

最近两年,结合 LLM 特性,出现了一些衍生概念。

比如,百川智能创始人王小川提出的 TPF(Technology-Product Fit) ,即技术与产品的结合点。

 

腾讯新闻《潜望》:怎么看中国企服投资人都说这个赛道上没有大仗、更没有挣过大钱?(“一个 billion return 的机会都没有。”)

朱啸虎:美国企服公司第一年三倍,第二年三倍,第三年两倍,第四年两倍,很快做到一亿美金 ARR(Annual Recurring Revenue,年度经常性收入)。中国以前的企服软件在几千万人民币的时候增长放到 50% 了,很难增长。AIGC 出来以后不一样,去年很多公司增长三倍到五倍以上。

腾讯新闻《潜望》:你怎么看过去两年,一些投资机构中,企服赛道投资人被迫群体性消失的这个现象?

朱啸虎:哈哈哈。就是啊,这个说实话很可惜,没有熬到春天。中国企服还是有机会的,但可能还有三到五年冬天。宏观太多不确定,企服就是剩者为王。今天你能不能靠 AIGC 迅速达到不烧钱的爆发增长是唯一之路。

 

腾讯新闻《潜望》:to C 大爆发需要 iPhone3 时刻,现在是什么时刻?

朱啸虎:刚刚 iPhone1、iPhone2 吧。大模型进化速度比移动互联网快了十倍。什么时候每个手机上都有大模型,to C 应用可能会爆发。

端侧大模型是指运行在终端设备(手机、平板等)上的大模型(因为参数量相对较小,也被称为小模型,黄金尺寸是 3B 左右),隐私性和安全性好,延迟低、支持离线使用。

当前,比较知名的端侧模型包括面壁智能 MiniCPM 系列、智谱 ChatGLM 系列、阿里巴巴 Qwen 系列、上海 AI lab InternLM 系列、微软 Phi 系列、Nexa AI 的 Octopus 系列等等。

 

腾讯新闻《潜望》:如果回顾 2023 年大模型,不管是全球来看还是中国来看,你会把哪些时刻作为关键节点?

朱啸虎:(此处思考了 2 秒……)LLaMA 上线是非常重要的。

开源是完全不一样的局面,至少让中国在应用层面创新有基础了。LLaMA 之前,很多套壳用 OpenAI,是有点问题的。但 LLaMA 以后,至少没啥问题了。

我们那些 CTO 都很年轻。拿 LLaMA 训练个两三个月,最差的就一张卡,训练两三个月就马上能商业化了。大家想想看——这个商业化门槛真的很低很低。马上能变现!马上能变现!

非常好奇,朱啸虎对「2024 年大模型发展关键节点」的判断是什么 👀

我个人体感最强烈的节点是 2024 年 5 月,DeepSeek-V2 把大模型 API 价格降到了每百万 token 仅需要 1 元人民币。

随后,字节、阿里、百度、腾讯、智谱等厂商迅速跟进,宣布降价或免费策略。当然,这其中有「真」有「假」,更有厂商直接表示不参与价格战(比如零一万物)。

由此开始,DeepSeek、GLM-4-Flash、SiliconFlow 成为国内 AI 产品开发者最保底的 API 选项,给了更多产品诞生的可能性。

确实如当时的分析所说, DeepSeek API 降价是 2C 产品爆发前一个非常积极的信号。

 

腾讯新闻《潜望》:Google 刚推出开源模型 Gemma,相对之前的 LLaMa、Mistral 表现怎么样?OpenAI 之后开源的可能性有多大?

朱啸虎:总体反馈比 LLaMa 2 好一点,行业里有些人觉得它要抢在 LLaMa 3 之前发,LLaMa 3 也快了。OpenAI 目前没必要。现在 LLaMa、Mistral 和 Google,这三个在竞争。离 OpenAI 差距还远。

当前,LMSYS 大模型竞技场排行榜,开源大模型前 3 名分别是 DeepSeek-V3、Yi-Lightning、Qwen2.5-plus-1127,全是中国公司的模型。而且 DeepSeek V3 性能不错,已经非常接近顶级的闭源模型了。

全球开源模型的格局,已经发生了颠覆性的变化。

上述提到的 3 个开源模型(系列),最新版本性能都介于 GPT-3.5 和 GPT-4 之间,各自进展如下:

✦ LLaMa 3 发布于 2024 年 4 月 18 日,此后又发布了 3.1 版本(7月)、3.2 版本(10月)、3.3 版本(12月)。

✦ Gemma 2 发布于 2024 年 6 月 27 日,包括 2.6B、9B、27B等不同参数规模。之后再无重要更新。

Mistral AI 于 7 月到 10 月之间,陆续发布 Mistral Large 2、Pixtral、Ministral 等系列大模型。有消息透露 Mistral AI 已经停止了预训练工作。

 

如果它们表现追上 GPT-4,OpenAI 开源一个小模型也有机会。很多垂直应用,我们发现 Mistral 2 比 LLaMa 2 好用。反正开源一个模型,我们都试试,看看哪个更好用一点。

2024 年 12 月,OpenAI 在官网宣布,将从「非营利主导营利公司」的结构中脱离出来,并新建一家可盈利的、注册于特拉华州的公益公司(PBC),主要业务将由新成立的公益公司掌握。

事实上,OpenAI 最后一个开源模型是 GPT-2(2019 年)。

自那以后的 GPT-3、DALL·E、CLIP、Whisper、GPT-4、Sora、o1 模型等等,OpenAI 不再开源模型代码和权重,只对外发布一份技术报告。技术报告也从详细的技术分项逐渐演变更简略的概述,减少了技术细节的披露。

我们还能等到 OpenAI 再开源新的模型么?

 

 

“这是典型的 FOMO 嘛”

腾讯新闻《潜望》:我问 2023 年中国大模型卷了一年卷出了什么?一位投资人告诉我,卷出几家大模型创业公司。

朱啸虎:再过一年再看看吧,这几家能有几个还在?

2025 年初答朱啸虎:都还在,但过得,比较艰难。

✦ 月之暗面应该是国内最早停止预训练的团队,海外 2C 应用 Ohai(虚拟陪伴)、Noisee(音乐视频生成)也已经停止,目前专注做好 Kimi 应用和生产力场景。Kimi 月活排国内总榜第 2 名,而第 1 名是后来居上、断层领先的豆包。

✦ Minimax 目前重点是海外 2C 对话应用 Talkie(虚拟陪伴),用户数据已经反超 Charactor.AI 成为赛道 No.1。但是国内版本 星野 被字节 猫箱 抢走了赛道第一名位置,2B 市场也被字节抢占不少。

✦ 零一万物 公开表示不再追求训练超级大模型,大部分训练和 AI infra 团队加入联合实验室成为阿里员工,公司将专注于出海 2C 应用和国内 2B 业务。这是第一家公开大幅调整发展方向的中国大模型独角兽。

✦ 百川智能 被证实将转型医疗垂直领域,前段时间又发布了金融大模型。

✦ 智谱 重点业务是 2B 和 2G,后续发展的重点方向是 AutoGLM。

阶跃星辰 比较特别,除了训练模型之外,2C 应用主要采取与外部开发团队合作的方式,时不时出个小爆款,比如我们所熟知的胃之书、歌词暴改机、林间疗愈室等。

朱啸虎在随后 2024 年 6 月的某论坛上,对上述观点进行了延申:一线大模型公司几乎都已经与巨头结盟,二线大模型公司则只能卖身了;可以断言,五年后可能不再有独立的大模型公司存在,要么只有 AI 应用公司或云服务公司。

 

腾讯新闻《潜望》:他们每一家你都看过吗?

朱啸虎:我一看见这个概念就知道没戏的,没有可能性的,我一个都不聊。我都很熟的。王慧文(美团联合创始人、光年之外创始人),我这么熟,我都不愿意去找他和他谈这个事。

腾讯新闻《潜望》:你属于他上一场战争里的敌人战队——他在美团阵营、你在饿了么(作为投资人)。

朱啸虎:没有、没有,和他私交很好的。

腾讯新闻《潜望》:当王慧文振臂一呼,说要入局大模型的时候,你是什么反应?

朱啸虎:大家冷静一点,让子弹飞一会儿。飞半年,你就知道到底行不行了。

腾讯新闻《潜望》:王慧文携 5000 万美元入场和突然的病退离场,在大模型战事里扮演什么样的角色?

朱啸虎:这就是技术男的浪漫主义。王慧文没有想明白这个事,他的擅长在商业化。他一开始如果做应用,结果肯定比现在要好很多。那个时候,大家就 FOMO 情绪比较高涨的时候。

2023 年 6 月,美团收购光年之外。2024 年 11 月,媒体报道称王慧文已经回归美团,带领 GN06 独立团队探索 AI 应用。

光年之外目前已经推出了几款 AI 应用,如 Dodoboo(面向海外市场的儿童绘画应用)、俏鱼乐伴(与小天才手表合作开发的儿童 AI 语音互动应用)、妙刷(基于 ComfyUI 的图像生成和编辑工具)、Wow(虚拟社交社区)等。

据 01Founder 报道,王慧文为 GN06 确立了两大发力点:一是进行独立的、无边界的创新探索;二是面向全球市场寻求突破。

 

腾讯新闻《潜望》:很多大模型公司现在沿着王慧文提出的“双轮驱动”在做。

朱啸虎:怎么双轮驱动?你双轮能转起来吗?有哪一个大模型双轮转起来的?百度,我说实话都不敢说自己双轮转起来。百度至少还有很多场景,文心一言至少做得早,至少有 100 万 DAU。它也不敢说今年双轮驱动转起来了。

不出意外的话,当初「模应一体」的目标已经落空了。

Minimax、零一、百度等通用模型的进展已经放缓;智谱、DeepSeek、Qwen 等缺少出圈的 2C 应用(Chatbot 不算)。

但是偏偏,出现了意外——字节。

2024 下半年,字节可谓进展神速:一边是狠狠挖人,模型能力快速迭代;另一边「产品工厂」艺能觉醒,饱和式覆盖了所有热门产品方向,豆包、即梦、Cici、Gauth、Hypic、coze…

左脚踩右脚,螺旋升天。

国外与之对应的是——Google。

2024 下半年,这家科技巨头终于挽回颜面,发布的 Gemini 2.0 系列模型都挺能打,NotebookLM、Illuminate、Learn About、ImageFX、Whisk 等应用也陆续出圈。

血条厚,是真抗揍啊。

 

腾讯新闻《潜望》:怎么看一些基金在这波大模型公司中的布局?

朱啸虎:有些是典型的 FOMO 嘛,就是 Fear of Missing Out,怕错过。

腾讯新闻《潜望》:你不怕错过?

朱啸虎:我们无所谓的,我们有啥好错过的?当年移动互联网刚出来,大家想做中国本地化 OS,后来这些公司都在哪里啊?我们投了点心操作系统(李开复旗下创新工场孵化的第一家公司),后来还好,被百度收了。今天的大模型也要等大厂收,今天大厂怎么收啊?移动互联网的时候还没有反垄断,我们还赚点小钱嘛。

腾讯新闻《潜望》:一个正常的投资人不应该是,我先想办法入局再说?

朱啸虎:很便宜的话入局,大家还试试。这么贵的估值,去那干嘛啊?我根本聊都不愿意聊。

现在和这个“四小龙”时不一样。“四小龙”是在资本泡沫时期长大的,一轮加一轮呢,根本不停的。你到今天为止,现在谁还能融下一轮?今天这个国产大模型基本都要找政府拿钱,政府的钱现在也不好拿了。而且,估值已经抬到这里了,你后面的估值怎么弄?

2024 年中,大额融资新闻不多。直到年末,百川、智谱、面壁、爱诗科技、阶跃星辰等纷纷发布新一轮融资消息,投资方都包括国资。

 

腾讯新闻《潜望》:2024 年会涌现中国大模型公司的并购或收购潮吗?——就像之前你见证过的美团与点评合并,或者阿里收购饿了么。

朱啸虎:技术的人,都是不相信我比别人差的。你说这个怎么合并?(笑)第二,现在谁愿意并购啊?而且今天并购,如果大家都用 LLaMA 开源改一改,有啥东西是我没有的?我有数据,有场景,你有啥?你就有几个人。

现在可能并购就是为并购一个团队。这个团队值多少钱?你能花多少钱?和以前那个时代是完全不一样的。

国外的 Microsoft 与 Inflection AI、Google 与 Character.AI,国内的阿里云与零一万物,其实是差不多的「剧本」:大厂把核心技术人才带走,让投资人拿本金加利息退出。

回顾下这三起经典的「收编」案例:

✦ 2024 年 3 月,Microsoft 向 Inflection AI 支付 6.5 亿美元,获得其大模型技术的使用权,并将 Inflection AI 大部分员工纳入麾下,包括其联合创始人和关键研究人员。

✦ 2024 年 8 月,Google 以 25 亿美元的估值收购 Character.AI 投资者的股票,并向其支付大模型技术的非独家许可费用。Character.AI 两位联合创始人及核心研究人员加入 Google DeepMind 团队。

✦ 2025 年 1 月,阿里云与零一万物成立联合实验室,零一万物大部分训练和 AI infra 团队加入该实验室,成为阿里员工。具体细节暂时没有透露更多。

 

腾讯新闻《潜望》:这些大模型公司的出路在哪?

朱啸虎:我也不知道。我都不愿意去关心这些事情。今天我对所有的公司就说,你有多少收入?你能不能不烧钱?都只关心这个。

2024 年 9 月初,有两份关于「大模型六小龙」的爆料开始在 AI 社区里流传。

大家开始做连连看,试图找到「海外产品惨败全砍了」「从繁华走入静默状态」「预训练不做了 C 端也不做了」这些劲爆消息与各家动向里蛛丝马迹的关联。

现在,根据公开消息,也能对应个七七八八了。

 

腾讯新闻《潜望》:你在之前的采访中说,上半年投了大模型的投资人下半年后悔了。这是他们告诉你的,还是你猜的?

朱啸虎:这个就不好说了。肯定有人后悔的。关键你下一步钱真的不好拿,你现在手上钱又不够。真的很尴尬。你 GPT-4 到底干不干?——不干,你和别人有啥差异性;你干,万一别人 GPT-4 开源,你又好后悔。你要做垂直场景,垂直场景哪一个你有优势?

 

腾讯新闻《潜望》:但就在今年 2 月,月之暗面刚融了 10 亿美金,投资方是阿里、砺思资本、小红书等。据说其他大模型公司也在做这样大笔的交易。这意味着市场上仍然有人愿意投,而且不少。

朱啸虎:主要是大厂,大厂还是 FOMO,怕自己错失。月之暗面大部分钱是阿里出的。

2023 年和 2024 年,月之暗面、MiniMax、智谱AI、百川智能和零一万物,都先后获得了阿里的投资,累计金额超过了 100 亿元人民币。坊间称之为「阿里轮」。

 

腾讯新闻《潜望》:阿里和月之暗面会形成微软和 OpenAI 这样的模式吗?

朱啸虎:需要看阿里的投资部和内部的调节了。这个还不一定,阿里内部也有好几个团队在做,这到底是要看谁好用,业务部门才会用。

捋一个时间线。不识庐山真面目,只缘身在此山中。

2024 年 2 月,阿里巴巴向月之暗面投资 8 亿美元。投资的主要推动者胡晓,还将月之暗面的大模型推到阿里多个业务场景进行试点应用,并帮助进入企业服务市场。

2024 年 4 月,通义千问模型发布,阿里巴巴宣布所有产品未来将接入「通义千问」大模型进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。

2024 年 9 月,胡晓从阿里战投离职,加入晨壹基金。

2024 年 11 月,循环智能及其五家投资方(金沙江创投等)在香港对杨植麟和张宇韬提起仲裁,指控他们在未获得同意豁免书的情况下启动融资并创立月之暗面。

2024 年 12 月,朱啸虎与杨植麟公开交锋,朱啸虎与张予彤之间的矛盾逐渐公开化。详情可以查看「暗涌 Waves」专题报道。

 

腾讯新闻《潜望》:其他巨头接下来会也这么大笔地投资或者干脆并购一家大模型公司吗?

朱啸虎:关键是对内部团队的信心了。现在看来,大厂就阿里展现出并购意愿。不像以前,大厂都有并购意愿。但阿里今天愿意出的钱,和以前肯定是完全不一样的啊。

字节应该是没有并购意愿的,觉得自己能做。百度肯定觉得自己能干。腾讯现在不好说,腾讯内部好几个团队在做,但至少目前没有看到强烈的并购意愿。而且腾讯一贯思路是不急的,在后面慢慢跟,它有场景、有数据,你看腾讯从游戏到视频到音乐到文学,都是在后面跟着跟着第一了。

2024 年过去了,各家的确在按照上述路线发展。字节全线发力,百度活在梦里,腾讯慢慢悠悠。

 

腾讯新闻《潜望》:你怎么看美团收购光年之外?虽然这个很特殊。

朱啸虎:完全是给老王(王慧文)一个解脱了,而且基本是投资人把本金拿回来。这也是一个警示——以后的并购,如果不是那么成功的并购,可能就是让投资人拿点本金加利息回去。大厂都不是那么财大气粗,并购和以前没法比的。如果就是让投资人拿点本金加利息回去,那投资有啥意思啊?

当然,月之暗面如果证明自己,大模型能追上闭源水平、能做到 GPT-4.5 或 GPT-5,收购是有价值的。但如果只做到开源水平,就收个团队,你能给多少钱?

中国大模型的进展,如果追上开源,至少你还有存在价值;如果追不上开源,就没有意义了;如果追上闭源,你才能有独到的额外的价值。

 

腾讯新闻《潜望》:对已经入局的同行们,你想说什么?

朱啸虎:(想了好久)这个他妈的不太好说,对吧。

(又想了好久)我觉得这个事大家……这个不太好说,这个不太好说,这个不太好说。

反正他们也无所谓,他们钱多,说实话。

 

 

 

“这就是我不建议国内创业者用国内大模型的原因”

腾讯新闻《潜望》:中美在这波大模型浪潮中,差异有多大?

朱啸虎:说实话在 AIGC 这波,中美差距还是非常大。美国是在底层大模型,投入越来越大,像 OpenAI 说十万张 GPU 卡连在一起。在中国是不可能的。

美国你看 AI 的应用创新,说实话只有两条路。一条要么非常、非常薄,因为底层大模型太强大了,所以上面叫套壳应用。另一层是看上去很伟大,但肯定走不通的。像 Pika,这种目标很伟大,AIGC 生成视频、电影。但这条路可能在几年之内都看不到走通的可能性。

这个观察非常准确。

OpenAI 工程师的雄心壮志,就是造出极其牛逼的通用大模型,然后外部应用都只是附着其上的薄薄的一层壳。这与 OpenAI 的资源和实力有关,也与美国的应用场景有关。

朱啸虎在这次采访里,明确提到不看好的公司有两家:一是 Pika,原因是目标大到不现实;二是 Midjourney,原因是场景需求太低频。

这两家公司似乎感受到了「死亡笔记」的危险气息,都在 2024 年努力转换发展策略:Pika 通过特效模式等链接了更明确的日常使用场景,Midjourney 发布的 Patchwork 是我见过(目前)最好的无限画布类创作产品。

至于「AIGC 影视生成」这样的宏伟蓝图,显然要交给剪映这样的头部创作平台,或者Disney(迪士尼)这样的影视行业巨头。

 

中国反而相反,中国在“当中”的多一点——底层大模型不够强大,我在上面加的东西可以比较多。我在上面做增值服务,为客户马上能变现。这种在中国有机会。

美国这种几乎没有,因为底层大模型太强大了,上面创业公司能做的很少。中国套壳,现在肯定没人看的。在中国也套不了壳,因为大模型本身功能也就那样,必须在上面有 value add。

(中国)整出 200 多个大模型有啥意义呢?没啥意义。但在应用层有很多创新。中国在数据和应用场景上是远远超过美国的。

补充一个信息维度。

2025 年初发布的 2024 年央企十大国之重器中,有两个与大模型相关:由中国移动研发的「九天」大模型,由南方电网研发的「驭电」大模型。

同榜单的其他国之重器分别是「梦想」号大洋钻探船、新型智能重载电力机车、「天衍」量子计算云平台、全球最大海上风力发电机组、「江海号」超大直径盾构机等等。

感受下「全世界唯一拥有联合国产业分类中所列全部工业门类的国家」的含金量。

 

腾讯新闻《潜望》:现在大模型牌桌上的明牌是什么?

朱啸虎:现在开源比非开源落后一代,但长远来看,开源肯定会赶上来。

腾讯新闻《潜望》:拾象创始人李广密的判断是,开源模型追不上闭源模型,而且差距肯定会越来越大,大模型很像芯片或者 Space X。从人才密度看,LLaMa 也还不够,他认为硅谷大模型的核心 Secret 在 OpenAI、Anthropic 和 Google 这三家公司。

朱啸虎:现在 OpenAI 技术迭代曲线还比较陡峭,开源肯定比非开源落后一年甚至一年半。但等非开源技术迭代曲线缓慢下来,开源会上去的。OpenAI 就一两百个工程师,开源的全世界几百万、几千万工程师在用,怎么可能一直比非开源的落后?就像安卓,今天比 iOS 差吗?肯定不会。

就在于十万张卡到底能不能出来?到底“大力出奇迹”会不会一直下去?如果十万张卡还能“大力出奇迹”,那确实牛逼的;如果十万张卡不能再显著提高性能,就放缓了。技术迭代曲线只要放缓,开源立马就追上去了——谁能永远保证保持秘密,没有秘密可言的。

上述判断在 2024 年得到了部分验证。

首先,GPT-5 和 Clude 3.5 Opus 迟迟没有发布,被视作技术迭代放缓的关键信号。OpenAI 在模型训练上的投入依然巨大,但其成本效益比开始受到质疑,市场份额也从 2023 年的 50% 下降至 34%,市场被开源模型一步步蚕食。

其次,Scaling Law「撞墙」的说法从年中讨论到年末,终于在 2024 年 12 月,被 Ilya Sutskever 明确指出 AI 训练数据正面临增长瓶颈,预测现有数据规模难以满足未来发展需求,即意味着预训练的时代即将结束。

还有,2024 年 12 月 26 日,DeepSeek-V3 正式开源,在多项基准测试中,性能已经与 GPT-4 和 Claude-3.5-Sonnet 等顶级闭源模型表现相当。

就目前的情况来说,朱啸虎的判断是对的:技术迭代曲线总有放缓的一天,开源总能赶上来。

 

腾讯新闻《潜望》:月之暗面创始人杨植麟的观点是,开发方式跟以前不一样,以前所有人都可以贡献到开源,现在开源本身还是中心化的,开源的贡献可能很多没有经过算力验证——你怎么看他这个偏技术推论式的判断?

朱啸虎:应用层会更偏向开源,尤其对中国开发者,用开源至少你不担心被别人抄嘛。

国内大模型,说实话你在它们上面盖房子,还是担心别人抄你。模型和应用的技能完全不一样,模型需要科学家,这些人对技术懂得很深,而且不需要很多人,只需要精干的人。应用,你需要对场景、市场投放、销售非常了解,和科学家是完全不一样的技能。

腾讯新闻《潜望》:大模型公司理想化的想法是,我一手做最牛的模型,一手做最牛的应用。

朱啸虎:这就是我不建议国内创业者用国内大模型的原因。你用国内大模型,你做得好,肯定别人会抄你。他们都是做大模型,确实不懂应用啊,但你如果基于它上面做得好,它抄你是容易的。

美国有清晰分工,国内大模型公司知道自己大模型比美国落后,然后都想做,那创业者肯定更不敢用它。我一直和国内创业者说,千万不要在别人地基上盖房子。

各大模型厂商的 Chatbot 正在集成越来越多的功能,产品形态也更加丰富,Web 端和移动端是每家必备,桌面端、小程序、浏览器插件等也会陆续齐备。

之前很多爆火的 AI 小应用,已经完全没有了生存的空间。

此外,关于「千万不要在别人地基上盖房子」这句话,我还有另一层解读:千万不要寄居在别人的内容生态上做应用,尤其是公众号和小红书。

平台政策收紧,或者与内部产品有冲突的时候,你产品的生存空间将急剧收窄。这是有前车之鉴的。

 

腾讯新闻《潜望》:OpenAI 是不会做应用的?

朱啸虎:它是被逼做一个 GPT 出来。它确实没发现应用者在上面做很多场景,做了 GPT 出来展示一下。美国前端场景都有人做,微软为什么和 OpenAI 合作?微软有一堆场景,OpenAI 自己去做也没优势,必须和别人合作。现在美国很明显,大模型以后就是云服务的组成部分。

 

腾讯新闻《潜望》:杨植麟团队你怎么看?

朱啸虎:我们投了他的上一个公司。他人是很厉害的,大模型确实比较适合他。他做科研是可以的,但我不知道他怎么商业化。妈的,王小川也一样的。

他们(月之暗面)在国内大模型上领先,但长远还是要证明自己价值,至少能追上美国开源。如果能超过开源,他这个团队是真的有价值了。

2024 年 11 月 28 日,在 k0-math 媒体见面会上,杨植麟回应了与商业化相关的几个问题,比如怎么看 Kimi 与豆包的竞争、Kimi 目前的核心任务与投流策略等。

在被问到「Kimi 目前最重要的核心任务是什么」这个问题时,杨植麟的回答是:提升留存,而且永无止境。

杨植麟的几次决策无疑是果断的。只是,这条路走起来过于险峻。让人徒增感慨。

 

腾讯新闻《潜望》:你的观点比很多人都更激烈,在线下被同行或者创业者怼过吗?

朱啸虎:没有啊,我问的问题都回答不了啊。谁能回答出来?我希望被怼,关键是谁能回答出来。你商业化场景在哪?你的数据在哪?都不知道的。你自己去和他聊就知道了。

这个真的比“AI四小龙”还差。“四小龙”进入的时候竞争对手还没那么多,市场就五六家、七八家,竞争没那么激烈。还有两三年的黄金时期,收入做起来了,到后面才是杀价格。

现在 200 多大模型。大模型 2023 年年初,一千万私有化部署一个,到 6 月份五百万部署一个,到年底一百万都不要。给央企部署一个私有化大模型,不要一百万人民币。一年时间就价格杀到地板价去了。怎么搞?创业公司怎么搞?这么早就陷入价格战,大模型公司就会很难单独生存。

今年就可以看出大模型本身是不是好的商业模式。多少 OpenAI 的用户会因为价格差异迁移到 Google 的 Gemini ——OpenAI 20 美金一个月,Gemini 10 美金一个月。我们美国团队已经有一半人切换到 Gemini,一部分是因为价格,另外一部分是因为 Google 的 ecosystem。

最好的模型在哪里,免费的渠道在哪里,用户就涌向哪里。

企业没有护城河。用户没有忠诚度。

补充有两个观察,佐证上方的观点。

Claude 前段时间经常「资源紧张」,然后将用户的默认模型从 Claude 3.5 Sonnet 切换成 Claude 3.5 Haiku。但是,Gemini 2.0 发布之后,资源突然就不紧张了 👀

Poe 在 11 月推出了 10 美元订阅套餐。看起来是有了更便宜的付费选项,但其实性价比更低了。应该是平时的羊毛被薅太狠了,平台不得已而为之 🤣

 

三星的 AI 手机已经绑定 Google Gemini。下面就看苹果的新 iPhone 会绑定哪个大模型,会向大模型公司收多少钱。

苹果在美国选择的合作伙伴是 OpenAI。

2024 年 12 月,ChatGPT 已经正式集成到 iOS 18 的 Apple Intelligence,用户可通过 Siri 使用 ChatGPT 功能。

二者合作方式目前保密,知情人士透漏二者互不支付费用,未来苹果可能从用户的 ChatGPT Plus 订阅中获得分成。

苹果的中国合作伙伴选择,则可谓一波三折。

2024 年 12 月,外媒报道,苹果为使用百度 AI 模型支付费用高达 100 亿美元,并承担了模型重新训练和微调的成本,但合作进展仍不顺利。

随后,传出消息,苹果开始与腾讯和字节商谈,同时也与智谱 AI 接触。

 

“你必须现实”

腾讯新闻《潜望》:你感觉,现在这个时代和上一个时代有哪些共性和不同?

朱啸虎:我觉得 Midjourney 是守不住的。为什么 Midjourney 现在还很火?因为技术迭代周期还陡峭。Midjourney 5、Midjourney 6,版本速度快。但是,一旦技术曲线放缓就守不住了,因为 to C 应用太低频,给里面附加一个东西太容易了。为什么大厂给你机会?美国公司可能还是并购,中国就不一定好做了。

所以,和移动互联网一样,to C 应用必须刚需、高频,长远才有机会守得住。我对 Midjourney 是有很多顾虑的。

ChatGPT 发布已经两年了,世界在经历了颠覆之后逐步形成新的共识,也在逐渐回归常识。

比如上面这条,2C 应用必须高频刚需,就是移动互联网时代的常识之一。

 

腾讯新闻《潜望》:你有喜欢的创业者画像吗?

朱啸虎:思路很清晰的,十几分钟能讲明白一件事情,而且表达比较直接。

(我问题的问题)基本上都一样,你的市场机会在哪里?市场机会多大?为什么是你?就是这几个问题。能讲明白的不多的。

 

腾讯新闻《潜望》:如果你今天讲的关于大模型的判断都是错的,你怎么想?

朱啸虎:那很正常,也是有可能性的。但我个人看来,核心问题还是到底能不能产生 AGI,能不能产生人工智能懂世界模型。目前给我感觉,至少 5 到 10 年之内是看不见的。

从哲学角度看,智力级别的提升首先需要能量级别的提升。可控核聚变实现前,我不太相信地球有足够的算力能够实现真正的 AGI。帮人类降低 90% 的工作可能未来 3 到 5 年可以实现,但最后的 10% 可能需要天量的算力和能耗,这也是为什么 Sam Altman 想融天量的资金!行百里者半九十。

Jürgen Schmidhuber(LSTM 之父)说奇点将在 2040 年左右到来,Ray Kurzweil(发明家&未来学家)给出的时间则是 2045 年。

Elon Musk 说 2026 年 AGI 就会出现,Dario Amodei(Anthropic CEO)表示同意,Demis Hassabis(DeepMind 创始人 / 2024 年诺贝尔化学奖得主)却说还需要至少 10 年,Geoffrey Hinton(深度学习领域先驱 / 2018 年图灵奖得主)给出的最新版本参考是 5 - 20 年。

而 Sam Altman 把他的 AGI 预期从 2030 年调整到了 2025 年。如果我理解得没错的话。

信仰 AGI 的人,看到 Sam 的推文,第一反应是兴高采烈,是狐疑不解,还是信仰坍塌?

 

Sora 证明了一个新路数,美国有钱敢于试错,那挺好,中国就在后面慢慢跟呗。技术迭代曲线肯定会放缓。

PC 刚出来也一样,(电脑的 CPU 型号)286、386、486,大家都觉得美国牛,但 586 以后,联想都收购 IBM 了。技术迭代曲线不可能一直这么陡峭。英伟达昨天又涨 20%,说明它离顶部越来越近。

2024 年 2 月,OpenAI 正式发布文生视频大模型 Sora 的技术报告 & 演示案例,并表示短期内不会向公众开放。

2024 年 4 月,生数科技 Vidu 发布预告。由此拉开了国内文生视频应用的序幕,字节即梦、快手可灵、PixVerse、MiniMax Hailuo、智谱清影、腾讯混元陆续发布产品和 API。

其中,效果最好、最出圈的产品就是可灵 KLing:6 月上线后火爆全球,成为海外(除开源大模型外)讨论度最高的国产 AI 应用 / 模型。

 

腾讯新闻《潜望》:你预计技术曲线什么时候会放缓?

朱啸虎:GPT-5 以后就基本会放缓——GPT-4.5 今年应该很快发布,GPT-5 不一定,可能明年。GPT-5 是把视频生成做到今天图像生成的水平,再往前走不太容易。

现在看,语言模型进步差不多见顶,突破在多模态,Sora 再发布三四个版本也能见顶。后面突破按他们自己说 7 万亿美金,至少几十万张卡拿出来训练,成本太高太贵了。

2023 年 10 月,Bill Gates(比尔·盖茨)在接受德国商业报纸 Handelsblatt 访谈时表示,GPT-4 已经到达了生成式 AI 能力的天花板。

原文:There are "many good people" working at OpenAI who are convinced that GPT-5 will be significantly better than GPT-4, including OpenAI CEO Sam Altman, Gates says. But he believes that current generative AI has reached a ceiling - though he admits he could be wrong.

链接:https://the-decoder.com/bill-gates-does-not-expect-gpt-5-to-be-much-better-than-gpt-4

当时我们不以为意,想象着 OpenAI 口袋里有着无数的奇珍异宝,每件都能名动天下。现在回看 Bill Gates 的公开发言,感慨这盆冷水泼得还是不够多。

 

腾讯新闻《潜望》:回到 AGI 信仰的话题,如果大模型公司注定看不到商业化的可能,退一步讲,你能不能用你手上的钱支持一下人类梦想与科学研究?

朱啸虎:那个是需要大厂和政府去支持。为什么美国人敢投?微软 3 万亿美金市值,苹果 2 万亿美金市值,他们敢砸钱。

中国不需要砸,美国有钱在前面试错,它一旦证明路通了,后面要花的钱少一个数量级。我们跟在后面,花的钱少一个数量级,风险小很多,干嘛不跟在后面?

“此四代机非彼四代机。我们搞的不是美国意义上的第四代战斗机,也不是俄罗斯意义上的第五代战斗机。

我们是在歼-10基础上的改进。……

哪那么容易就搞出来啊。美国 F-22 搞了二十多年,中国四代机这还没打算搞呢。……”

未经允许不得转载:首席AI分享圈 » 朱啸虎:大模型创业“伪需求”,商业化才是真信仰
zh_CN简体中文