AI个人学习
和实操指南
讯飞绘镜

专访萨提亚·纳德拉:经济增长优先于AGI,微软AI蓝图与量子计算的跃迁

近日,微软 CEO 萨提亚·纳德拉 (Satya Nadella) 接受了 Dwarkesh Patel 的播客采访,深入探讨了微软在 人工智能 (AI) 和量子计算领域的最新突破,以及他对行业未来发展趋势的独到见解。在访谈中,纳德拉不仅分享了微软在拓扑量子比特和游戏世界模型方面的重大进展,更强调了推动全球经济增长 10% 的目标远比实现 通用人工智能 (AGI) 更为重要。

专访萨提亚·纳德拉:经济增长优先于AGI,微软AI蓝图与量子计算的跃迁-1

时间戳

  • (0:00:00) - Intro
  • (0:05:04) - AI 不会是赢家通吃
  • (0:15:18) - 世界经济增长 10%
  • (0:21:39) - 智能价格的降低
  • (0:30:19) - 量子计算的突破
  • (0:42:51) - Muse 如何改变游戏行业
  • (0:49:51) - AI 的法律壁垒
  • (0:55:46) - 正确认识 AGI 的安全性
  • (1:04:59) - 在微软的 34 年
  • (1:10:46) - 萨提亚·纳德拉 相信 AGI 吗?

访谈实录

0:00:00 - 开场介绍

Dwarkesh Patel


萨提亚,非常感谢您来到播客节目。稍后我们将会深入探讨微软最近取得的两项重大突破,并表示祝贺,它们在同一天登上《自然》杂志:Majorana Zero 芯片,我们现在就摆在眼前,还有 世界人类行为模型。不过,我们是否可以先继续刚才的对话?您提到在 80 年代和 90 年代看到的一些现象,如今又重现了。

萨提亚·纳德拉

对我而言,最令人兴奋的是…… Dwarkesh,首先,非常荣幸能参加你的播客节目。我是你的忠实听众,非常喜欢你的访谈风格和你探索的广泛话题。

让我感到兴奋的是,眼前的景象让我想起了我在科技行业的最初几年,大概是 90 年代,当时业界对于 RISC (精简指令集计算机) 还是 CISC (复杂指令集计算机) 孰优孰劣,以及“我们真的能用 x86 架构构建服务器吗?”等问题争论不休。

我加入微软时,正值 Windows NT 的初期。从核心 硅 平台到操作系统,再到应用层,整个技术栈的方方面面都充满了变数。

可以说,云计算在一定程度上重塑了这一切,分布式计算和云计算无疑改变了 客户端-服务器 模式,Web 也带来了巨大的变革。但这一次的浪潮感觉比我过去经历的任何一次都更具有 全栈 式的颠覆性。

Dwarkesh Patel

当您回顾 80 年代和 90 年代,哪些决策最终成为了长期赢家,哪些又被时代淘汰?特别是考虑到您曾在 Sun Microsystems 工作过,他们经历了 90 年代的 互联网泡沫 。人们常说当时的数据中心建设是一场泡沫,但与此同时,今天的互联网也正是建立在那时的基础设施之上。

关于哪些事物能够经受时间考验,哪些是内在的长期趋势,哪些又只是昙花一现?我们能从中吸取哪些教训?

萨提亚·纳德拉

如果回顾我经历过的四大转型,首先是 客户端 和 客户端-服务器 模式的兴起。那是 图形用户界面 和 x86 架构诞生的时代,基本上使我们能够构建服务器。

当时对我来说,趋势已经非常清晰。我记得参加了 1991 年的 PDC (专业开发者大会),事实上,那时我还在 Sun 工作。在 1991 年的 Moscone 中心,微软首次公开了 Win32 接口,我当时就清楚地意识到即将发生什么,服务器也将走向 x86 架构。当规模优势开始累积时,你就必须押注这种长期趋势。客户端 发生的变革也将在服务器端重演,然后你就能真正构建 客户端-服务器 应用了。因此,应用模型也变得清晰起来。

接着,Web 成为了我们面临的重大挑战,我们必须应对它。事实上,我刚加入微软不久,Netscape 浏览器 或 Mosaic 浏览器 就问世了,大概是 93 年的 11 月或 12 月,Andreessen 和他的团队推出了它们。

这真是一个巨大的变革。有趣的是,就在我们刚刚开始 Client-Server 浪潮时,Web 浪潮就来了。但很明显,我们也将赢得 Client-Server 的胜利。对于 Web 浪潮,我们必须做出调整,而我们也做得相当不错,因为浏览器是一种全新的应用模型。

我们全盘接受了它,无论是在 Word 中支持 HTML,还是亲自构建新的浏览器并参与竞争,以及在我们的服务器堆栈上构建 Web 服务器并积极拓展市场。当然,我们错过了 Web 上最大的商业模式,因为我们都认为 Web 的核心是分布式,谁会想到 搜索 会成为组织 Web 内容的最大赢家呢?显然,我们没有预见到这一点,而 Google 看到了并出色地执行了。

这对我来说是一个教训:你不仅要把握正确的技术趋势,还要弄清楚价值将会在哪里产生。商业模式的转变可能比技术趋势的改变更具挑战性。

0:05:04 - AI 不会是赢家通吃

Dwarkesh Patel

那么,AI 领域的价值将会在哪里产生呢?

萨提亚·纳德拉

这个问题提得非常好。我认为有两个领域我可以比较有信心地预测。首先是那些表现出色的 超大规模云服务商 (hyperscalers),因为最根本的是,即使回顾 Sam (可能是指 Sam Altman, OpenAI CEO) 和其他人对 AI 的描述,如果说 智能 是计算能力的对数函数,那么谁能进行大规模计算,谁就是大赢家。

另一个有趣的现象是,即使你观察任何 AI 工作负载的底层,例如 ChatGPT,大家兴奋的不仅仅是 GPU 方面的进展,尽管这确实很棒。事实上,我甚至将我的计算集群视为 AI 加速器、存储和计算三者之间的比例。而且从规模上看,你必须不断扩展它。

Dwarkesh Patel

是的。

萨提亚·纳德拉

因此,AI 工作负载的出现简直是天赐之福,因为你知道吗?它们对计算能力的需求更加旺盛,不仅在训练阶段,在 推理时间 (inference time) 也同样如此。当你想到 AI 代理 (AI agent) 时,你会发现 AI 代理 将会呈指数级增长计算使用量,因为它的调用不再受限于人类用户,而是由人类用户调用的程序再去调用更多的程序。这将为计算基础设施创造巨大的需求和规模。因此,我们的 超大规模业务,Azure 业务,以及其他超大规模云服务商,我认为都将迎来巨大的发展机遇。

在超大规模业务之后,情况就变得有些模糊了。你可能会说,存在 赢家通吃 的模式,但我个人并不这么认为。顺便说一句,这是我学到的另一个重要教训:非常清楚地理解哪些市场是 赢家通吃 的市场,哪些不是,在某种程度上决定了一切。我记得早期刚接触 Azure 时,亚马逊已经取得了显著的领先优势,人们,包括投资者,都对我说:“游戏结束了,你永远无法成功,亚马逊会 赢家通吃 的。”

但凭借与 Oracle 和 IBM 在 客户端-服务器 领域的竞争经验,我深知买家绝不会容忍 赢家通吃 的局面。从结构上看,超大规模云服务永远不会是 赢家通吃 的市场,因为买家都很精明。

消费市场有时可能会出现 赢家通吃 的情况,但在企业级市场,任何买家,无论是公司、企业还是 IT 部门,都希望有多个供应商。因此,你必须成为众多供应商之一。

我认为模型领域也会发生类似的情况。模型会存在 开源 和 私有 两种模式。就像 Windows 一样,我从中学到的一个重要教训是,如果你有一个 闭源 操作系统,那么必然会出现一个与之互补的 开源 替代品。

因此,在某种程度上,这会对市场格局形成一种制衡。我认为模型领域,或许会存在一些 闭源 模型,但肯定也会有 开源 替代方案,而 开源 替代方案实际上会确保 闭源 赢家通吃 的局面不会发生。

这是我对模型领域的看法。另外,如果 AI 真的像人们所说的那么强大,那么国家也不会袖手旁观,任由私营公司在全球范围内…… 肆意发展。因此,我不认为 AI 会是 赢家通吃 的市场。

再往上一层,我认为情况还是和过去一样,在消费领域,某些类别可能会出现一些 赢家通吃 的 网络效应 。毕竟,ChatGPT 就是一个很好的例子。

它是一个大规模的消费者级应用,已经获得了真正的 逃逸速度 (escape velocity)。我在 App Store 上看到它始终位居前五,这真是令人难以置信。

他们能够利用早期的优势,并将其转化为应用优势。在消费领域,这种情况可能会发生。但在企业级市场,我认为在不同类别中,会出现不同的赢家。至少我是这样分析的。

Dwarkesh Patel

我有很多后续问题想问。我们稍后必须讨论量子计算,但关于模型可能被 商品化 的观点:或许有人在几十年前也对 云计算 提出过类似的论点——从根本上说,云计算不就是 芯片 和 机箱 吗?

但最终,你和其他许多人还是找到了在 云计算 中获得惊人利润率的方法。你们找到了实现 规模经济 并增加其他价值的方法。从根本上说,即使抛开术语不谈,如果你拥有 AGI,并且它能帮助你创造更好的 AI——目前,我们看到的是 合成数据 和 强化学习 (RL);也许未来会出现 自动化 AI 研究员 ——这似乎是巩固你的优势的好方法。我很好奇您对此有何看法,特别是关于在 AI 领域保持领先地位的重要性。

萨提亚·纳德拉

规模化 之后,任何事物都不会是 商品 。就像你刚才提到的 云计算,每个人都说:“哦,云计算是一种 商品 。”但当你规模化之后…… 这就是运营 超大规模 云服务商 的诀窍所在…… 你可能会说:“这有什么难的?我不就是把服务器堆叠起来吗?”

Dwarkesh Patel

没错。

萨提亚·纳德拉

事实上,在 超大规模 云计算的早期,大多数人都认为“已经有很多 托管服务商 了,但那些都不是什么好生意。超大规模 云计算会有前景吗?甚至有商业价值吗?”但事实证明,超大规模 云计算确实是一门真正的生意,这完全是因为它蕴含着运营诀窍,例如 Azure,它运营着遍布 60 多个区域的世界级计算基础设施。这很难被复制。

所以我更想强调的是,市场格局是 “一个赢家” 还是 “赢家通吃”?因为你必须弄清楚这一点。我喜欢进入那些 市场容量巨大 (TAM) 的领域,在这些领域,你不必承担 赢家通吃 的风险。最好的情况是,你身处一个能够容纳多个赢家的大市场,而你就是其中之一。

这就是我所说的 超大规模 层。在 模型 层,模型最终需要在某种 超大规模 计算基础设施上运行。因此,我感觉这种联系将永远存在。不仅仅是模型本身;模型需要状态,这意味着它需要存储;它还需要常规计算来运行这些 代理 及其 代理环境 。

这就是我思考为什么 “一个人凭借一个模型就能包揽一切” 的局面可能不会发生的原因。

Dwarkesh Patel

在 超大规模 云服务商 方面,顺便说一句,有趣的是,作为 超大规模 云服务商,你们拥有的优势在于,尤其是在 推理时间扩展 (inference time scaling) 的背景下,如果这涉及到未来模型的训练,你们可以将数据中心和 GPU 的成本摊销,不仅用于训练,还可以再次用于推理。

我很好奇您认为微软和 Azure 属于哪种类型的 超大规模 云服务商?是 预训练 方面?是提供类似 O3 (OpenAI o3) 类型的推理服务?还是说,你们只是打算托管和部署市场上现有的任何模型,对此持 中立 态度?

萨提亚·纳德拉

这是一个很好的问题。我们构建计算集群的方式,在某种程度上是为了顺应 摩尔定律 (Moore's law) 的发展趋势。我认为这会像我们过去所做的一切一样:每年都更新计算集群,按照这些设备的生命周期价值进行折旧,然后非常擅长集群的部署,以便能够以高利用率运行不同的作业。有时,大型训练作业需要高度集中的峰值 浮点运算能力 (flops),并且需要协同工作。这很好。我们应该拥有足够的数据中心足迹来满足这些需求。

但归根结底,这些规模都变得如此庞大,即使是 预训练 规模,如果它需要持续发展,那么 预训练 规模在某个时候也必须跨越数据中心边界。所有这些或多或少都已成为现实。

因此,一旦你开始跨越 预训练 数据中心边界,它与其他任何事物还有什么区别呢?我的想法是,分布式计算 仍将是分布式的,所以要构建你的计算集群,使其能够胜任大型训练作业、推理时间计算,以及 RL (强化学习) 可能带来的需求。在我看来,这更像是更多的训练 浮点运算,因为你想为不同的任务创建这些高度专业化、精简的模型。

所以你需要这样的计算集群,以及 服务需求 。归根结底,“光速就是光速”,你不能指望在德克萨斯州建一个数据中心,然后说:“我要从那里为全世界提供服务。”

你必须在全球各地部署推理计算集群,才能为全世界提供服务。这就是我对构建真正的 超大规模 计算集群的理解。

哦,顺便说一句,我还希望我的存储和计算能力也靠近所有这些设施,因为不仅仅是 AI 加速器 是无状态的。我的训练数据本身也需要存储,而且我希望能够 多路复用 多个训练作业,我希望拥有内存,我希望拥有这些 代理 可以执行程序的环境。这就是我对 超大规模 计算集群的理解。

0:15:18 - 世界经济增长 10%

Dwarkesh Patel

微软最近报告称,来自 AI 的年收入为 130 亿美元。但如果按照目前的 年增长率 计算,大约四年后,这个数字将增长 10 倍。如果趋势持续下去,AI 收入将达到 1300 亿美元。如果真的如此,您预计如何利用如此大规模的智能,这种工业级的应用?

是通过 Office 实现?还是通过部署给其他人托管?要实现 1300 亿美元的 AI 收入,你们需要拥有 AGI 吗?那会是什么样的情景?

萨提亚·纳德拉

Dwarkesh,你提出的问题非常好,因为在某种程度上,如果你要拥有这种智能的爆发式增长、充裕供应,甚至 商品化 ,我们首先要观察的是 GDP 增长。

在我谈论微软的收入前景之前,我们需要明确一个制约因素。这就是为什么我们常常在 AGI 炒作中跑得太快。请记住,发达国家的经济增长率是多少?2%?如果扣除通货膨胀,几乎为零。

展望 2025 年,虽然我不是经济学家,但我看到的是,我们面临着真正的增长挑战。因此,我们首先要做的,当我们说这堪比 工业革命 时,就要实现 工业革命 式的增长。

对我而言,这意味着 10% 的增长率,发达国家 7% 的增长率,扣除通货膨胀后仍能达到 5% 的增长。这才是真正的衡量标准。不能仅仅停留在 供给侧 。

事实上,很多人都在撰写相关文章,我对此感到欣慰。文章指出,最大的赢家不会是科技公司,而是更广泛的行业,他们将利用这种 充裕供应 的 商品 。突然之间,生产力提高了,经济增长速度加快了。当这种情况发生时,我们科技行业也会受益。

但这才是关键时刻。我们自诩实现了 AGI 的里程碑,对我来说,这只是毫无意义的 基准测试 。真正的基准是:世界经济增长 10%。

Dwarkesh Patel

好的,如果世界经济增长 10%,那么世界经济规模约为 100 万亿美元 左右。如果世界经济增长 10%,那就意味着每年额外创造 10 万亿美元的价值。如果真是这样,作为 超大规模 云服务商,你们的 800 亿美元收入似乎还是太少了。难道不应该做到 8000 亿美元吗?

如果你们真的认为在未来几年内,我们可以真正以这种速度推动世界经济增长,那么关键的瓶颈是否会变成:你们是否拥有部署这些 AI 来完成所有工作的必要计算能力?

萨提亚·纳德拉

你说得没错。但顺便说一句,经典的 供给侧 思维是:“嘿,让我先建好,他们自然会来。”这是一种论点,而且我们已经这样做了,我们承担了足够的风险去实践它。

但最终,供给和需求必须匹配。这就是为什么我同时关注 供给侧 和 需求侧 。如果你只关注 供给侧 ,而没有真正理解如何将 供给 转化为客户的实际价值,那么你可能会完全脱离现实。

这就是我关注 推理收入 的原因之一。这也是我公开 推理收入 的原因之一…… 有趣的是,似乎没有多少人在谈论他们的实际收入,但对我来说,这很重要,它可以作为你思考问题的 制衡因素 。

你不能指望供需在任何时间点都完全对称,但你需要有 存在证明 ,证明你能够将昨天的投入 (资本) 转化为今天的需求,这样你才能再次投资,甚至可能是指数级的投资,并且确信你不会完全失衡。

Dwarkesh Patel

我不知道这两种观点之间是否存在矛盾,因为您做得非常出色的一件事就是敢于早期下注。你们 在 2019 年投资了 OpenAI,甚至在 Copilot 和任何应用出现之前。

回顾 工业革命 时期,铁路和其他基础设施的建设带来了 6% 到 10% 的经济增长,但其中许多项目在早期并没有立竿见影的收入,例如 “我们已经从车票销售中获得了收入,现在我们要……”

萨提亚·纳德拉

当时亏损了很多钱。

Dwarkesh Patel

没错。所以,如果你真的认为这里蕴藏着将世界经济增长率提升 10 倍甚至 5 倍的潜力,但又过于关注 “GPT-4 的收入是多少?”,这似乎有些矛盾。

如果你真的相信下一阶段有可能实现如此巨大的增长,难道不应该采取更激进的策略,例如 “让我们疯狂投入,建设价值数千亿美元的计算基础设施?” 毕竟,这里蕴藏着巨大的机遇,不是吗?

萨提亚·纳德拉

这里有一个有趣的点,对吧?这就是为什么即使是对计算集群采取 平衡 的策略,至少对我来说也至关重要。关键不在于仅仅构建计算能力,而在于构建能够真正帮助我训练下一个大型模型,并为下一个大型模型提供服务的计算能力。在你做到这两点之前,你无法真正利用你的投资。

因此,关键不在于 竞相构建模型 ,而在于 竞相创造一种 商品 ,这种 商品 能够被世界所用,以推动经济增长…… 你必须有一个完整的思考框架,而不是只关注一个方面。

顺便说一句,其中一个现象是,将会出现 过度建设 。就像你提到的 互联网泡沫 时代一样,现在已经发出了信号:嘿,你需要更多的能源,你需要更多的计算能力。感谢上帝,每个人都会蜂拥而至。

事实上,不仅仅是公司在部署,各国政府也在投入资本,而且肯定会出现…… 我很高兴成为 租赁方 ,因为,顺便说一句,我自建了很多,也租赁了很多。我很高兴在 2027 年、2028 年能够租赁大量的计算能力,因为我看到了这些建设规模,我说:“这太棒了。” 所有计算能力建设的唯一结果就是价格下降。

0:21:39 - 智能价格的降低

Dwarkesh Patel

说到价格下降,您最近在 DeepSeek 模型发布后 发推文 谈到了 杰文斯悖论 (Jevons’ Paradox)。我很好奇您能否详细阐述一下。杰文斯悖论 指的是,当某项事物的需求弹性非常高时,即使效率提升导致价格下降,总消费量反而会增加。 智能 的需求是否也对价格下降如此敏感?

因为当我思考,至少从我作为消费者的角度来看,智能已经非常便宜了。每百万 token 才 2 美分。我真的需要它降到 0.02 美分吗?我现在的瓶颈在于它变得更智能。如果你们需要向我收取 100 倍的价格,进行 100 倍规模的训练,我也乐于接受。

但或许您在企业级市场或其他方面看到了不同的情况。 智能 的关键用例是什么?它真的需要降到每百万 token 0.002 美分吗?

萨提亚·纳德拉

我认为真正重要的是 token 的 效用 。两者都需要兼顾:一是 智能 需要变得更好、更便宜。任何时候出现突破,例如 DeepSeek 所做的,当 token 性能的 有效前沿 (efficient frontier) 发生变化,曲线被弯曲,前沿移动时,都会带来更多的需求。云计算 就是如此。

这里有一个有趣的现象:我们曾经认为 “天哪,我们在 客户端-服务器 时代已经卖光了所有的服务器。” 但一旦我们开始将服务器放入 云端 ,突然人们开始消费更多,因为他们可以更便宜地购买,而且它是弹性的,他们可以按需付费,而不是购买许可证,这彻底扩展了市场。

我记得去印度这样的国家推销 SQL Server,我们卖出了一些,但你知道吗?云计算 在印度的规模远超我们在 服务器 时代所能做到的任何事情。我认为这在 AI 领域也会发生。

试想一下,如果你真的想在 南方国家 、发展中国家,以极低的价格提供真正廉价的 医疗保健 token,这将是前所未有的变革。

Dwarkesh Patel

我认为,对于像我这样身处 旧金山 的人来说,听到人们说 “他们有点傻,他们不知道在现实世界中部署东西是什么样子” 是很合理的。

作为与 财富 500 强企业合作,并帮助他们为数亿甚至数十亿人部署技术的人,您认为这些能力部署的速度会有多快?

即使你们拥有可用的 代理 ,即使你们拥有可以为你们进行远程工作的东西,考虑到所有的合规性要求和固有的瓶颈,这会成为一个巨大的瓶颈吗?还是会很快克服?

萨提亚·纳德拉

这将是一个真正的挑战,因为真正的问题是 变革管理 或 流程变革 。这里有一个有趣的类比:想象一下,像我们这样的跨国公司在没有 PC、电子邮件和电子表格的情况下是如何进行预测的。传真满天飞,有人收到传真后,再写一份内部备忘录四处传阅,人们在备忘录上填写数字,最终形成一份预测报告,可能刚好赶上下个季度。

后来有人说:“嘿,我可以直接用 Excel 表格,通过电子邮件发送出去,大家可以在上面编辑,然后我就能得到一份预测报告了。” 整个预测业务流程都改变了,因为 工作制品 和 工作流程 都发生了变化。

这就是将 AI 引入 知识工作 后需要发生的事情。事实上,当我们思考所有这些 代理 时,最根本的是,将会出现一种新的 工作 和 工作流程 。

例如,即使是为我们的播客做准备,我也会使用我的 Copilot,对它说:“嘿,我要和 Dwarkesh 讨论我们的量子计算公告,以及我们为游戏生成构建的新模型。给我一个摘要,告诉我我在去之前应该阅读哪些材料。” 它知道两篇《自然》杂志的论文,并提取了相关信息。我甚至说:“嘿,用播客的形式呈现给我。” 它甚至很好地模拟了我们两人对话的形式。

这成为了我的新工作流程——事实上,之后我把它分享给了我的团队。我把它复制到 Pages (微软的文档编辑软件) 中,作为我的工作制品,然后分享出去。因此,我的新工作流程是,借助 AI 进行思考,并与我的同事协同工作。

这对于所有从事 知识工作 的人来说,都是一个根本性的 变革管理 问题,他们需要弄清楚 “如何以新的方式完成我的 知识工作 ?” 这需要时间。它将渗透到销售、金融和供应链等各个领域。

对于 传统企业 来说,我认为这将是类似于制造商采用 精益生产 (Lean manufacturing) 的变革。我喜欢 精益生产 的类比,因为在某种程度上,如果你仔细观察,你会发现 精益生产 成为了一种方法论,企业可以借助它来优化端到端制造流程,提高效率。它强调 持续改进 ,即 减少浪费,增加价值 。

这就是即将在 知识工作 领域发生的事情。这就像 知识工作 领域的 精益生产 ,特别是 知识工作 。而管理团队和从事 知识工作 的个人需要努力实现这种转变,这需要时间。

Dwarkesh Patel

我可以简要问一下关于 精益生产 类比的问题吗?精益生产 所做的一件事是,它从物理层面改变了工厂车间的面貌。它揭示了人们在真正关注流程和工作流程之前没有意识到的瓶颈。

您刚才简要提到了您自己的工作流程——您的工作流程如何因 AI 而改变。我很好奇,当你们拥有这些随着时间推移变得越来越智能的 AI 代理 时,运营一家大型公司会是什么样子?

萨提亚·纳德拉

你问得很有意思。例如,我今天就在思考,如果我们看看现在的工作方式,我们非常依赖电子邮件。我早上上班,发现我的收件箱塞满了邮件,我需要回复它们。我迫不及待地想用上 Copilot 代理,让它们自动填充我的邮件草稿,这样我就可以直接审阅和发送了。

但我已经在 Copilot 中使用了至少十个 代理 ,针对不同的任务向它们提出不同的查询。我感觉将会出现一个新的 收件箱 ,那就是我正在合作的数百万个 代理 的 收件箱 ,它们会向我发送异常情况、通知,并请求指示。

所以至少在我看来,需要构建一个新的 脚手架 ,即 代理管理器 。它不仅仅是一个聊天界面。我需要一个比聊天界面更智能的东西来管理所有 代理 及其对话。

这就是为什么我认为 Copilot,作为 AI 的 UI (用户界面),意义重大。我们每个人都将拥有它。基本上,你可以这样理解:存在 知识工作 ,也存在 知识工作者 。知识工作 可能由许多 代理 完成,但仍然需要一个 知识工作者 来处理所有这些 知识工作者 。而这,就是我们需要构建的界面。

0:30:19 - 量子计算的突破

Dwarkesh Patel

您是世界上为数不多可以说 “我拥有 20 万…… 我身边围绕着由微软公司及其所有员工组成的智能集群” 的人之一。您必须管理它,并与之交互,以最大限度地利用它。希望未来世界上更多的人能够拥有这种体验。

我很好奇,如果您的收件箱变成了那样,是否意味着每个人的收件箱在早上都会像您的一样?

好的,在我们深入探讨这个问题之前,我想继续问您更多关于 AI 的问题,但我真的很想问问您关于微软研究院在 量子计算 领域取得的重大突破。您能解释一下目前的情况吗?

萨提亚·纳德拉

这又是我们 30 年的漫长征程。真是令人难以置信。我是第三位对 量子计算 感到兴奋的微软 CEO。

我们一直以来的愿景是,你需要物理学上的突破,才能构建出可用于 实用规模 的 量子计算机 。我们选择了一条道路,即认为获得更低噪声或更可靠的 量子比特 (qubit) 的一种方法是押注于一种本质上更可靠的物理特性,这就是我们选择 马约拉纳零模式 (Majorana zero modes) 的原因,它在 1930 年代被提出。问题是,我们真的能在物理上制造出这些东西吗?我们真的能构建它们吗?

因此,真正的突破在于,我们现在终于有了 马约拉纳零模式 的 存在证明 和物理学突破,它存在于一种新的物质形态中。这就是为什么我们喜欢将此比作 量子计算 的 晶体管 时刻,我们实际上拥有了一种新的形态,即 拓扑相 ,这意味着我们现在甚至可以可靠地隐藏 量子信息 ,测量它,并且可以制造它。既然我们拥有了它,我们就觉得,随着核心的 基础制造技术 的突破,我们可以开始构建 马约拉纳芯片 了。

我们称之为 Majorana One 的芯片,我认为它将成为首款能够容纳百万 量子比特 (物理 量子比特) 的芯片。然后在此基础上,构建数千个 逻辑 量子比特,实现 纠错 。然后,游戏就开始了。你突然拥有了构建真正 实用规模 量子计算机 的能力,而我感觉现在这变得更加可行了。如果没有类似这样的突破,你仍然可以取得一些里程碑式的进展,但你永远无法构建 实用规模 的计算机。这就是我们感到兴奋的原因。

Dwarkesh Patel

太棒了。顺便说一句,我相信这就是它,对吧?

萨提亚·纳德拉

没错,就是它。

Dwarkesh Patel

是的。

萨提亚·纳德拉

我现在记不清了,我们把它叫做 Majorana 吗?是的,没错,Majorana One。我很高兴我们 以他的名字 命名。

想到我们能够在一个如此小的芯片上构建一台百万 量子比特 的 量子计算机 ,真是令人难以置信。关键就在于此:除非我们能够做到这一点,否则你无法梦想构建 实用规模 的 量子计算机 。

Dwarkesh Patel

您是说最终的百万 量子比特 将集成到这个尺寸的芯片上?太神奇了。

其他公司已经宣布了 100 物理 量子比特 的 量子计算机,例如 Google、IBM 等。当您说你们宣布了一项突破,但您也表示你们的技术在 规模化 方面更具优势。

萨提亚·纳德拉

是的。我们所做的另一件事是,我们采取了一种 软硬件分离 的方法。我们正在构建我们的 软件堆栈 ,并且我们现在与 中性原子 量子计算机 (neutral atom) 领域的专家、 离子阱 量子计算机 (ion trap) 领域的专家合作,我们还在与其他在 光子学 (photonics) 等领域拥有出色方法的人合作,这意味着将会有不同类型的 量子计算机 。事实上,我们最近宣布的成果是 24 个 逻辑 量子比特 。因此,我们在 纠错 方面也取得了一些了不起的突破,这使得我们即使在中性原子 和 离子阱 量子计算机 上,也能构建出 20 多个 逻辑 量子比特 的系统,而且我认为今年还会继续取得进展;你们会看到我们在这方面不断提升。

但我们也表示:“让我们回到第一性原理,构建我们自己的 量子计算机 ,押注于 拓扑 量子比特 (topological qubit)。” 这就是这项突破的意义所在。

Dwarkesh Patel

太棒了。百万 拓扑 量子比特,数千 逻辑 量子比特,扩展到这个规模的预计时间表是什么?如果说你们已经拥有了第一个 晶体管 ,那么这里的 摩尔定律 又是什么样的呢?

萨提亚·纳德拉

我们显然已经在这个领域耕耘了 30 年。我很高兴我们现在取得了物理学和制造技术上的突破。

我希望我们已经拥有了 量子计算机 ,因为顺便说一句,量子计算机 首先能让我们做的事情就是构建 量子计算机 ,因为模拟 原子级 的新 量子门 的构建过程将会容易得多。

但无论如何,接下来真正要做的事情是,既然我们掌握了制造技术,那就让我们去构建第一台 容错量子计算机 (fault-tolerant quantum computer) 。这将是符合逻辑的下一步。

所以,我想我现在可以说,“也许在 2027 年、2028 年、2029 年,我们将能够真正构建出它。” 既然我们有了这个 量子门 ,我能否将它放入 集成电路 中,然后将这些 集成电路 放入真正的计算机中?这就是下一个合乎逻辑的步骤。

Dwarkesh Patel

您认为在 2027 年、2028 年,当你们成功构建出 量子计算机 后,它会是什么样的?是通过 API 访问的东西吗?还是你们内部用于材料和化学研究的东西?

萨提亚·纳德拉

这是一个很好的问题。我一直感到兴奋的一件事是,即使在今天这个世界…… 我们已经有了 量子计算 程序,并且我们为其添加了一些 API。我们大约在两年前取得的突破是,将 高性能计算 (HPC) 堆栈 、 AI 堆栈 和 量子计算 结合起来考虑。

事实上,如果你仔细想想,你会发现 AI 就像 模拟器 的 模拟器 。量子计算 则像是 自然界 的 模拟器 。量子计算 将会做什么?顺便说一句,量子计算 不会取代 经典计算 。量子计算 在它擅长的领域会非常出色,而 经典计算 也将继续发挥作用……

量子计算 将非常适合那些 非数据密集型 ,但在 状态空间 探索方面要求很高的任务。它应该是 数据轻量级 的,但你需要探索 指数级 的状态。模拟 就是一个很好的例子:化学物理、生物学等等。

我们已经开始做的一件事是,真正将 AI 用作 仿真引擎 。但你可以训练它。所以我理解的方式是,如果你将 AI 与 量子计算 相结合,你或许可以使用 量子计算 生成 合成数据 ,然后 AI 可以利用这些数据来训练更好的模型,从而了解如何模拟化学、物理或其他学科。这两者将会协同使用。

即使在今天,我们实际上也在将 高性能计算 和 AI 结合使用。我希望用 量子计算机 取代部分 高性能计算 组件。

Dwarkesh Patel

您能否告诉我,你们是如何做出这些研究决策的?这些决策在 20 年、30 年后才能真正产生回报,尤其是在像微软这样规模的公司里?显然,您对这个项目的技术细节非常了解。您是否有可能对微软研究院所做的所有事情都做到这一点?

您如何知道当前所做的押注会在 20 年后获得回报?这仅仅是需要在组织内部 有机地发展 起来,还是您如何跟踪这一切?

萨提亚·纳德拉

我觉得很棒的一件事是,比尔·盖茨 在 1995 年创立了 微软研究院 (MSR)。我认为在所有以 好奇心驱动 的研究机构的漫长历史中,仅仅为了进行 基础研究 而设立一个研究机构,微软研究院 多年来已经积累了这种 制度优势 。因此,当我在考虑 资本配置 或 预算 时,我们首先会投入资金,说:“这是微软研究院的预算。” 我们每年都这样做,并且清楚地知道,这些 赌注 大部分不会在有限的时间框架内获得回报。也许微软的第六任 CEO 才能从中受益。而在科技行业,我认为这是理所当然的。

我认为真正重要的是,当 量子计算 或 新模型 等技术成熟时,你是否能够抓住机会?因此,作为一家 传统企业 ,回顾科技行业的历史,你会发现,问题不在于人们没有投资,而在于你需要拥有一种 文化 ,知道如何将 创新 规模化 。

这才是 CEO 和 管理团队 面临的真正难题,非常具有挑战性。它既需要良好的 判断力 ,也需要优秀的 文化 。有时我们做得很好,有时我们也会犯错。我可以告诉你,微软研究院 有成千上万个项目,我们本应该主导它们,但我们没有。我总是问自己为什么。那是因为我们没有足够的 信心 ,也没有形成完整的思考框架,不知道如何不仅将 创新 转化为有用的产品,还要找到可行的 商业模式 ,并将其推向市场。

这就是 CEO 和 管理团队 的工作:不仅仅对某件事感到兴奋,还要能够真正执行一个完整的计划。说起来容易做起来难。

Dwarkesh Patel

当您提到微软的后三任 CEO 时,如果他们每人都将市值提升一个数量级,那么当你们的下一个突破到来时,微软的市值可能就相当于世界经济的总量了。

萨提亚·纳德拉

或者记住,世界经济将以 10% 的速度增长,所以我们也会没事的。

0:42:51 - Muse 如何改变游戏行业

Dwarkesh Patel

让我们深入探讨一下你们刚刚取得的另一项重大突破。令人惊叹的是,你们在同一天发布了两项重大成果,那就是你们的 游戏世界模型 。我很想听您介绍一下这方面的情况。

萨提亚·纳德拉

我们将其命名为 Muse 。它将成为 世界行为模型 或 人类行为模型 。

这非常酷。我们都知道,Dall-E 和 Sora 在 生成模型 方面所取得的成就令人难以置信。我们想要探索的一个方向是,利用 游戏数据 。你们能否生成既 连贯 又能展现游戏多样性的游戏?并且能够 持久支持 用户修改?

这就是 Muse 的目标。微软研究院 的研究人员与我们的一个游戏工作室合作,取得了这项成果,这也是发表在《自然》杂志上的另一篇论文。

我感到兴奋的是,我们将很快推出一系列游戏,并开始使用这些模型,或者我们将训练这些模型来生成游戏,然后开始玩这些游戏。

事实上,当 Phil Spencer (微软游戏 CEO) 第一次向我展示 Muse 时,他拿着一个 Xbox 手柄,这个模型基本上接收手柄的输入,并根据输入生成输出。而且输出与游戏内容保持一致。对我来说,这是一个 “哇” 的时刻。这有点像我们第一次看到 ChatGPT 完成句子、Dall-E 绘画或 Sora 生成视频。这是一个具有里程碑意义的时刻。

Dwarkesh Patel

今天早上,我有机会与你们的首席研究员 Katja 一起观看了实时演示视频。只有在与她交谈后,我才真正意识到这有多么不可思议。我们过去使用 AI 来建模 代理 ,而现在,仅仅使用相同的技术来建模 代理 周围的世界,就能实时生成 连贯 的游戏世界——我们会将演示视频叠加到播客上,以便大家有机会亲眼目睹。我想届时视频应该已经发布了,大家也可以在那里观看。

这本身就令人难以置信。在您担任 CEO 期间,您投入了数百亿美元来构建 微软游戏业务 并收购 IP (知识产权)。

现在回想起来,如果你们可以将所有这些数据整合到一个大型模型中,该模型可以为你们提供同时访问和体验多个世界的体验,并且如果这就是游戏行业的发展方向,那么这似乎是一项非常明智的投资。您对此有任何预感吗?

萨提亚·纳德拉

我不会说我们投资游戏是为了构建模型。我们投资游戏,坦率地说,是因为——关于我们的历史,这里有一个有趣的点:我们在构建 Windows 之前就开发了我们的第一款游戏。《微软模拟飞行》在 Windows 诞生之前很久就是微软的产品了。

因此,游戏在微软有着悠久的历史,我们希望为了游戏本身而涉足游戏领域。我总是说,我讨厌进入那些 “为了实现其他目的的手段” 的业务。它们必须本身就是 目的 。

然后,是的,我们不是一家 集团企业 。我们是一家公司,我们必须将所有这些资产整合在一起,并通过增加价值来成为更好的所有者。例如, 云游戏 对我们来说是一项自然的投资,因为它将扩大 市场容量 (TAM),并扩大人们随时随地玩游戏的能力。

AI 与 游戏 也是如此:我们坚信它可能有助于改变游戏行业——这有点像游戏行业的 CGI (计算机生成图像) 时刻。这很棒。作为全球最大的游戏发行商,这将对我们有所帮助。但与此同时,我们必须制作出高质量的游戏。我的意思是,如果你不首先专注于此,你就无法成为一家游戏发行商。

但事实上,这些数据资产将会非常有趣,不仅在游戏领域,而且它还将成为通用的 行为模型 和 世界模型 ,这真是太棒了。我的意思是,我认为 游戏数据 可能就像 YouTube 之于 Google 一样,游戏数据 之于 微软 。因此,我对此感到非常兴奋。

Dwarkesh Patel

是的,这就是我的意思,从某种意义上说,你们可以在许多不同类型的游戏中拥有统一的体验。这与微软过去在 AI 之外所做的其他工作 (例如 混合现实) 有何关联?或许可以为小型游戏工作室提供构建 AAA 级 动作游戏的机会?展望未来五到十年,您能想象到哪些应用场景?

萨提亚·纳德拉

早在五、六、七年前,我就将这三件事视为 基石 。当时我说,我们想要下的三大 赌注 是 AI、量子计算 和 混合现实 。我仍然坚信它们,因为在某种意义上,我们需要解决的重大问题是什么?

临场感 (Presence)。这是 混合现实 的梦想。你们能否创造真正的 临场感 ?就像你和我现在这样进行播客一样。

坦率地说,我认为这仍然是更难解决的挑战之一。我原以为它会更容易解决。但它可能更具挑战性,这可能是因为 社交 方面的因素:佩戴设备等等。

我们对即将与 Anduril 和 Palmer Luckey 合作的项目感到兴奋,他们将推动 IVAS (集成视觉增强系统) 计划向前发展,因为这是一个绝佳的应用案例。我们将继续在这方面努力。

但 2D 界面 仍然很重要。事实证明,像 Teams 这样的工具,得益于疫情,我们已经真正获得了通过 2D 界面创造 临场感 的能力。我认为这将继续发展。这是一个长期的趋势。

我们已经讨论过 量子计算 ,而 AI 是另一个关键领域。因此,我关注这三个领域,并思考如何将它们结合起来?最终,不是为了技术而技术,而是为了解决我们在生活中作为人类所渴望的一些基本需求,更重要的是,我们在经济中需要它们,以提高生产力。如果我们能够以某种方式做好这一点,那么我认为我们真的取得了进步。

Dwarkesh Patel

当您撰写下一本书时,您必须解释一下为什么这三个领域几乎同时走到了一起,对吧?例如,你可能认为 量子计算 和 AI 应该分别在 2028 年和 2025 年取得突破,但这似乎并没有内在的必然联系。

萨提亚·纳德拉

没错。在某种程度上,我的理解是:是否存在 系统性突破 ?对我而言,量子计算 就是 系统性突破 。

是否存在 商业逻辑突破 ?对我而言,AI 就是 商业逻辑突破 ,即:逻辑层能否以根本不同的方式进行推理?能否用 学习系统 取代 命令式 的代码编写?这就是 AI 的意义。

而 UI 方面,关键在于 临场感 。

0:49:51 - AI 的法律壁垒

Dwarkesh Patel

让我们回到 AI 的话题。在您的 2017 年著作…… 2019 年你们投资了 OpenAI,非常早期,2017 年甚至更早,您在书中写道:“人们也可能会说,我们正在孕育一个新的物种,一个其 智能 可能没有上限的物种。”

当然,在 2017 年谈论这个还为时过早。我们一直在详细讨论 代理 、Office Copilot、 资本支出 等等。但如果您从更宏观的角度来看待您所说的这句话,并考虑到您作为 超大规模 云服务商,作为模型研究人员,以及为 构建新物种 提供训练、推理和研究支持的人,您如何看待这一切?

您认为在您担任 CEO 期间,我们会走向 超人智能 吗?

萨提亚·纳德拉

我认为即使是 Mustafa (可能是指 Mustafa Suleyman, Inflection AI CEO) 也使用了 “新物种” 这个词。事实上,他最近更频繁地使用这个词。

我的理解是,你们绝对需要 信任 。在我们声称它像 “物种” 一样重要之前,我们首先要确保的是,要建立真正的 信任 ,无论是个人层面的 信任 还是社会层面的 信任 ,都要将其融入其中。这才是真正的难题。

我认为,限制 AI 强大力量的最大因素将是我们的 法律…… 基础设施 如何发展以应对 AI?我们现有的世界秩序是建立在人类拥有财产、权利和承担责任等概念之上的。我们首先要思考的是,这对于人类正在使用的工具意味着什么?如果人类要将更多的权力委托给这些工具,那么这种结构又将如何演变?在这些问题真正解决之前,我认为仅仅谈论技术能力是没有意义的。

Dwarkesh Patel

您的意思是,在我们弄清楚如何…… 之前,我们将无法部署这些智能?

萨提亚·纳德拉

完全正确。因为归根结底,没有办法绕过 法律 问题。今天,除非有人以人类的名义为其提供 担保 ,否则你无法部署这些智能。

正如你所说,我认为这也是为什么我认为即使是最强大的 AI 本质上也是在人类委托的权力范围内工作的。你可能会说,哦,那是 对齐 (alignment) 以及其他各种问题。这就是为什么我认为你必须真正让这些 对齐 工作发挥作用,并且以某种方式使其可验证,但我只是不认为你可以部署 失控 的智能。例如,AI 起飞 问题 可能是一个真实存在的问题,但在它成为真正的问题之前,真正的问题将出现在法庭上。任何社会都不会允许有人说 “那是 AI 做的。”

Dwarkesh Patel

是的。好吧,世界上有很多社会,我想知道是否会有哪个社会的法律体系可能更宽松。如果你们无法阻止 起飞 ,那么你们可能会担心。起飞 不一定非得发生在美国,对吧?

萨提亚·纳德拉

我们认为没有哪个社会会不在乎,对吧?可能会有 流氓行为者 ,我不是说不会有 流氓行为者 ;有 网络罪犯 和 流氓国家 ;他们一直都在。

但认为人类社会整体上对此毫不在意也是不现实的。我认为我们都会在意。我们今天知道如何应对 流氓国家 和 流氓行为者 。世界不会袖手旁观,说 “我们可以容忍”。这就是为什么我很高兴我们拥有一个世界秩序,在这个秩序中,任何 流氓行为者 或 流氓国家 都会承担后果。

Dwarkesh Patel

没错。但如果你设想一个世界经济增长 10% 的情景,我认为这真的取决于 AGI 的实现,因为数万亿美元的价值,这听起来更接近人类工资的总和,约占经济总量的 60%。要达到这个规模,你们必须以非常显著的方式实现 劳动自动化 或 劳动辅助 。

如果这是可能的,并且一旦我们弄清楚了相关的 法律 问题,那么即使在您的任期内,我们弄清楚这些问题似乎也是很有可能的。您是否在考虑 超人智能 ?例如,您职业生涯中最重要的成就是这个吗?

萨提亚·纳德拉

你提出了另一个观点。我知道 David Autor 和其他人已经对此进行了很多讨论,即 60% 的劳动…… 我认为还需要解决的另一个问题是,至少在我们的民主社会中。我认为为了拥有稳定的社会结构,并使民主制度正常运转,你们不能只有 资本回报 ,而没有 劳动回报 。我们可以讨论这个问题,但这 60% 的 劳动 必须重新估值。

以我自己的理解方式,或许你可以称之为 天真 ,我们将开始重视不同类型的 人类劳动 。今天被认为是 高价值 的 人类劳动 可能会变成 商品 。可能会出现我们将会重视的新事物。

包括那些来帮助我进行物理治疗的人,或者任何我们将要重视的事物,但归根结底,如果我们没有 劳动回报 ,并且工作中缺乏意义和尊严,那么这将成为部署任何这些技术的另一个 制约因素 。

0:55:46 - 正确认识 AGI 的安全性

Dwarkesh Patel

在 对齐 方面,两年前,你们发布了 Sydney Bing 。需要明确的是,我认为考虑到当时的技术水平,这是一个迷人、可爱、有点滑稽的 未对齐 的例子。

但那是因为,当时还是 聊天机器人 的时代。它们可以思考 30 秒,然后给你一些有趣或不恰当的回复。但如果你想到那种系统——我认为《纽约时报》的一位记者,试图让他离开他的妻子——如果你考虑到未来,你们拥有这些 代理 ,它们可以持续数小时、数周、数月地运行,就像 自主 AGI 集群 一样,它们可能会以类似的方式 未对齐 并搞砸事情,甚至可能彼此协调,你们未来的计划是什么?以便当你们拥有真正强大的 AGI 时,你们能够确保它是 安全 的?

萨提亚·纳德拉

你说得没错。这就是为什么当我们分配计算资源时,我们通常会为 对齐 挑战分配计算资源的原因之一。

更重要的是,你们将使用什么样的 运行时环境 来真正监控这些东西?围绕它的 可观察性 如何?我们今天在 经典计算 方面也处理了很多类似的问题,例如 网络安全 。我们不会只是编写软件,然后就放任不管。你们拥有软件,然后你们会监控它。你们监控它是否存在 网络攻击 、 故障注入 等等。

因此,我认为我们将不得不围绕这些技术的 部署 方面构建足够的 软件工程 ,然后在模型内部,实现 对齐 。这些问题有些是真正的 科学问题 ,有些是真正的 工程问题 ,我们将不得不逐个解决。

这也意味着我们要承担我们自身在所有这些方面的 责任 。因此,我更倾向于在你们可以真正 管控 这些技术的 范围 和 规模 的领域部署它们。你们不能将一些会造成危害的东西释放到世界上,因为社会不会允许这样做。

Dwarkesh Patel

当你们拥有真正可以为你们完成数周任务的 代理 时,你们希望在允许它为一家 财富 500 强公司运行之前,获得哪些最低限度的保证?

萨提亚·纳德拉

我认为,当我使用像 Deep Research 这样的工具时,即使是现在,我们希望获得的最低限度的保证是,在我们拥有任何 物理实体 之前,我认为这是一个门槛,当你跨越这个门槛时,情况可能会发生变化。这可能是一个关键点。

另一个关键点是,例如, 运行时环境 的 权限 , 代理 在其中运行。你们可能希望保证它是 沙盒化的 ,它不会超出 沙盒 的范围。

Dwarkesh Patel

我的意思是,我们已经拥有了 Web 搜索 ,而且它已经超出了 沙盒 的范围。

萨提亚·纳德拉

但即使是它使用 Web 搜索 做的事情,以及它写出的内容——例如,正如你所说,如果它只是为了进行一些计算而编写一堆代码,那么这段代码部署在哪里?这段代码是临时的,仅用于创建输出,还是会被释放到世界各地?

这些是你们可以在 行动空间 中实际控制的事情。

Dwarkesh Patel

除了 安全 问题之外,当您考虑你们自己的产品套件,并考虑到如果你们真的拥有如此强大的 AI,那么在某个时候,它就不仅仅是 Copilot——您提到了一个例子,您如何为这次播客做准备——它更类似于您如何将工作委托给您的同事。

考虑到你们目前的产品套件,添加这种能力会是什么样子?我的意思是,有一个问题是,LLM 是否会被其他事物 商品化 。

我想知道,如果 LLM 是你们访问所有这些东西的主要入口点,那么这些 数据库 或 画布 或 Excel 表格 等等——LLM 是否有可能将 Office 商品化 ?

萨提亚·纳德拉

这是一个有趣的问题。至少在第一阶段,我的理解是:LLM 能否帮助我更有效地使用所有这些工具或 画布 来完成我的 知识工作 ?

我见过的最好的演示之一是一位医生为 肿瘤委员会 工作流程做准备。她要参加 肿瘤委员会 会议,她使用 Copilot 的第一件事是为会议创建议程,因为 LLM 可以帮助她分析所有病例,这些病例都存储在某个 SharePoint 站点上。它会说:“嘿,这些病例——显然,肿瘤委员会 会议是一个高风险的会议,你们需要注意病例之间的差异,以便你们可以合理分配时间。”

即使是创建议程的 推理任务 ,它知道如何分配时间,这也非常棒。因此,我使用 LLM 来完成这项任务。然后我参加会议,我在 Teams 通话中与我的所有同事进行交流。我专注于实际的病例,而不是做笔记,因为你们现在有 AI Copilot 在进行完整的转录。它不仅仅是转录,还是会议内容的 数据库 条目,可以永久保存并随时查阅。

然后,她走出会议室,已经讨论了病例,并且没有被做笔记分心。她是一位教学医生;她想去为她的课程做准备。因此,她进入 Copilot,说:“把我 肿瘤委员会 会议的内容制作成 PowerPoint 幻灯片,这样我就可以向我的学生讲解。”

这就是我所说的场景。我拥有的 UI 和 脚手架 是 画布 ,现在正在使用 LLM 填充内容。而 工作流程 本身正在被重塑;知识工作 正在被完成。

这里有一个有趣的现象:如果有人在 80 年代末告诉我,“你的桌子上将会有数百万份文档。” 我会说:“这到底是什么意思?” 我真的会以为我的桌子上会堆满数百万份纸质文档。但事实上,我们确实拥有数百万个电子表格和数百万份电子文档。

Dwarkesh Patel

我没有,您有。

萨提亚·纳德拉

它们都在那里。代理 也会发生同样的情况。将会有一个 UI 层。对我来说,Office 不仅仅是今天的 Office;它是 知识工作 的 UI 层。它会随着 工作流程 的发展而演变。这就是我们想要构建的。

我确实认为,今天存在的 SaaS (软件即服务) 应用,这些 CRUD (创建、读取、更新和删除) 应用,将会发生根本性的变化,因为 业务逻辑 将更多地转移到 代理层 。事实上,今天在我的 Copilot 体验中,另一个很酷的功能是,当我说 “嘿,我正在为与客户的会议做准备” 时,我只需要说 “给我我应该知道的所有会议记录。” 它会从我的 CRM 数据库 中提取信息,从我的 Microsoft Graph 中提取信息,创建一个 复合 的 工作制品 ,然后它甚至会对它应用 逻辑 。我认为这将彻底改变我们今天所知的 SaaS 应用。

Dwarkesh Patel

SaaS 作为一个行业,每年的价值可能达到数千亿甚至数万亿美元,具体取决于你的统计方式。如果 AI 真的可以将 SaaS 行业颠覆,那么你们在未来十年是否有可能再次将微软的市值提升 10 倍?因为你们正在谈论的是数万亿美元……

萨提亚·纳德拉

这也将在 SaaS 领域创造巨大的价值。我们可能没有给予足够重视的一件事是,世界上存在大量的 IT 积压工作。

这些 代码生成 工具,加上我可以使用 代理 询问你的所有 SaaS 应用并获得更多效用的能力,将带来应用程序的最大爆发,它们将被称为 代理 ,因此在每个垂直领域、每个行业、每个类别中,我们突然都将拥有获得服务的机会。

因此,这里蕴藏着巨大的价值。你不能原地踏步。你不能仅仅满足于过去那种 “我 схематизировал 了某些狭窄的业务流程,我在浏览器中有一个 UI,这就是我的产品” 的模式。情况不会是这样了。你必须向上发展,思考 “我必须参与的任务是什么?”

你将希望能够将你的 SaaS 应用转变成一个出色的 代理 ,使其能够参与到一个 多 代理 世界中。只要你能做到这一点,我认为你甚至可以提升价值。

1:04:59 - 在微软的 34 年

Dwarkesh Patel

我可以问您一些关于您在微软工作经历的问题吗?

萨提亚·纳德拉

当然。

Dwarkesh Patel

成为一个 “公司人” 是否被低估了?您在微软度过了职业生涯的大部分时间,可以说,您能够为公司增加如此多价值的原因之一是,您亲身经历了公司的文化、历史和技术演变。您通过在公司内部晋升积累了所有这些背景知识。是否应该让更多拥有这种背景知识的人来运营公司?

萨提亚·纳德拉

这是一个很好的问题。我以前没有这样想过。

在我为微软工作的 34 年里,每年我都感到更加兴奋,而不是认为 “哦,我只是一个 公司人 ” 或其他什么。我认真对待 “公司人” 这个身份,即使对于任何加入微软的人来说也是如此。他们加入微软,只要他们认为可以利用微软这个平台来实现他们的经济回报,同时也实现他们的目标和使命感。这就是我们之间的 契约 。

所以我认为,是的,公司必须创造一种文化,让人们能够融入并成为像我这样的 “公司人”。至少在我的案例中,微软做得还算不错,我希望这种情况能够继续保持下去。

Dwarkesh Patel

您谈到的第六任 CEO,他将有机会利用您现在开始的研究成果。您正在做些什么来留住未来的 萨提亚·纳德拉 ,以便他们能够成为未来的领导者?

萨提亚·纳德拉

这很有意思。今年是微软成立 50 周年,我对此思考了很多。我认为思考这个问题的关键在于, 长寿 不是目标, 相关性 才是 。

我和所有 20 万微软员工每天都必须做的是:我们所做的事情对于我们所看到的世界发展趋势是否有用和相关,不仅是今天,还有明天?

我们身处一个没有 特许经营价值 的行业,这是另一个难题。如果将我们今年的研发预算拿出来,那完全是在 猜测 五年后会发生什么。你必须抱着这样的态度,对自己说:“我们正在做的事情,我们认为将会是相关的。”

所以你必须专注于此。然后你要认识到,存在一个 击球率 的问题,你不可能每次都成功——你必须对失败有很高的容忍度。你必须进行足够的尝试,才能对自己说:“好吧,我们作为一家公司将会成功渡过难关。” 这就是这个行业的棘手之处。

Dwarkesh Patel

说到——您刚才提到微软成立 50 周年纪念日还有两个月。如果你看看市值排名前 10 或前 5 的公司,基本上除了微软之外,其他所有公司都比微软年轻。这是一个有趣的观察,为什么最成功的公司往往都很年轻。 财富 500 强企业的平均寿命只有 10 到 15 年。

微软为了保持这么多年的 相关性 ,都做了些什么?你们是如何不断 重塑自我 的?

萨提亚·纳德拉

我喜欢 Reed Hoffman 使用的 “重塑自我 (refounding)” 这个词。这是一种 心态 。人们谈论 创始人模式 (founder mode),但对于我们这些凡人 CEO 来说,更像是 重塑自我 模式。

能够以全新的视角看待事物是关键。对于你的问题:我们能否在 文化 上创造一种环境,让 重塑自我 成为一种习惯?我们每天上班,都告诉自己:“我们在这个地方拥有 股份 ,能够改变我们所做事情的核心假设,以及我们与周围世界的关系。我们是否允许自己这样做?” 我认为很多时候,公司会感到受到 商业模式 或其他因素的过度束缚。你只需要解除自己的束缚。

Dwarkesh Patel

如果您离开微软,您会创办一家什么样的公司?

萨提亚·纳德拉

我将创办的公司?天哪。这就是 “公司人” 的我所想的, “我永远不会离开微软。”

如果我考虑做些什么,我认为我会选择一个具有…… 当我展望科技的梦想时,我们总是说科技是最大、最伟大的 民主化 力量。

我感觉我们终于拥有了这种能力。如果你说我们能够实现的每美元每瓦特的 token 数量,我希望找到一些可以应用它的领域,一些 服务严重不足 的领域。

医疗保健 、 教育 …… 公共部门 也会是一个选择。如果你选择这些 服务不足 的领域,在这些领域,我作为这个国家的公民或这个社会的成员,或任何地方的公民,如果所有这些 充裕供应 的智能能够转化为更好的 医疗保健 、更好的 教育 和更好的 公共部门机构 为我服务,我的生活会变得更好吗?那将是一个值得探索的领域。

1:10:46 - 萨提亚·纳德拉 相信 AGI 吗?

Dwarkesh Patel

听了您对不同问题的回答,我不太确定您是否认为 AGI 是真实存在的。是否会有一种东西能够 自动化 所有 认知劳动 ,就像任何人在计算机上可以做的事情一样?

萨提亚·纳德拉

这就是我对人们谈论 AGI 的定义感到困惑的地方。 认知劳动 不是一成不变的。今天存在 认知劳动 。如果我有一个 收件箱 来管理我的所有 代理 ,这是一种新的 认知劳动 吗?

今天的 认知劳动 可能会被 自动化 。但新创造的 认知劳动 呢?这两者都需要考虑,这是一种 转变 ……

这就是为什么我至少在我的脑海中做出了区分:不要将 知识工作者 与 知识工作 混淆。今天的 知识工作 可能会被 自动化 。谁说我的人生目标是 分拣我的电子邮件 ?让 AI 代理 来 分拣我的电子邮件 吧。

但是在 分拣完我的电子邮件 之后,给我一个更高层次的 认知劳动 任务,例如 “嘿,这是我真正希望你审查的三份草稿。” 这是一个不同的抽象层次。

Dwarkesh Patel

但是 AI 会达到第二个层次吗?

萨提亚·纳德拉

可能会,但当它达到第二个层次时,就会出现第三个层次。为什么我们认为,当我们处理了历史上改变 认知劳动 定义的工具之后,我们会担心所有的 认知劳动 都会消失呢?

Dwarkesh Patel

我相信您以前听过这些例子,例如 马 仍然可以在某些方面发挥作用,有些地形是汽车无法行驶的。但问题是,你会在街上看到 马 吗?会雇用数百万匹 马 吗?这种情况不会发生。

那么问题是,类似的事情会发生在人类身上吗?

萨提亚·纳德拉

但这只是在一个非常狭窄的维度上?人类重视我们所理解的某种狭隘的 “认知劳动” ,只有 200 年的历史。

让我们以 化学 为例。如果 量子计算 + AI 真的帮助我们进行了大量 新型材料科学 研究等等,那么拥有 AI 完成 新型材料科学 研究是很棒的。但这会剥夺人类可以做的所有其他事情吗?

为什么我们不能生活在一个既有强大的 认知机器 ,又知道我们的 认知能动性 (cognitive agency) 没有被剥夺的世界中呢?

Dwarkesh Patel

我将问一个与您无关的问题,而是一个不同的场景,这样您就可以毫无顾忌地回答。假设在微软董事会上,您是否会考虑在董事会中增加一个 AI 成员?它是否有可能拥有足够的 判断力 、 背景知识 和 整体理解力 ,从而成为一个有用的顾问?

萨提亚·纳德拉

这是一个很好的例子。我们添加的一个功能是在 Teams 中添加了一个 引导 代理 (facilitator agent)。其目标是,尽管还处于早期阶段,但这个 引导 代理 能否利用 长期记忆 ,不仅包括会议的背景,还包括我正在进行的项目、团队等等的背景,成为一个出色的 引导者 ?

我甚至希望在董事会会议上也能有这样的 引导 代理 ,因为在董事会会议上,人们很容易分心。毕竟,董事会成员每个季度才来一次,他们试图消化像微软这样复杂的公司正在发生的事情。一个 引导 代理 ,能够帮助所有人类成员保持专注,并专注于重要的问题,这真是太棒了。

这实际上就相当于拥有,正如你之前的问题所说,拥有一些拥有 无限记忆 的东西,甚至可以帮助我们。你知道, Herbert Simon (赫伯特·西蒙) 提出了什么理论?我们都是 有限理性 (bounded rationality) 的。因此,如果人类的 有限理性 可以通过外部的 认知放大器 来解决,那就太好了。

Dwarkesh Patel

说到材料和化学领域,我认为您最近说过, 您希望未来 250 年的进步在未来 25 年内实现。现在,当我想象未来 250 年可能发生的事情时,我想到了太空旅行、太空电梯、永生和治愈所有疾病。未来 25 年,您认为?

萨提亚·纳德拉

我之所以提出这个问题,是因为我很喜欢 工业革命 持续了 250 年这个说法。我们必须经历从 碳基系统 到某种不同系统的整个转变过程。

这意味着你必须从根本上 彻底改造 过去 250 年来化学领域发生的一切。这就是我希望我们拥有 量子计算机 的原因, 量子计算机 可以帮助我们获得 新型材料 ,然后我们可以制造这些 新型材料 ,以帮助我们应对地球上我们面临的所有挑战。然后,我完全支持 星际旅行 。

Dwarkesh Patel

太棒了。萨提亚,非常感谢您抽出时间接受采访。

萨提亚·纳德拉

非常感谢你。这次采访很棒。谢谢。

Dwarkesh Patel

好的,谢谢您。

未经允许不得转载:首席AI分享圈 » 专访萨提亚·纳德拉:经济增长优先于AGI,微软AI蓝图与量子计算的跃迁
zh_CN简体中文