当中国 AI 新秀 DeepSeek 以开源低成本模型在全球人工智能领域掀起波澜之际,OpenAI 首席执行官 Sam Altman 正低调展开他的东京之旅。 这次访问的核心议题,无疑是这家行业领头羊如何应对新兴竞争格局,并巩固其技术领先地位。
在与软银创始人孙正义商讨高达 5000 亿美元的潜在巨额投资之前,Altman 与 OpenAI 首席产品官 Kevin Weil 现身东京大学,与师生进行了一场深入的问答交流。期间,他们透露了一系列引人瞩目的信息,预示着 OpenAI 未来的发展方向和对行业竞争态势的战略思考。
GPT 系列模型迭代路线图:效率革命与能力跃升
Altman 在访谈中明确指出,OpenAI 内部已在 GPT-4.5 的基础上取得了进展,并对 GPT-5.5 的实现路径有了更清晰的认知。 值得注意的是,他强调 “达到 GPT-5.5 并不需要 100 倍以上的计算能力”。
这一论断并非空穴来风,而是基于 OpenAI 在 推理模型 和 强化学习技术 方面的突破。 Altman 解释说: “推理模型和强化学习技术的进步极大地提高了计算效率,它允许较小的模型实现 GPT-6 级别的性能,而不需要 100 倍以上的计算能力。” 这意味着,OpenAI 正在探索一条 “效率驱动” 的模型升级路径,而非单纯依赖算力堆叠。
多模态融合与智能体战略:构建通用人工智能生态
Altman 进一步描绘了 OpenAI 未来的技术蓝图,多模态融合 和 智能体 将成为其战略布局的核心。 他预告了下一代模型 “o 系列” 的强大功能:
- 多模态整合: “我们会把所有模态整合在一起,你可以在画布上看到,它一边和你语音,一边为你编写和编译代码。它将能够浏览互联网。” 这意味着未来的 OpenAI 模型将不再局限于文本,而是能够无缝处理语音、图像、代码等多种信息形式,实现更自然、更全面的交互体验。
- 视觉识别能力: “o 模型将能支持视觉识别功能,比如某个硬件需要检修,拍一张照片,o 系列模型将能提供技术支持。” 这将极大地拓展 AI 的应用场景,使其能够理解物理世界,并提供更具实用价值的解决方案。
- 小型化高效推理模型: “o3-mini 预示了未来六到十二个月的研究方向......” OpenAI 将持续投入研发小型化、高推理性能的模型,使其在 STEM 领域乃至更广泛的领域都具备卓越表现。
- 智能体雏形: “我希望到今年年底,我们能开发出一个除了科学发现,其他高难度任务都被它能解决的智能体模型,它可能需要几个小时来思考,甚至可能需要调用一堆工具,但它最终能够为你完成任务。” 这表明 OpenAI 正在积极探索 自主智能体 的构建,旨在打造能够独立完成复杂任务的 AI 系统,而近期发布的 Deep Research 功能正是这一战略的重要里程碑。
尽管 Altman 和 Weil 强调此行的目的是收集用户反馈,但他们不经意间透露出的 GPT 产品规划,以及对 DeepSeek 开源策略的回应,都清晰地表明 OpenAI 的战略重心正在发生转变: 从单纯追求模型规模和算力,转向深耕高能力推理模型、多模态融合和智能体技术,以构建更通用、更高效、更智能的 AI 生态。
访谈核心要点精析:GPT 未来展望与战略布局解读
本次东京大学访谈的重点进行了梳理,以下为对话核心内容的深度解读:
GPT 系列模型未来的发布计划
Q:如果 ChatGPT 获得了 100 倍的算力,它会出现什么新的涌现特性?会出现什么质的飞跃吗?
奥特曼:OpenAI 正在积极探索算力提升带来的模型能力跃升,代号 “星际之门” (Star Gate) 的项目正是为此而生,其算力规模将达到当前集群的百倍量级。 回顾 GPT 系列的发展历程,从 GPT-1 到 GPT-4,每一代模型都伴随着约 100 倍的算力增长,并随之涌现出令人瞩目的新能力。
然而,Altman 强调,过去一年最大的突破在于推理模型的出现,这使得计算效率得到了显著提升。 他指出,借助强化学习等技术,小模型也能在特定基准测试中达到以往需要 GPT-6 级别才能实现的性能。 这意味着,OpenAI 正在探索新的技术范式,即通过算法创新和效率优化,而非单纯依赖算力扩张,来驱动模型能力的提升。
基于推理模型技术的突破,Altman 对 AI 的未来发展充满期待,尤其是在自主科学发现领域。 他认为,AI 有望在不久的将来自主发现新的科学知识,特别是在物理学和生物学等领域。 他以 OpenAI 推理模型的快速迭代为例,从最初只能达到百万名之外的竞赛程序员水平,到 o3 模型已经能够跻身世界前 175 名,再到内部测试模型接近世界前 50 名,惊人的进步速度预示着 AI 在推理能力方面蕴藏着巨大的潜力。 Altman 甚至大胆预测,到今年年底,OpenAI 的模型有望在竞赛编程领域冲击世界第一。
未来研究领域与技术挑战
Q:能否分享一下你们未来的各个研究领域的研究计划,以及你们目前认为什么是可实现的,什么是特别具有挑战性的?
奥特曼: 上周五发布的 o3-mini 模型,正是 OpenAI 未来 6-12 个月研究方向的风向标。 小型化、高推理能力、超快速模型将是 OpenAI 近期研发的重点,并逐步拓展至所有领域。
多模态融合是另一大战略方向。 OpenAI 致力于将文本、语音、图像、代码等多种模态整合到同一个模型中,打造更全面、更自然的交互体验。 模型规模的持续扩张也在计划之中,GPT-5、GPT-6 乃至更高级别的模型依然值得期待。
智能体 (Agent) 技术是 OpenAI 当前重点发力的领域。 近期推出的 Deep Research 功能,正是 OpenAI 在智能体方向迈出的重要一步。 该功能能够自主完成复杂的在线研究任务,大幅提升信息获取和分析效率。 Altman 透露,OpenAI 将持续开发更多智能体产品,并最终实现 “编程智能体” 的愿景,即打造能够自主完成复杂编程任务的 AI 系统。
展望未来,Altman 希望在今年年底前,开发出一款能够解决“除了科学发现之外的大多数复杂问题”的通用智能体模型。 这款模型可能需要数小时的思考时间,并调用各种工具,但最终能够独立完成用户交付的复杂任务。 尽管实现这一目标仍面临巨大的计算规模和算法挑战,但 Altman 对此充满信心。
ChatGPT 对高等教育的影响
Q:生成式 AI 在未来 10 年、30 年、100 年将如何改变教育?
奥特曼: 生成式 AI 将重塑教育格局,让每个人都能获得超越当今顶尖水平的个性化教育。 基于 OpenAI 技术的教育初创公司正在涌现,致力于为学习者提供量身定制的学习方案,弥补知识短板,促进终身学习。 学生群体已成为 ChatGPT 的主要用户,教育领域无疑是生成式 AI 最具潜力的应用场景之一。
展望更长远的未来,奥特曼认为 AI 将极大地加速科学进步和发现,未来 10 年科学发展速度可能提升 10 倍甚至 100 倍。 这将显著提升人类生活质量,推动太空探索等前沿领域的进步。 然而,在社会层面,人类的核心需求和生活方式不会发生根本改变,人际交往、家庭生活、兴趣爱好依然是人类社会的重要组成部分。奥特曼明确表示 “一点也不担心人类会失业”,他认为 AI 带来的只是工作内容和环境的改变,而非对人类社会运作模式的颠覆。
AI 工具的公平获取
Q:全世界如何公平地获取这些 AI 工具?
奥特曼: OpenAI 的目标是让智能变得极其廉价,最终实现近乎零成本的普及,让全球每个人都能免费使用。 为了实现这一愿景,OpenAI 不断降低模型使用成本。 当前模型的智能水平已远超两年前的 GPT-3,但价格却只有 GPT-3 最初的 1%。 OpenAI 将持续致力于降低 AI 使用门槛,推动技术普惠。
AI 时代的人才需求与技能
Q:你认为在 AI 时代,亚洲会更看重什么样的人才和技能?给学生们一些建议,你认为什么样的才能和技能最宝贵、最重要?
奥特曼: 在 AI 时代,与 AI 比拼数学或编程能力是徒劳的。 正如计算器的发明彻底改变了算数技能的重要性一样,AI 的崛起也将重新定义人才的核心竞争力。 未来的关键技能在于 “借助 AI 做一些以前没人能做到的事情”。
奥特曼建议,未来的核心技能包括: 洞察用户需求、 具备创新愿景、 快速适应变化、 保持坚韧不拔,以及 掌握利用 AI 工具提升效率的方法。Kevin Weil 补充道, 积极拥抱 AI 工具,将其融入工作和学习流程至关重要。 他建议学生们主动思考 “AI 能否帮助我更快完成任务?哪些工作可以外包给 AI?”
奥特曼强调, AI 与人类并非零和博弈,而是一种 “共同进化” 的关系。 人类应积极适应新技术,借助 AI 获得前所未有的能力。 Weil 推荐沃顿商学院教授 Ethan Malik 的著作《Co Intelligence》,该书深入探讨了如何利用 AI 进行教学,以及学生如何与 AI 协同工作。
DeepSeek 开源策略的影响与 OpenAI 的回应
Q:早些时候,你提到要让智能对每个人都可获取。随着中国 DeepSeek AI 的最近发布以及公开权重和架构,OpenAI 远离开源的有效性受到了质疑。你们是否有计划重新考虑这个立场?理由是什么?
奥特曼: OpenAI 正在重新评估开源策略。他明确表示 “是的,我们会这样做”, 但具体开源哪些模型以及何时开源,尚无明确时间表。奥特曼认为, 行业发展趋势似乎正朝着更加开放模型的方向演进,社会也逐渐接受开源带来的潜在风险和挑战。 他强调, OpenAI 在确保开源模型的安全性和稳健性方面取得了进展,并认为大多数开源模型将被用于积极目的。 DeepSeek 的开源举动无疑对 OpenAI 的战略决策产生了影响,促使其重新审视自身在开源领域的立场。
其他 Q&A 精选
- 脑机接口与意识形态: 奥特曼认为,脑机接口技术正迎来发展良机,未来有望实现人脑与 AI 的直接连接。 他对一些 “破坏性” 的脑机接口方案持保留态度,但看好 “轻量级” 方案的发展前景,并认为未来 6 个月将涌现更多有趣的新公司。
- AI 与太空工程: Weil 认为,太空领域 AI 应用正迎来快速发展期。 卫星性能不断提升,模型体积不断缩小,使得在太空部署 AI 模型成为可能。 他所在的 Planet 公司已发射搭载 GPU 的卫星,用于在太空运行 AI 模型,加速数据处理和传输。
- AI 未来发展预测: 奥特曼预测, 到 2035 年,单个数据中心的智力容量将超过 2025 年地球上所有人类和 AI 的总智力容量。 这意味着 AI 的发展速度将远超想象。
- 稀缺数据集的模型训练策略: Weil 指出, 随着模型智能程度的提升,微调模型所需的样本量正在减少。 高智能模型能够通过少量数据点快速学习新领域知识, 这为解决稀缺数据集的模型训练问题提供了新的思路。
创业、机器人与技术追赶
- 创业建议: 奥特曼认为, 创业初期团队成员最重要的特质是 能量和坚定。 他引用 Paul Graham 的名言 “be relentlessly resourceful” (百折不挠,足智多谋),强调早期团队应具备极强的学习能力和解决问题的能力。 Weil 补充道, 创业者需要 灵活、 不放弃、 善于学习, 以应对创业过程中层出不穷的挑战。
- 机器人语言与文化: 奥特曼认为, 将视觉和听觉输入整合到抽象思维框架中,是机器人发展自主语言和文化 的关键。 他预计, 随着智能体技术的发展, 多智能体系统将涌现,并发展出新的交流和信息共享方式。 尽管可能不会像科幻电影中描绘的那样戏剧化,但机器人自主交流和文化现象的出现是值得期待的。
- 技术追赶与竞争优势: 奥特曼强调, 商业的基本规律在 AI 时代依然适用,创业者需要建立具有持久价值、粘性和差异化的产品或服务。 他推荐 Peter Thiel 的著作《从 0 到 1》,深入探讨了如何构建长期竞争优势。 Weil 建议, 创业者应致力于构建 “前沿” 产品,不断拓展模型能力的边界。如果创业项目害怕 OpenAI 的模型升级,那就说明方向可能存在问题。 反之,如果期待模型升级能为产品带来更大价值,则表明项目正处于正确的轨道上。
总结
OpenAI CEO Sam Altman 的东京之行,不仅预示着 GPT 系列模型迭代的新方向,也展现了 OpenAI 在全球 AI 格局变动下的战略思考。 从强调算力堆叠到注重效率提升,从文本模型到多模态融合,从单模型智能到智能体生态,OpenAI 正积极拥抱技术变革,并试图在新的竞争格局中保持领先地位。 DeepSeek 等中国 AI 新秀的崛起,无疑给 OpenAI 带来了新的挑战,也促使其更加积极地拥抱开放与合作,共同推动人工智能技术的进步与普及。