Sage - 商汤绝影发布的端侧多模态智能体基座大模型
Sage是什么
Sage是商汤绝影发布的端侧多模态智能体基座大模型,采用MoE架构,总参数32B、激活参数仅3B,是行业内首款在车端实现复杂智能体能力的基座大模型。在国际公开Agent评测基准PinchBench上以94%的任务完成率超越Claude-Opus-4.6、GPT-5.4、Gemini-3等一众云端旗舰模型,首次将云端级智能体能力落地端侧,已在英伟达Orin X平台实现部署。Sage可接入OpenClaw、Hermes等主流Agent框架,覆盖出行、家庭等全场景,为智能座舱和舱驾一体方案打通了量产可行的模型路径。

Sage的功能特色
- 端侧多模态智能体推理:作为行业首款车端多模态智能体基座模型,支持复杂推理、多步规划与工具调用,可在无网络环境下独立完成从意图理解到任务执行的完整闭环。
- 极致轻量高效推理:采用MoE架构,总参数32B但仅激活3B,在英伟达Orin X平台实现首字响应约0.5秒、单Token延迟0.03秒、生成吞吐80 tk/s,以小算力实现云端级智能体性能。
- 原生车载多模态感知:深度理解座舱语义与视觉信息,在Human Semantic Understanding测试中获91分(提升32%),可结合传感器主动感知乘员状态、路况及环境变化。
- 复杂指令解析与系统联动:一次性解析用户复合指令,自动调用空调、导航、影音、车窗等车载子系统,实现"说到做到"的主动式服务,复杂指令遵循率提升40%。
- 长链路任务规划与执行:支持多步骤工具调用与任务闭环,长链路调用成功率达92%、逻辑规划成功率89%,可完成如"规划路线并同步调整车内环境"等跨系统复杂任务。
- 主流Agent框架兼容:原生适配OpenClaw、Hermes等主流Agent框架,便于开发者快速构建和接入端侧智能体应用生态。
- 全天候主动服务(Always On):从被动唤醒进化为持续在线的出行伙伴,可主动提供儿童模式、疲劳提醒、智能路线调整、安全预警等场景化服务。
Sage的核心优势
- 端侧智能体能力领先:以仅3B激活参数在PinchBench上取得94%最佳任务完成率,超越Claude-Opus-4.6(93.3%)、GPT-5.4(90.5%)、Google-Gemma-4(83.9%)等,打破"只有大模型才能做好智能体"的惯性认知。
- 极致效率与低延迟:在Orin X平台部署下,首字响应(TTFT)约0.5秒、单Token推理延迟(TPOT)低至0.03秒、生成吞吐达80 tk/s,平均任务时长优于主流API模型。
- 两大自研后训练黑科技::
- SCOUT(分级协同学习框架):让大模型学复杂任务节省约60% GPU小时消耗,实现"小模型探路、大模型吸收"的高效学习机制。
- ERL(可擦除强化学习):已被ICLR 2026收录,让模型自动识别并擦除错误步骤,从源头阻断偏差扩散,装车后复杂任务完成率提升20%。
- 原生车载数据优势:在Human Semantic Understanding(座舱语义与视觉理解)测试中获91分,提升32%,依托真实出行场景长期训练建立独特壁垒。
- 全面领先同级端侧模型:MMLU Pro获76分(领先约10%)、GPQA Diamond获77分(提升33%)、τ2-bench工具调用与任务闭环获80分(相较Gemma 4提升38%)。
- 量产成本优势:Token零成本,单台车日均节省30元云端费用,万车年省超亿元,彻底摆脱云端成本负担。
Sage的适用人群
- 汽车制造商与OEM主机厂:需要将端侧智能体能力集成到智能座舱或舱驾一体方案中的车企,尤其关注量产成本、数据隐私和离线稳定性的品牌方。
- 车载智能体与座舱系统开发者:从事智能座舱应用开发、车载Agent生态建设的软件供应商和独立开发者,可通过OpenClaw、Hermes等框架接入Sage进行端侧智能体开发。
- 智能驾驶与舱驾融合方案商:打通智驾与座舱数据壁垒、构建"一脑多形"自主智能大脑的技术团队,需要统一的端侧AI中枢平台。
- Tier 1零部件供应商:为车企提供车载计算平台、域控制器或智能座舱硬件的供应商,可将Sage作为端侧模型能力集成到其硬件方案中。
- 家庭与边缘终端设备厂商:计划将多模态智能体能力延伸到家用边缘大脑、陪伴机器人、智能家居中枢等非车载终端的硬件厂商。
Sage的常见问题
Q:Sage的3B激活参数为什么能超越GPT-5.4等云端大模型?
A: Sage采用MoE架构,通过SCOUT和ERL两大后训练技术实现高效学习与错误纠偏,同时依托商汤绝影多年汽车AI领域的原生车载数据训练,在端侧智能体任务上实现了"小身材、大能量"的效率革命。其所需激活算力仅为小米MiMo-v2-Pro(42B激活)的1/14,显存占用约1/31,但PinchBench完成率高出6.6个百分点。
A: Sage采用MoE架构,通过SCOUT和ERL两大后训练技术实现高效学习与错误纠偏,同时依托商汤绝影多年汽车AI领域的原生车载数据训练,在端侧智能体任务上实现了"小身材、大能量"的效率革命。其所需激活算力仅为小米MiMo-v2-Pro(42B激活)的1/14,显存占用约1/31,但PinchBench完成率高出6.6个百分点。
Q:Sage是否已经开源?普通开发者能否直接使用?
A: 截至目前官方未明确宣布Sage开源计划。该模型主要面向车企量产部署和车载智能体生态接入,并非面向普通消费者独立注册使用的产品。开发者可通过接入Sage支持的OpenClaw、Hermes等Agent框架进行端侧智能体开发。
A: 截至目前官方未明确宣布Sage开源计划。该模型主要面向车企量产部署和车载智能体生态接入,并非面向普通消费者独立注册使用的产品。开发者可通过接入Sage支持的OpenClaw、Hermes等Agent框架进行端侧智能体开发。
Q:Sage Box是什么?与Sage模型是什么关系?
A: Sage Box(千机智盒)是商汤绝影在2026北京车展期间推出的整车模型接入硬件/方案,以"Sage端侧模型 + Sage OS(千机系统)+ New Member原生智能体"三层架构构建可进化的车载自主智能大脑,是Sage模型的量产落地载体。
A: Sage Box(千机智盒)是商汤绝影在2026北京车展期间推出的整车模型接入硬件/方案,以"Sage端侧模型 + Sage OS(千机系统)+ New Member原生智能体"三层架构构建可进化的车载自主智能大脑,是Sage模型的量产落地载体。
Q:Sage在真实车舱中的任务成功率表现如何?
A: Sage场景推理精度超过90%,长链路工具调用成功率92%、逻辑规划成功率89%、环境感知任务成功率94%,复杂指令遵循率提升40%。
A: Sage场景推理精度超过90%,长链路工具调用成功率92%、逻辑规划成功率89%、环境感知任务成功率94%,复杂指令遵循率提升40%。
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...




