Muse Spark - Meta 发布的全新旗舰 AI 模型

1.4K 00

Muse Spark是什么

Muse Spark 是 Meta 发布的全新旗舰 AI 模型，由 Meta Superintelligence Labs（MSL）历时 9 个月打造，内部代号"Avocado"。作为 Muse 系列的首款产品，标志着 Meta 从 Llama 开源路线转向闭源自研战略，定位"小而快"的原生多模态推理模型，已集成至 Meta AI 应用及 meta.ai 网站，主打科学、数学与健康领域的复杂推理任务。

Muse Spark的功能特色

原生多模态感知：从预训练阶段即融合文本、图像、语音输入，无需先将图像转译为文字，可直接从像素级提取信息并推理，如拍摄机场零食货架自动识别并按蛋白质含量排序。
三级推理模式：Instant（即时响应）、Thinking（逐步推理）、Contemplating（沉思模式，多 Agent 并行处理复杂任务）。
Visual Chain of Thought (VCoT)：将思维链机制引入视觉空间，模型能在图像中"思考"，自主构建视觉元素间的空间与逻辑关系。
多 Agent 编排：原生支持工具调用与多智能体并行，如规划旅行时可同时调用子 Agent 分别制定 itinerary、对比目的地、查找儿童友好活动。
社交生态融合：结合 Meta 社交图谱历史数据（点赞、分享记录）与实时视觉感知，提供个性化推荐。

Muse Spark的核心优势

效率飞跃：与 Llama 4 Maverick 相比，达到同等能力所需算力不足十分之一，训练效率提升超 10 倍。
医疗领域领先：HealthBench Hard 测试得分 42.8%，大幅领先 GPT-5.4（40.1%）、Gemini 3.1 Pro（20.6%）及 Claude Opus 4.6（14.8%），Meta 投入超 1000 名医生参与训练。
第一梯队性能：Artificial Analysis Intelligence Index 得分 52 分，位列全球第四（仅次于 Gemini 3.1 Pro、GPT-5.4、Claude Opus 4.6）， Humanity's Last Exam 得分 58%。
Token 效率突出：运行同等任务输出 Token 数（58M）显著低于 Claude Opus 4.6（157M）与 GPT-5.4（120M）
视觉推理优异：CharXiv Reasoning 得分 86.4（思考模式），超过 GPT-5.4（82.8）与 Gemini 3.1 Pro High（80.2）。

使用Muse Spark的操作步骤

访问渠道：当前通过 Meta AI 独立应用（iOS/Android）或 meta.ai 网页版使用，需美国 IP，后续将扩展至 WhatsApp、Instagram、Facebook、Messenger 及 Ray-Ban 智能眼镜。
模式切换：在对话界面选择"即时"（Instant）或"思考"（Thinking/Contemplating）模式，后者适合复杂科研、数学推导任务。
多模态输入：支持上传图片进行视觉问答，或在智能眼镜端直接调用摄像头实时识别场景。
API 接入：目前仅向少量合作伙伴开放私有 API 预览，未来计划推出付费 API 服务。

Muse Spark的适用人群

健康医疗用户：需获取营养、运动、医疗主题详细解答的普通用户，模型与超千名医生合作训练，回答更专业。
科研与 STEM 工作者：适合处理复杂科学推理、数学问题及物理研究（CritPT 物理评测得分 11%，高于 Claude Sonnet 4.6 的 3%）。
视觉交互场景用户：需要实时视觉识别、图像分析功能的旅行者、购物者（如机场零食识别场景）。
Meta 生态重度用户：依赖 Instagram、Facebook 等平台，希望获得基于社交历史数据的个性化 AI 助手。