MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

堆友AI

MiniMax M3是什么

MiniMax M3是稀宇科技发布的新一代人工智能大模型,采用自研稀疏注意力机制(MSA),支持100万tokens超长上下文和原生多模态功能(图像/视频输入及桌面操作)。编程能力在SWE-Bench Pro测试中超越GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7水平;SVG生成性能(SVG-Bench)和多模态测评(OmniDocBench)均领先同类模型。相比前代M2系列,推理延迟降低10-15倍,API定价为输入0.84-8.4元/百万tokens,支持通过Minimax Code工具直接调用。是国内首个同时具备超长上下文、多模态和开源属性的AI模型。

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3的功能特色

  • Нативное мультимодальное слияние:从预训练第零步开始即进行文本、图像、视频的交错多模态训练,视觉与文本语义空间高度对齐,支持看图、看视频、操作电脑桌面等跨模态任务。
  • 百万级超长上下文:API 最高支持 1M tokens 上下文窗口(约 70 万汉字),并保障至少 512K tokens 可用,为长程 Agent、长视频理解与大规模代码库分析提供基础设施。
  • 智能体与编码能力:具备自主任务拆解、工具调用与多步推理能力,代码生成目标为「直接可交付」而非「能跑但需要人改」。
  • MSA 稀疏注意力架构:通过动态筛选关键 Токен 与块级 KV 选择,替代传统全量注意力,解决长序列计算的 O(n²) 复杂度瓶颈。
  • 双版本 API: Предоставлено M3(标准版)与 M3-highspeed(高速版),输出结果完全一致,后者推理速度更快,且全面支持自动 Cache。

MiniMax M3的核心优势

  • 长上下文效率飞跃:在 1M жетоны 长度下,预填充(Prefill)速度提升 9.7 倍,解码(Decode)速度提升 15.6 倍,算力成本降至前代模型的约 1/20.
  • 顶尖编码表现:在 SWE-Bench Pro 代码能力评测中,M3 超过 GPT-5.5 与 Близнецы 3.1 Pro,接近 Opus 4.7;在 SVG-Bench 生成评测中超越 Opus 4.7。
  • 智能体评测领先:在端到端 Agent 评测框架 Claw-Eval 中获得最高分;在 BrowseComp 自主浏览与信息检索评测中以 83.5 分 超越 Opus 4.7(79.3 分)。
  • 长线程自主执行:官方实测中,M3 独立复现 ICLR 2025 杰出论文,连续运行近 12 小时,自主产出 18 次 commit 与 23 张实验图表,全程无需人工干预。

MiniMax M3官网是什么

  • МиниМакс Агент:https://agent.minimaxi.com/

MiniMax M3的操作步骤

  • 注册 MiniMax 开放平台账号:访问 MiniMax 开放平台官网 https://agent.minimaxi.com/,完成企业或个人开发者注册,获取 API Key 用于身份鉴权。
  • Выберите версию модели:根据场景选择 MiniMax-M3(标准版)或 MiniMax-M3-highspeed(高速版),两者输出质量一致,后者推理速度更快,适合对延迟敏感的生产环境。
  • 配置上下文窗口:在 API 请求中设置所需上下文长度,最高支持 1M tokens,官方保障至少 512K tokens 可用;长文档分析、代码库理解等场景建议直接拉满上限。
  • 启用自动 Cache 机制:利用 M3 全面支持的自动 Cache 功能,对重复或相似的输入内容进行缓存读取,缓存价格仅为标准输入的 1/5(0.42 元 / 百万 tokens),可显著降低长上下文调用的成本。
  • 构建 API 请求:通过 RESTful API 发送请求,支持文本、图像、视频的多模态输入;如需 Agent 能力,可在请求中配置工具调用(Function Calling)与多步推理参数。
  • 选择计费方式:按量付费模式下,上下文 ≤ 512K 的调用可享受 7 天限时五折(输入 2.1 元 / 百万 tokens,输出 8.4 元 / 百万 tokens);高频用户可订阅 Token Plan(Plus / Max / Ultra 三档),使用积分额度池统一扣减。

MiniMax M3的适用人群

  • Разработчики приложений искусственного интеллекта:利用开源权重与百万上下文进行私有化部署,构建 RAG、长文档分析与企业知识库应用。
  • инженер-программист:借助顶尖 SWE-Bench Pro 表现,进行代码生成、代码审查、Bug 修复与全栈开发辅助。
  • 科研与学术用户:长上下文支持整篇论文、实验日志与代码一次性载入,适合文献综述、论文复现与数据分析。
  • 智能体/自动化工作流构建者:多步推理、工具调用与桌面操作能力,适合构建复杂 Agent、自动化办公与端到端任务执行。
  • 多模态内容创作者:原生支持图像与视频输入,可用于视频理解、图文交叉分析、SVG 生成与视觉内容创作。

MiniMax M3的常见问题

Q:MiniMax M3 是否已开源?
A:官方宣布即将在 HuggingFace 和 GitHub 上完成开源,支持私有集群部署和微调。


Q:M3 与 M3-highspeed 有什么区别?
A:两者输出结果完全一致,M3-highspeed 速度更快,适合对延迟敏感的生产环境。


Q:1M 上下文在实际使用中是否完全可用?
A:API 最高支持 1M tokens,官方保障至少 512K tokens 可用。


Q:MSA 架构与 MLA(Multi-head Latent Attention)有何不同?
A:MSA 基于标准 GQA 主干,在真实未压缩的 KV 缓存上进行块级动态筛选;而 MLA 将键值压缩到低维潜在空间。MSA 在保留前缀缓存支持的同时避免了精度损失。
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...