MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

Последние ресурсы по искусственному интеллектуОпубликовано 2 месяца назад Круг обмена ИИ

37.4K 00

MiniMax M3是什么

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench Pro测试中超越GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7水平；SVG生成性能（SVG-Bench）和多模态测评（OmniDocBench）均领先同类模型。相比前代M2系列，推理延迟降低10-15倍，API定价为输入0.84-8.4元/百万tokens，支持通过Minimax Code工具直接调用。是国内首个同时具备超长上下文、多模态和开源属性的AI模型。

MiniMax M3的功能特色

Нативное мультимодальное слияние：从预训练第零步开始即进行文本、图像、视频的交错多模态训练，视觉与文本语义空间高度对齐，支持看图、看视频、操作电脑桌面等跨模态任务。
百万级超长上下文：API 最高支持 1M tokens 上下文窗口（约 70 万汉字），并保障至少 512K tokens 可用，为长程 Agent、长视频理解与大规模代码库分析提供基础设施。
智能体与编码能力：具备自主任务拆解、工具调用与多步推理能力，代码生成目标为「直接可交付」而非「能跑但需要人改」。
MSA 稀疏注意力架构：通过动态筛选关键 Токен 与块级 KV 选择，替代传统全量注意力，解决长序列计算的 O(n²) 复杂度瓶颈。
双版本 API: Предоставлено M3（标准版）与 M3-highspeed（高速版），输出结果完全一致，后者推理速度更快，且全面支持自动 Cache。

MiniMax M3的核心优势

长上下文效率飞跃：在 1M жетоны 长度下，预填充（Prefill）速度提升 9.7 倍，解码（Decode）速度提升 15.6 倍，算力成本降至前代模型的约 1/20.
顶尖编码表现：在 SWE-Bench Pro 代码能力评测中，M3 超过 GPT-5.5 与 Близнецы 3.1 Pro，接近 Opus 4.7；在 SVG-Bench 生成评测中超越 Opus 4.7。
智能体评测领先：在端到端 Agent 评测框架 Claw-Eval 中获得最高分；在 BrowseComp 自主浏览与信息检索评测中以 83.5 分 超越 Opus 4.7（79.3 分）。
长线程自主执行：官方实测中，M3 独立复现 ICLR 2025 杰出论文，连续运行近 12 小时，自主产出 18 次 commit 与 23 张实验图表，全程无需人工干预。

MiniMax M3官网是什么

МиниМакс Агент：https://agent.minimaxi.com/

MiniMax M3的操作步骤

注册 MiniMax 开放平台账号：访问 MiniMax 开放平台官网 https://agent.minimaxi.com/，完成企业或个人开发者注册，获取 API Key 用于身份鉴权。
Выберите версию модели：根据场景选择 MiniMax-M3（标准版）或 MiniMax-M3-highspeed（高速版），两者输出质量一致，后者推理速度更快，适合对延迟敏感的生产环境。
配置上下文窗口：在 API 请求中设置所需上下文长度，最高支持 1M tokens，官方保障至少 512K tokens 可用；长文档分析、代码库理解等场景建议直接拉满上限。
启用自动 Cache 机制：利用 M3 全面支持的自动 Cache 功能，对重复或相似的输入内容进行缓存读取，缓存价格仅为标准输入的 1/5（0.42 元 / 百万 tokens），可显著降低长上下文调用的成本。
构建 API 请求：通过 RESTful API 发送请求，支持文本、图像、视频的多模态输入；如需 Agent 能力，可在请求中配置工具调用（Function Calling）与多步推理参数。
选择计费方式：按量付费模式下，上下文 ≤ 512K 的调用可享受 7 天限时五折（输入 2.1 元 / 百万 tokens，输出 8.4 元 / 百万 tokens）；高频用户可订阅 Token Plan（Plus / Max / Ultra 三档），使用积分额度池统一扣减。

MiniMax M3的适用人群

Разработчики приложений искусственного интеллекта：利用开源权重与百万上下文进行私有化部署，构建 RAG、长文档分析与企业知识库应用。
инженер-программист：借助顶尖 SWE-Bench Pro 表现，进行代码生成、代码审查、Bug 修复与全栈开发辅助。
科研与学术用户：长上下文支持整篇论文、实验日志与代码一次性载入，适合文献综述、论文复现与数据分析。
智能体/自动化工作流构建者：多步推理、工具调用与桌面操作能力，适合构建复杂 Agent、自动化办公与端到端任务执行。
多模态内容创作者：原生支持图像与视频输入，可用于视频理解、图文交叉分析、SVG 生成与视觉内容创作。