Mistral AI 近日宣布推出其最新模型 Mistral Small 3.1,并声称这是目前同等量级模型中的最佳选择。
这款新型号建立在 Mistral Small 3 的基础上,在文本性能、多模态理解以及上下文处理能力上都得到了显著提升,其上下文窗口扩展至 128k tokens。Mistral AI 官方数据显示,Small 3.1 在性能上超越了同类模型,例如 Gemma 3 和 GPT-4o Mini,同时保持了每秒 150 tokens 的推理速度。
Mistral Small 3.1 最大的亮点之一是采用了 Apache 2.0 开源许可证,这使得该模型能够被更广泛地应用和研究。
现代人工智能应用对模型能力提出了更高的要求,需要模型能够处理文本、理解多模态输入、支持多种语言以及管理长上下文,同时还要兼顾低延迟和成本效益。Mistral AI 认为,Mistral Small 3.1 是首个能够满足甚至超越领先的封闭源小型模型在上述所有维度性能的开源模型。
根据 Mistral AI 公布的性能数据,Mistral Small 3.1 在多项基准测试中均表现出色。为了确保数据可比性,Mistral AI 在可能的情况下采用了其他供应商 ранее 报告的数字,否则,则通过其通用评估工具对模型进行评估。
指令遵循性能
文本指令基准测试
以下是 Mistral Small 3.1 与其他模型的文本指令性能对比,参与对比的模型包括 Gemma 3-it (27B)、Cohere Aya-Vision (32B)、GPT-4o Mini 和 Claude-3.5 Haiku。
性能数据表格
多模态指令基准测试
以下是多模态指令基准测试结果,MM-MT-Bench 评分已缩放到 0 到 100 之间。参与对比的模型同样包括 Gemma 3-it (27B)、Cohere Aya-Vision (32B)、GPT-4o Mini 和 Claude-3.5 Haiku。
性能数据表格
多语言能力
Mistral Small 3.1 在多语言处理方面也展现出优势,与 Gemma 3-it (27B)、Cohere Aya-Vision (32B) 和 GPT-4o Mini 等模型进行了对比。
性能数据表格
长上下文处理能力
在长上下文处理方面,Mistral Small 3.1 与 Gemma 3-it (27B)、GPT-4o Mini 和 Claude-3.5 Haiku 进行了比较,以验证其在处理长文本时的性能。
性能数据表格
预训练性能
Mistral AI 还发布了 Mistral Small 3.1 的预训练基础模型。
所有预训练数据
Mistral Small 3.1 Base (24B) 与 Gemma 3-pt (27B) 进行了预训练性能的对比。
性能数据表格
应用场景
Mistral Small 3.1 被定位为一款多功能模型,旨在处理广泛的生成式 AI 任务,包括指令跟随、对话辅助、图像理解和函数调用。Mistral AI 认为,它为企业级和消费级 AI 应用都奠定了坚实的基础。
关键特性和能力
- 轻量化: Mistral Small 3.1 可以在单张 RTX 4090 显卡或配备 32GB 内存的 Mac 设备上运行。这使其非常适合设备端应用场景。
- 快速响应的对话辅助: 适用于虚拟助手和其他需要快速、准确响应的应用。
- 低延迟函数调用: 能够在自动化或代理工作流程中快速执行函数。
- 针对特定领域进行微调: Mistral Small 3.1 可以针对特定领域进行微调,从而创建精确的专业领域模型。这在法律咨询、医疗诊断和技术支持等领域尤其有用。
- 高级推理的基础: Mistral AI 表示,社区基于开源 Mistral 模型构建的能力令人印象深刻。在过去几周,已经涌现出一些基于 Mistral Small 3 构建的优秀推理模型,例如 Nous Research 的 DeepHermes 24B。为此,Mistral AI 发布了 Mistral Small 3.1 的基础模型和指令模型检查点,以进一步支持模型的下游定制。
Mistral Small 3.1 的应用场景十分广泛,涵盖需要多模态理解的企业和消费者应用,例如文档验证、诊断、设备端图像处理、质量检查的视觉检测、安全系统中的对象检测、基于图像的客户支持和通用助手等。
可用性
Mistral Small 3.1 已在 Hugging Face 网站上提供下载:Mistral Small 3.1 Base 和 Mistral Small 3.1 Instruct。对于需要私有和优化推理基础设施的企业部署,请 联系 Mistral AI。
用户还可以通过 Mistral AI 的开发者平台 La Plateforme 尝试 API 调用。该模型也已在 Google Cloud Vertex AI 上提供。Mistral Small 3.1 将在未来几周内登陆 NVIDIA NIM 和 Microsoft Azure AI Foundry。