Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Últimos recursos sobre IAPublicado hace 2 meses Círculo de intercambio de inteligencia artificial

23.6K 00

Step 3.5 Flash是什么

Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型，每 ficha 仅激活 110 亿参数，能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 token 预测与 3:1 混合注意力，把 256 K 长文计算量砍掉 40 %，在 AIME 2025、IMOAnswerBench、LiveCodeBench 等硬核榜单直接对标 GPT-4o，位列前三。更关键的是，生来就是 Agent 基座：函数调用、工具链、多轮长链条推理一次到位，华为昇腾、沐曦、壁仞等六大国产芯片已同步适配，可立即私有化部署，开源且商用友好。

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash的功能特色

Generación extremadamente rápida：单请求峰值 350 token/s，典型场景 100–300 token/s，实时交互无等待。
稀疏专家：1960 亿总参数、110 亿激活，MoE 架构兼顾效果与成本，推理显存降 60 %。
长窗记忆：256 K 上下文，3:1 滑动/全局混合注意力，长文档、多轮对话一次读完。
数学代码：AIME、IMO、LiveCodeBench 榜单位列前三，复杂推理与代码生成直接可用。
Agent 原生：内置函数调用、工具链、状态追踪，长链条任务自动拆解执行。
国产芯片：华为昇腾、沐曦、壁仞、燧原、天数、平头哥六家已完成适配，可私有化部署。
开源商用：Hugging Face、GitHub 同步开放，Apache-Style 许可，商业场景零门槛集成。

Step 3.5 Flash的核心优势

速度碾压：同尺寸模型首个突破 350 token/s，Agent 实时循环不卡顿。
极致能效：1960 亿总参数仅激活 110 亿，推理成本较稠密模型直降 60 %。
长文无损：256 K 上下文 + 3:1 混合注意力，长链推理准确率提升 12 %，计算反降 40 %。
硬核成绩：数学、代码、科学三大权威榜单同时杀进前三，公开模型第一。
工具即插：原生函数调用与状态机设计，零样本接入 API、数据库、UI 自动化。
全国产化：六大国产芯片首发适配，CUDA-free 也能满血运行，数据安全可控。

Step 3.5 Flash官网是什么

Repositorio GitHub：https://github.com/stepfun-ai/Step-3.5-Flash/
Biblioteca de modelos HuggingFace：https://huggingface.co/stepfun-ai/Step-3.5-Flash