Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型
Step 3.5 Flash是什么
Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型,每 жетон 仅激活 110 亿参数,能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 token 预测与 3:1 混合注意力,把 256 K 长文计算量砍掉 40 %,在 AIME 2025、IMOAnswerBench、LiveCodeBench 等硬核榜单直接对标 GPT-4o,位列前三。更关键的是,生来就是 Agent 基座:函数调用、工具链、多轮长链条推理一次到位,华为昇腾、沐曦、壁仞等六大国产芯片已同步适配,可立即私有化部署,开源且商用友好。

Step 3.5 Flash的功能特色
- Чрезвычайно быстрая генерация:单请求峰值 350 token/s,典型场景 100–300 token/s,实时交互无等待。
- 稀疏专家:1960 亿总参数、110 亿激活,MoE 架构兼顾效果与成本,推理显存降 60 %。
- 长窗记忆:256 K 上下文,3:1 滑动/全局混合注意力,长文档、多轮对话一次读完。
- 数学代码:AIME、IMO、LiveCodeBench 榜单位列前三,复杂推理与代码生成直接可用。
- Agent 原生:内置函数调用、工具链、状态追踪,长链条任务自动拆解执行。
- 国产芯片:华为昇腾、沐曦、壁仞、燧原、天数、平头哥六家已完成适配,可私有化部署。
- 开源商用:Hugging Face、GitHub 同步开放,Apache-Style 许可,商业场景零门槛集成。
Step 3.5 Flash的核心优势
- 速度碾压:同尺寸模型首个突破 350 token/s,Agent 实时循环不卡顿。
- 极致能效:1960 亿总参数仅激活 110 亿,推理成本较稠密模型直降 60 %。
- 长文无损:256 K 上下文 + 3:1 混合注意力,长链推理准确率提升 12 %,计算反降 40 %。
- 硬核成绩:数学、代码、科学三大权威榜单同时杀进前三,公开模型第一。
- 工具即插:原生函数调用与状态机设计,零样本接入 API、数据库、UI 自动化。
- 全国产化:六大国产芯片首发适配,CUDA-free 也能满血运行,数据安全可控。
Step 3.5 Flash官网是什么
- Репозиторий GitHub:https://github.com/stepfun-ai/Step-3.5-Flash/
- Библиотека моделей HuggingFace:https://huggingface.co/stepfun-ai/Step-3.5-Flash
Step 3.5 Flash的适用人群
- независимый разработчик:开源免费、可商用,零预算就能给产品加“AI 大脑”。
- 企业 IT/AI 团队:长窗记忆加工具调用,一条模型搞定报表、客服、运维多场景。
- 教育 & 科研:数学、代码、科学推理成绩前三,直接跑通自动出题、论文复现、实验脚本。
- 金融、医疗、法律等高敏行业:国产芯片适配和可私有化,数据不出内网就能用 256 K 长文大模型。
- производитель оборудования:已移植昇腾、沐曦等六大国产平台,边缘盒、一体机即插即卖。
- Agent/自动化创业者:原生函数调用与状态追踪,把“说一句话→完成一串任务”做成 SaaS。
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...




