Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型
Últimos recursos sobre IAPublicado hace 11 horas Círculo de intercambio de inteligencia artificial 1.5K 00
Step 3.5 Flash是什么
Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型,每 ficha 仅激活 110 亿参数,能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 token 预测与 3:1 混合注意力,把 256 K 长文计算量砍掉 40 %,在 AIME 2025、IMOAnswerBench、LiveCodeBench 等硬核榜单直接对标 GPT-4o,位列前三。更关键的是,生来就是 Agent 基座:函数调用、工具链、多轮长链条推理一次到位,华为昇腾、沐曦、壁仞等六大国产芯片已同步适配,可立即私有化部署,开源且商用友好。

Step 3.5 Flash的功能特色
- Generación extremadamente rápida:单请求峰值 350 token/s,典型场景 100–300 token/s,实时交互无等待。
- 稀疏专家:1960 亿总参数、110 亿激活,MoE 架构兼顾效果与成本,推理显存降 60 %。
- 长窗记忆:256 K 上下文,3:1 滑动/全局混合注意力,长文档、多轮对话一次读完。
- 数学代码:AIME、IMO、LiveCodeBench 榜单位列前三,复杂推理与代码生成直接可用。
- Agent 原生:内置函数调用、工具链、状态追踪,长链条任务自动拆解执行。
- 国产芯片:华为昇腾、沐曦、壁仞、燧原、天数、平头哥六家已完成适配,可私有化部署。
- 开源商用:Hugging Face、GitHub 同步开放,Apache-Style 许可,商业场景零门槛集成。
Step 3.5 Flash的核心优势
- 速度碾压:同尺寸模型首个突破 350 token/s,Agent 实时循环不卡顿。
- 极致能效:1960 亿总参数仅激活 110 亿,推理成本较稠密模型直降 60 %。
- 长文无损:256 K 上下文 + 3:1 混合注意力,长链推理准确率提升 12 %,计算反降 40 %。
- 硬核成绩:数学、代码、科学三大权威榜单同时杀进前三,公开模型第一。
- 工具即插:原生函数调用与状态机设计,零样本接入 API、数据库、UI 自动化。
- 全国产化:六大国产芯片首发适配,CUDA-free 也能满血运行,数据安全可控。
Step 3.5 Flash官网是什么
- Repositorio GitHub:https://github.com/stepfun-ai/Step-3.5-Flash/
- Biblioteca de modelos HuggingFace:https://huggingface.co/stepfun-ai/Step-3.5-Flash
Step 3.5 Flash的适用人群
- desarrollador independiente:开源免费、可商用,零预算就能给产品加“AI 大脑”。
- 企业 IT/AI 团队:长窗记忆加工具调用,一条模型搞定报表、客服、运维多场景。
- 教育 & 科研:数学、代码、科学推理成绩前三,直接跑通自动出题、论文复现、实验脚本。
- 金融、医疗、法律等高敏行业:国产芯片适配和可私有化,数据不出内网就能用 256 K 长文大模型。
- proveedor de hardware:已移植昇腾、沐曦等六大国产平台,边缘盒、一体机即插即卖。
- Agent/自动化创业者:原生函数调用与状态追踪,把“说一句话→完成一串任务”做成 SaaS。
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...




