Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

堆友AI

Step 3.5 Flash是什么

Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型,每 ficha 仅激活 110 亿参数,能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 token 预测与 3:1 混合注意力,把 256 K 长文计算量砍掉 40 %,在 AIME 2025、IMOAnswerBench、LiveCodeBench 等硬核榜单直接对标 GPT-4o,位列前三。更关键的是,生来就是 Agent 基座:函数调用、工具链、多轮长链条推理一次到位,华为昇腾、沐曦、壁仞等六大国产芯片已同步适配,可立即私有化部署,开源且商用友好。

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash的功能特色

  • Generación extremadamente rápida:单请求峰值 350 token/s,典型场景 100–300 token/s,实时交互无等待。
  • 稀疏专家:1960 亿总参数、110 亿激活,MoE 架构兼顾效果与成本,推理显存降 60 %。
  • 长窗记忆:256 K 上下文,3:1 滑动/全局混合注意力,长文档、多轮对话一次读完。
  • 数学代码:AIME、IMO、LiveCodeBench 榜单位列前三,复杂推理与代码生成直接可用。
  • Agent 原生:内置函数调用、工具链、状态追踪,长链条任务自动拆解执行。
  • 国产芯片:华为昇腾、沐曦、壁仞、燧原、天数、平头哥六家已完成适配,可私有化部署。
  • 开源商用:Hugging Face、GitHub 同步开放,Apache-Style 许可,商业场景零门槛集成。

Step 3.5 Flash的核心优势

  • 速度碾压:同尺寸模型首个突破 350 token/s,Agent 实时循环不卡顿。
  • 极致能效:1960 亿总参数仅激活 110 亿,推理成本较稠密模型直降 60 %。
  • 长文无损:256 K 上下文 + 3:1 混合注意力,长链推理准确率提升 12 %,计算反降 40 %。
  • 硬核成绩:数学、代码、科学三大权威榜单同时杀进前三,公开模型第一。
  • 工具即插:原生函数调用与状态机设计,零样本接入 API、数据库、UI 自动化。
  • 全国产化:六大国产芯片首发适配,CUDA-free 也能满血运行,数据安全可控。

Step 3.5 Flash官网是什么

  • Repositorio GitHub:https://github.com/stepfun-ai/Step-3.5-Flash/
  • Biblioteca de modelos HuggingFace:https://huggingface.co/stepfun-ai/Step-3.5-Flash

Step 3.5 Flash的适用人群

  • desarrollador independiente:开源免费、可商用,零预算就能给产品加“AI 大脑”。
  • 企业 IT/AI 团队:长窗记忆加工具调用,一条模型搞定报表、客服、运维多场景。
  • 教育 & 科研:数学、代码、科学推理成绩前三,直接跑通自动出题、论文复现、实验脚本。
  • 金融、医疗、法律等高敏行业:国产芯片适配和可私有化,数据不出内网就能用 256 K 长文大模型。
  • proveedor de hardware:已移植昇腾、沐曦等六大国产平台,边缘盒、一体机即插即卖。
  • Agent/自动化创业者:原生函数调用与状态追踪,把“说一句话→完成一串任务”做成 SaaS。
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...