Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Последние ресурсы по искусственному интеллектуОпубликовано 2 месяца назад Круг обмена ИИ

23.7K 00

Step 3.5 Flash是什么

Step 3.5 Flash 是阶跃星辰开源的 1960 亿稀疏 MoE 模型，每 жетон 仅激活 110 亿参数，能在代码任务跑出 350 token/s 的实时速度。基于自研 MTP-3 多 token 预测与 3:1 混合注意力，把 256 K 长文计算量砍掉 40 %，在 AIME 2025、IMOAnswerBench、LiveCodeBench 等硬核榜单直接对标 GPT-4o，位列前三。更关键的是，生来就是 Agent 基座：函数调用、工具链、多轮长链条推理一次到位，华为昇腾、沐曦、壁仞等六大国产芯片已同步适配，可立即私有化部署，开源且商用友好。

Step 3.5 Flash - 阶跃星辰开源的 1960 亿稀疏 MoE 模型

Step 3.5 Flash的功能特色

Чрезвычайно быстрая генерация：单请求峰值 350 token/s，典型场景 100–300 token/s，实时交互无等待。
稀疏专家：1960 亿总参数、110 亿激活，MoE 架构兼顾效果与成本，推理显存降 60 %。
长窗记忆：256 K 上下文，3:1 滑动/全局混合注意力，长文档、多轮对话一次读完。
数学代码：AIME、IMO、LiveCodeBench 榜单位列前三，复杂推理与代码生成直接可用。
Agent 原生：内置函数调用、工具链、状态追踪，长链条任务自动拆解执行。
国产芯片：华为昇腾、沐曦、壁仞、燧原、天数、平头哥六家已完成适配，可私有化部署。
开源商用：Hugging Face、GitHub 同步开放，Apache-Style 许可，商业场景零门槛集成。

Step 3.5 Flash的核心优势

速度碾压：同尺寸模型首个突破 350 token/s，Agent 实时循环不卡顿。
极致能效：1960 亿总参数仅激活 110 亿，推理成本较稠密模型直降 60 %。
长文无损：256 K 上下文 + 3:1 混合注意力，长链推理准确率提升 12 %，计算反降 40 %。
硬核成绩：数学、代码、科学三大权威榜单同时杀进前三，公开模型第一。
工具即插：原生函数调用与状态机设计，零样本接入 API、数据库、UI 自动化。
全国产化：六大国产芯片首发适配，CUDA-free 也能满血运行，数据安全可控。

Step 3.5 Flash官网是什么

Репозиторий GitHub：https://github.com/stepfun-ai/Step-3.5-Flash/
Библиотека моделей HuggingFace：https://huggingface.co/stepfun-ai/Step-3.5-Flash

Step 3.5 Flash的适用人群

независимый разработчик：开源免费、可商用，零预算就能给产品加“AI 大脑”。
企业 IT/AI 团队：长窗记忆加工具调用，一条模型搞定报表、客服、运维多场景。
教育 & 科研：数学、代码、科学推理成绩前三，直接跑通自动出题、论文复现、实验脚本。
金融、医疗、法律等高敏行业：国产芯片适配和可私有化，数据不出内网就能用 256 K 长文大模型。
производитель оборудования：已移植昇腾、沐曦等六大国产平台，边缘盒、一体机即插即卖。
Agent/自动化创业者：原生函数调用与状态追踪，把“说一句话→完成一串任务”做成 SaaS。

Последние ресурсы по искусственному интеллекту

© заявление об авторских правах

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Похожие статьи

LoopTool - 上海交大联合小红书开源的自动化工具调用数据进化框架

LoopTool - автоматизированный инструмент с открытым исходным кодом для вызова механизма эволюции данных, разработанный Шанхайским университетом Цзяотун и компанией Little Red Book.

Последние ресурсы по искусственному интеллекту

5 месяцев назад

083.1K

Whispers from the Star：米哈游开发的AI实时互动科幻故事游戏

Шепот со звезды: интерактивная научно-фантастическая игра в реальном времени с искусственным интеллектом, разработанная компанией Miha Tourism

Последние ресурсы по искусственному интеллекту Ролевая игра # AI

1 год назад

063.8K

Qwen-Agent：基于Qwen的智能代理应用框架，包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: основанный на Qwen фреймворк для приложений интеллектуальных агентов, включающий вызовы инструментов, интерпретаторы кода, RAG и расширения для Chrome.

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Система разработки интеллектуального тела

1 год назад

074.1K

ViMax - 香港大学开源的多智能体视频生成框架

ViMax - мультиинтеллектуальная система генерации видеоизображения тела с открытым исходным кодом в Гонконгском университете

Последние ресурсы по искусственному интеллекту

4 месяца назад

044.1K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

нет

Нет комментариев...