Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

30.4K 00

Step 3.7 Flash是什么

Step 3.7 Flash是阶跃星辰（StepFun）开源的新一代AI模型이 프로그램의 목적은 다음과 같은 플랫폼을 제공하는 것입니다.生产级智能代理（Agent）设计。在速度、成本与复杂任务处理能力间取得平衡，支持编程、搜索和多模态工作流，并针对本地部署优化，显存需求低至5分钟即可完成安装。相比前代Step 3.5 Flash，其强化了Agent核心任务（如数学推理、工具调用）的性能，同时保持开源特性，兼容LangChain等开发框架，适合中小团队快速开发智能客服、代码助手等应用。

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash的功能特色

稀疏 MoE 高效架构：总参数 198B（196B 语言主干 + 1.8B ViT 视觉编码器），每 토큰 仅激活约 11B 参数，在性能与推理成本之间实现高效平衡。
原生多模态理解：内置 1.8B 参数 ViT 视觉编码器，可直接理解 UI 界面、图表、文档、图片及各类应用界面，将复杂视觉信息转化为结构化结果与可执行任务。
超高生成速度：单请求最高可达 400 Tokens/s，适合高频、多轮、低等待的 Agent 应用场景。
256K 超长上下文：支持一次性解析海量长文档、多轮对话历史及复杂工作流上下文。
三档可调推理级别：提供低、中、高三种推理深度配置，开发者可按需灵活平衡速度、成本与认知深度。
联网与视觉搜索增强：在信息不确定时可主动发起联网检索与图像搜索，跨文本与图像进行多源证据交叉验证。
高可靠工具调用与编排：在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具及外部系统，保持任务轨迹一致，显著降低执行跑偏和失败风险。
Agent 生态深度兼容：已针对 Claude Code、KiloCode、RooCode、OpenCode、Hermes Agent、OpenClaw 等主流 Agent 框架，以及 MCP/Skills 等工具调用协议进行适配优化。
强大代码工程能力：支持多文件仓库追踪、Bug 隔离、自动化补丁生成，在 SWE-Bench Pro 等编程基准上表现优异。
多精度量化支持：提供 BF16、FP8、NVFP4、GGUF（Q4_K_S / IQ4_XS / Q3_K_L）等多种精度版本，适配不同硬件与部署场景。
灵活的本地与云端部署：支持通过 vLLM、SGLang、Hugging Face Transformers、llama.cpp 等主流框架在数据中心、工作站及端侧设备（Mac Studio、DGX Station 等）上运行。
视觉自主验证能力：面对复杂视觉问题时，可自主裁剪、放大、重读图像，识别信息缺失并执行查找验证后再输出结论。

Step 3.7 Flash的核心优势

专为生产级 Agent 设计：不是单纯追求"更快更便宜"的轻量模型，是围绕 Agent、Coding、Search 与多模态工作流进行系统级优化，在速度、成本、可靠执行与复杂任务完成能力之间取得更优平衡。
极致的速度与成本效率：稀疏 MoE 架构下每 token 仅激活约 11B 参数，单请求最高 400 Tokens/s，兼顾高性能与低推理成本，适合高频、多轮、低等待的生产环境。
原生多模态 + 视觉自主验证：内置 1.8B ViT 编码器，能理解 UI、图表、文档等复杂视觉信息，能自主裁剪、放大、重读图像，在信息缺失时主动联网搜索进行交叉验证。
工具调用可靠性行业领先：在考察真实环境自主任务执行的 ClawEval-1.1 上以 67.1 分显著领先次优对手（59.8 分），长程多轮工作流中抗跑偏、抗对抗陷阱能力突出。
Agent 生态零摩擦接入：已针对 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP/Skills 协议完成兼容适配，开发者可直接替换现有基座模型而无需重构工作流。
超长上下文 + 三档可调推理：支持 256K 上下文窗口，一次性处理海量文档；提供低、中、高三档推理级别，灵活适配不同任务对速度与质量的平衡需求。

Step 3.7 Flash官网是什么

프로젝트 웹사이트：https://static.stepfun.com/blog/step-3.7-flash/
GitHub 리포지토리：https://github.com/stepfun-ai/Step-3.7-Flash
허깅페이스 모델 라이브러리：https://huggingface.co/stepfun-ai/Step-3.7-Flash

Step 3.7 Flash的操作步骤

API 키 가져오기：前往阶跃星辰开放平台（国内 https://platform.stepfun.com 或海外 https://platform.stepfun.ai）注册账号并创建 API Key
환경 변수 구성：根据平台区域设置 STEP_API_KEY 노래로 응답 STEP_BASE_URL，国内用 https://api.stepfun.com/v1，海外用 https://api.stepfun.ai/v1
选择接入方式：根据需求选择云端 API 调用或本地部署，云端适合快速接入，本地部署适合数据隐私要求高或需要离线使用的场景
API 快速调用（文本对话）：使用 OpenAI 兼容接口，指定模型 step-3.7-flash，配置 system prompt 和 user message 即可发起对话请求
API 多模态调用：在 messages 中传入 image_url 类型的内容，支持传入图片 URL 或 base64 编码，实现图文混合输入

Step 3.7 Flash的适用人群

Agent 开发者与架构师：需要构建生产级、长程多轮工具调用工作流的开发者，尤其使用 Claude Code、KiloCode、Hermes Agent、OpenClaw 等框架的从业者
软件工程师与 Coding Agent 构建者：涉及多文件仓库追踪、Bug 修复、自动化补丁生成及终端操作等代码工程任务的开发者
멀티모달 애플리케이션 개발자：需要让模型理解 UI 界面、数据图表、设计稿、专业软件界面（如 Photoshop）并转化为结构化输出或可执行代码的产品团队
企业知识工作者与自动化团队：需要处理海量长文档（256K 上下文）、调用 Office 工具、浏览器及外部 API 进行复杂业务流程自动化的企业用户
搜索增强型应用开发者：构建需要联网检索、跨文本与图像进行多源证据交叉验证的 RAG 或 Research Agent 的开发者

Step 3.7 Flash的常见问题

Q：Step 3.7 Flash 支持的最大上下文长度是多少？
A：支持 256K 超长上下文窗口，可一次性处理海量长文档、多轮对话历史及复杂工作流上下文。

Q：Step 3.7 Flash 与前代 Step 3.5 Flash 有什么区别？
A：Step 3.7 Flash 是面向 Agent 生产化阶段的新一代模型，在原生多模态理解、联网视觉搜索、工具调用可靠性、Agent 生态兼容性等方面进行了系统性优化，而 3.5 版本更侧重于基础推理与编程能力。

Q：Step 3.7 Flash 的最高生成速度是多少？
A：单请求最高可达 400 Tokens/s，适合高频、多轮、低等待的 Agent 应用场景。

Q：模型是否支持多模态输入？
A：支持。内置 1.8B 参数 ViT 视觉编码器，原生理解 UI 界面、图表、文档、图片及各类应用界面，支持图文混合输入。

Q：Step 3.7 Flash 的推理级别可以调节吗？
A：可以。提供低、中、高三档可调推理级别，开发者可按需灵活平衡速度、成本与认知深度。