Step 3.7 Flash - 阶跃星辰开源的 AI 模型,专为生产级 Agent 设计

최신 AI 리소스2 시간 전에 게시 됨 AI 공유 서클
507 00
堆友AI

Step 3.7 Flash是什么

Step 3.7 Flash是阶跃星辰(StepFun)开源的新一代AI模型이 프로그램의 목적은 다음과 같은 플랫폼을 제공하는 것입니다.生产级智能代理(Agent)设计。在速度、成本与复杂任务处理能力间取得平衡,支持编程、搜索和多模态工作流,并针对本地部署优化,显存需求低至5分钟即可完成安装。相比前代Step 3.5 Flash,其强化了Agent核心任务(如数学推理、工具调用)的性能,同时保持开源特性,兼容LangChain等开发框架,适合中小团队快速开发智能客服、代码助手等应用。

Step 3.7 Flash - 阶跃星辰开源的 AI 模型,专为生产级 Agent 设计

Step 3.7 Flash的功能特色

  • 稀疏 MoE 高效架构:总参数 198B(196B 语言主干 + 1.8B ViT 视觉编码器),每 토큰 仅激活约 11B 参数,在性能与推理成本之间实现高效平衡。
  • 原生多模态理解:内置 1.8B 参数 ViT 视觉编码器,可直接理解 UI 界面、图表、文档、图片及各类应用界面,将复杂视觉信息转化为结构化结果与可执行任务。
  • 超高生成速度:单请求最高可达 400 Tokens/s,适合高频、多轮、低等待的 Agent 应用场景。
  • 256K 超长上下文:支持一次性解析海量长文档、多轮对话历史及复杂工作流上下文。
  • 三档可调推理级别:提供低、中、高三种推理深度配置,开发者可按需灵活平衡速度、成本与认知深度。
  • 联网与视觉搜索增强:在信息不确定时可主动发起联网检索与图像搜索,跨文本与图像进行多源证据交叉验证。
  • 高可靠工具调用与编排:在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具及外部系统,保持任务轨迹一致,显著降低执行跑偏和失败风险。
  • Agent 生态深度兼容:已针对 Claude Code、KiloCode、RooCode、OpenCode、Hermes Agent、OpenClaw 等主流 Agent 框架,以及 MCP/Skills 等工具调用协议进行适配优化。
  • 强大代码工程能力:支持多文件仓库追踪、Bug 隔离、自动化补丁生成,在 SWE-Bench Pro 等编程基准上表现优异。
  • 多精度量化支持:提供 BF16、FP8、NVFP4、GGUF(Q4_K_S / IQ4_XS / Q3_K_L)等多种精度版本,适配不同硬件与部署场景。
  • 灵活的本地与云端部署:支持通过 vLLM、SGLang、Hugging Face Transformers、llama.cpp 等主流框架在数据中心、工作站及端侧设备(Mac Studio、DGX Station 等)上运行。
  • 视觉自主验证能力:面对复杂视觉问题时,可自主裁剪、放大、重读图像,识别信息缺失并执行查找验证后再输出结论。

Step 3.7 Flash的核心优势

  • 专为生产级 Agent 设计:不是单纯追求"更快更便宜"的轻量模型,是围绕 Agent、Coding、Search 与多模态工作流进行系统级优化,在速度、成本、可靠执行与复杂任务完成能力之间取得更优平衡。
  • 极致的速度与成本效率:稀疏 MoE 架构下每 token 仅激活约 11B 参数,单请求最高 400 Tokens/s,兼顾高性能与低推理成本,适合高频、多轮、低等待的生产环境。
  • 原生多模态 + 视觉自主验证:内置 1.8B ViT 编码器,能理解 UI、图表、文档等复杂视觉信息,能自主裁剪、放大、重读图像,在信息缺失时主动联网搜索进行交叉验证。
  • 工具调用可靠性行业领先:在考察真实环境自主任务执行的 ClawEval-1.1 上以 67.1 分显著领先次优对手(59.8 分),长程多轮工作流中抗跑偏、抗对抗陷阱能力突出。
  • Agent 生态零摩擦接入:已针对 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP/Skills 协议完成兼容适配,开发者可直接替换现有基座模型而无需重构工作流。
  • 超长上下文 + 三档可调推理:支持 256K 上下文窗口,一次性处理海量文档;提供低、中、高三档推理级别,灵活适配不同任务对速度与质量的平衡需求。

Step 3.7 Flash官网是什么

  • 프로젝트 웹사이트:https://static.stepfun.com/blog/step-3.7-flash/
  • GitHub 리포지토리:https://github.com/stepfun-ai/Step-3.7-Flash
  • 허깅페이스 모델 라이브러리:https://huggingface.co/stepfun-ai/Step-3.7-Flash

Step 3.7 Flash的操作步骤

  • API 키 가져오기:前往阶跃星辰开放平台(国内 https://platform.stepfun.com 或海外 https://platform.stepfun.ai)注册账号并创建 API Key
  • 환경 변수 구성:根据平台区域设置 STEP_API_KEY 노래로 응답 STEP_BASE_URL,国内用 https://api.stepfun.com/v1,海外用 https://api.stepfun.ai/v1
  • 选择接入方式:根据需求选择云端 API 调用或本地部署,云端适合快速接入,本地部署适合数据隐私要求高或需要离线使用的场景
  • API 快速调用(文本对话):使用 OpenAI 兼容接口,指定模型 step-3.7-flash,配置 system prompt 和 user message 即可发起对话请求
  • API 多模态调用:在 messages 中传入 image_url 类型的内容,支持传入图片 URL 或 base64 编码,实现图文混合输入

Step 3.7 Flash的适用人群

  • Agent 开发者与架构师:需要构建生产级、长程多轮工具调用工作流的开发者,尤其使用 Claude Code、KiloCode、Hermes Agent、OpenClaw 等框架的从业者
  • 软件工程师与 Coding Agent 构建者:涉及多文件仓库追踪、Bug 修复、自动化补丁生成及终端操作等代码工程任务的开发者
  • 멀티모달 애플리케이션 개발자:需要让模型理解 UI 界面、数据图表、设计稿、专业软件界面(如 Photoshop)并转化为结构化输出或可执行代码的产品团队
  • 企业知识工作者与自动化团队:需要处理海量长文档(256K 上下文)、调用 Office 工具、浏览器及外部 API 进行复杂业务流程自动化的企业用户
  • 搜索增强型应用开发者:构建需要联网检索、跨文本与图像进行多源证据交叉验证的 RAG 或 Research Agent 的开发者

Step 3.7 Flash的常见问题

Q:Step 3.7 Flash 支持的最大上下文长度是多少?
A:支持 256K 超长上下文窗口,可一次性处理海量长文档、多轮对话历史及复杂工作流上下文。

Q:Step 3.7 Flash 与前代 Step 3.5 Flash 有什么区别?
A:Step 3.7 Flash 是面向 Agent 生产化阶段的新一代模型,在原生多模态理解、联网视觉搜索、工具调用可靠性、Agent 生态兼容性等方面进行了系统性优化,而 3.5 版本更侧重于基础推理与编程能力。


Q:Step 3.7 Flash 的最高生成速度是多少?
A:单请求最高可达 400 Tokens/s,适合高频、多轮、低等待的 Agent 应用场景。


Q:模型是否支持多模态输入?
A:支持。内置 1.8B 参数 ViT 视觉编码器,原生理解 UI 界面、图表、文档、图片及各类应用界面,支持图文混合输入。


Q:Step 3.7 Flash 的推理级别可以调节吗?
A:可以。提供低、中、高三档可调推理级别,开发者可按需灵活平衡速度、成本与认知深度。

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...