写点什么

阶跃星辰彻底开源 Step 3.5 Flash:预训练 + 训练框架全放出,OpenClaw 调用量飙升至 Top 2

  • 2026-03-04
    北京
  • 本文字数:1448 字

    阅读完需:约 5 分钟

3 月 4 日消息,中国大模型创业公司阶跃星辰继开源 Step 3.5 Flash 模型后,又开源了这款 Agent 基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的 Steptron 训练框架。

 

Base 权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base

Midtrain 权重:https://huggingface.co/stepfun-ai/Step-3.5-Flash-Base-Midtrain

Steptron 训练框架:https://github.com/stepfun-ai/SteptronOss

 

Step 3.5 Flash 是阶跃星辰目前性能最强、效率最高的开源基座模型。其核心优势在于对混合专家架构(Mixture of Experts, MoE)的极致压榨。

 

  • 11B vs 196B: 该模型总参数量高达 1960 亿,但在处理每个标语(token)时,系统会根据任务属性动态、选择性地仅激活其中 110 亿 参数。

  • 智能密度(Intelligence Density): 这种稀疏架构让 Step 3.5 Flash 拥有了抗衡顶级闭源模型(如 GPT-4.5 或 Claude 4)的推理深度,同时保持了毫秒级实时交互的“轻盈感”。

 

不同于传统的聊天机器人,Step 3.5 Flash 的设计初衷是成为智能体的“大脑”。为了解决智能体在复杂推理中的性能瓶颈,阶跃星辰引入了多项前沿技术:

 

首先是 MTP-3。极速深度推理传统的模型更擅长“阅读”,而智能体需要“思考”。Step 3.5 Flash 搭载了三路多标语预测(MTP-3)技术。

 

  • 性能表现: 在典型使用场景下,生成吞吐量稳定在 100–300 tok/s。

  • 峰值体验: 在单流编程任务中,峰值可达 350 tok/s,让多步推理链的响应几乎无需等待。

其次是混合注意力机制:高效处理 256K 长上下文。针对长代码库和海量文档,模型采用了 3:1 的滑动窗口注意力(SWA)配比。

 

  • 结构优化: 每三层 SWA 层对应一层全量注意力层,大幅降低了计算开销。

  • 实测数据:SWE-bench Verified 评测中取得 74.4% 的佳绩,在 Terminal-Bench 2.0 中获得 51.0%,证明了其在长程任务中的极高稳定性。

 

此外,强大的编程与智能体引擎也是一大技术亮点。Step 3.5 Flash 专为智能体任务打造,集成了可扩展的强化学习(RL)框架,从而驱动模型持续自我进化。它在 SWE-bench Verified 测试中取得了 74.4% 的成绩,在 Terminal-Bench 2.0 中得分 51.0%,充分证明了其在处理复杂、长程任务时拥有坚如磐石的稳定性。

 

Step 3.5 Flash 针对可访问性进行了深度优化,将顶尖的智能带入本地环境。它可以在高端消费级硬件(如 Mac Studio M4 Max、NVIDIA DGX Spark 等)上安全运行。这意味着用户无需牺牲性能,即可在本地掌控数据隐私。

 

此次发布最令开发者兴奋的莫过于 Steptron 训练框架 的开源。

 

过去,开源模型往往只给结果,不给过程。阶跃星辰此次放出了从 Base 到 Midtrain 的全过程权重和框架,意味着开发者可以基于 Steptron,利用自有的私有数据,按照阶跃星辰的标准路径进行精准微调。这种“可复现性”将极大地降低企业构建垂直领域专用智能体的门槛。

 

这一举动在当前大模型开源趋于保守的环境下,显得颇为彻底,在开源社区引发热烈反响。 

 

(图:开源社区反响热烈)

 

在开发者社区和实际应用中,Step 3.5 Flash 已经迅速获得了市场验证。截至目前,这款模型在 Hugging Face 上下载量已超 30 万次,并登上 OpenRouter Trending 第一名,获得了较高的社区认可度。而在知名开源项目 OpenClaw(被中国网友称为“小龙虾”)上,该模型排名已升至前二。这些成绩反映出模型在速度、稳定性和 Agent 适配性上的真实竞争力。

 

 

(图:OpenClaw 调用量模型排名)

 

随着 OpenClaw 等 Agent 平台热度持续升温,Step 3.5 Flash 的开源或将进一步加速中国模型在全球 Agent 生态中的渗透。