写点什么

阶跃星辰发布新一代基模 Step 3,国产芯推理效率最高达 DeepSeek 三倍,几天后开源!

  • 2025-07-26
    北京
  • 本文字数:2129 字

    阅读完需:约 7 分钟

大小:1.08M时长:06:17
阶跃星辰发布新一代基模Step 3,国产芯推理效率最高达DeepSeek三倍,几天后开源!

整理 | 华卫

 

WAIC 2025 开幕前夕,阶跃星辰发布了新一代基础大模型 Step 3。作为阶跃的主力基座模型,Step 3 兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。据悉,Step 3 将于 7 月 31 日面向全球企业和开发者开源。

 

“从 Step 1 到 Step 2 两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代 Step 3 基础模型的出发点。”阶跃星辰创始人、CEO 姜大昕表示。

 


成立两年多以来,阶跃星辰构建起“1+N”的 Step 系列大模型矩阵。“1”是指 Step 3 基础大模型;“N”则为 Step 系列的多模态大模型矩阵,广泛覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。本次 WAIC 期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型 Step 3o Vision,第二代端到端语音大模型 Step-Audio 2。目前,所有这些模型都可以在“阶跃 AI”官网(stepfun.com)和 “阶跃 AI” App(应用商店搜索下载)进行体验。

 

同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。

 

新一代基模 Step 3:推理时代最适合应用的模型

 

随着大模型技术迈向推理时代,阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。这四个维度缺一不可,因为单点能力强,无法满足用户对于模型的综合需求。唯有模型全面发展,才能让模型真正用起来。基于这样的研发理念,阶跃星辰打造了新一代基模 Step 3,专为追求性能与成本极致均衡的企业和开发者设计。

 

原生多模态,性能达到开源 SOTA

 

Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。

 

Step 3 拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。

 


推理效率最高达 DeepSeek 三倍

 

在确保性能的前提下,阶跃星辰持续推进模型成本优化。在推理时代,模型性能随思维链的增长而提升,解码效率因此成为降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

 

Step 3 旨在通过系统性的技术创新,实现模型降本增效的目标。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。

 

并且,这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。这些结果充分验证了 Step 3 具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

 


目前,Step 3 已授权国内多家芯片公司,并完成了芯片适配。同时,Step 3 将于 7 月 31 日正式面向全球企业和开发者开源。Step 3 已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。(Step 3 Tech report 地址:https://github.com/stepfun-ai/Step3

 

全产业链联合创新,让大模型真正用起来

 

要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新。

 

阶跃星辰宣布,将联合近 10 家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。

 


发布会还宣布了上海国有资本投资有限公司与上海阶跃星辰智能科技有限公司的深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

 

阶跃星辰战略性聚焦智能终端 Agent 的方向,重点布局汽车、手机、IoT 设备等关键应用场景,目前头部客户效应显著:已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent 体验;联合吉利推出 AI 智能座舱,成功实现行业内端到端语音大模型首次量产上车。另一方面,阶跃星辰积极拓展垂直行业的应用,与金融财经、内容创作、零售等领域的行业头部公司深度合作,共同打造面向 C 端的场景化应用体验。

 

2025-07-26 21:075480

评论

发布
暂无评论

极客时间架构实战营作业六

jjn0703

架构实战营

0 基础架构入门 - 6(电商系统微服务架构)

felix

架构实战营 0 基础架构入门

【KubeMeet 上海站回顾】 探索云原生应用管理与交付新解法

阿里巴巴云原生

阿里云 开源 云原生 KubeMeet

拆分电商系统为微服务

Yina🌝很浪🌊

架构实战营模块六作业 - 拆分电商系统为微服务

李焕之

第 23 章 -《Linux 一学就会》- expect - 正则表达式-sed-cut的使用

学神来啦

Linux Shell linux运维 linux云计算 linux一学就会

模块一:为何架构设计能力难以提升? --学习总结

小鹿

go-zero 实战之 blog 系统

万俊峰Kevin

golang 微服务 go-zero

2021年秋季明道云伙伴大会,邀您参与!

明道云

爱奇艺联合WSDM发起用户留存预测挑战赛

爱奇艺技术产品团队

谐云边缘计算大规模落地实践,带你见证边缘的力量!

谐云

云计算 边缘计算

零信任能力成熟度模型白皮书发布!内附下载资源

华为云开发者联盟

安全 隐私保护 华为云 网络架构 零信任

vivo AI 计算平台的 ACK 混合云实践

阿里巴巴云原生

阿里云 云原生 ACK Vivo

基于 RocketMQ 的基金数字化陪伴体系的架构实践

阿里巴巴云原生

阿里云 RocketMQ 云原生 消息队列 金融场景

电商系统微服务系统设计

Imaginary

netty系列之:netty对http2消息的封装

程序那些事

Java Netty 程序那些事 http2

1024程序员:算法&仓鼠&创业

博文视点Broadview

云图说 | 分布式缓存服务DCS—站在开源Redis前辈的肩膀上,扬帆起航

华为云开发者联盟

redis 缓存 分布式 华为云 DCS

架构实战训练营模块 6 作业

Sonichen

Python代码阅读(第44篇):寻找符合条件的元素的位置

Felix

Python 编程 Code Programing 阅读代码

架构设计六 如何设计业务的微服务架构

nydia

微服务 架构设计

Vue进阶(幺伍零):巧用 key 提升页面渲染性能及触发生命周期函数

No Silver Bullet

Vue 渲染性能 10月月更

推荐7款超实用的推特推特下载器,包括电脑和手机上使用(小伙伴们快快收藏起来)

So...

twitter 推特视频下载 推特 x x视频下载

顶会VLDB'22论文解读:多元时序预测算法METRO

华为云开发者联盟

数据库 华为云 多元时序预测算法 VLDB'22 华为云数据库创新Lab

华为在HDC2021发布全新HMS Core 6 宣布跨OS能力开放

叶落便知秋

新征程、新时势、新聚变——2021一亩地儿合作伙伴大会在京成功举办

实现服务器和客户端数据交互,Java Socket有妙招

华为云开发者联盟

socket 进程 服务器 客户端 java

1024程序员节的正确打开方式

云智慧AIOps社区

程序员 开源技术 1024我在现场 飞鱼 云智慧

收藏这36个正则表达式,开发效率提高80%

Tom弹架构

Java 正则表达式

华为首次采用数字人全程实时手语直播,并宣布全面开放手语服务能力

叶落便知秋

美团的动态线程池,不依赖中间件可以实现么?

马丁玩编程

Spring Boot ThreadPoolExecutor

阶跃星辰发布新一代基模Step 3,国产芯推理效率最高达DeepSeek三倍,几天后开源!_AI&大模型_华卫_InfoQ精选文章