时隔16年Jeff Barr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

阶跃星辰发布新一代基模 Step 3,国产芯推理效率最高达 DeepSeek 三倍,几天后开源!

  • 2025-07-26
    北京
  • 本文字数:2129 字

    阅读完需:约 7 分钟

大小:1.08M时长:06:17
阶跃星辰发布新一代基模Step 3,国产芯推理效率最高达DeepSeek三倍,几天后开源!

整理 | 华卫

 

WAIC 2025 开幕前夕,阶跃星辰发布了新一代基础大模型 Step 3。作为阶跃的主力基座模型,Step 3 兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。据悉,Step 3 将于 7 月 31 日面向全球企业和开发者开源。

 

“从 Step 1 到 Step 2 两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代 Step 3 基础模型的出发点。”阶跃星辰创始人、CEO 姜大昕表示。

 


成立两年多以来,阶跃星辰构建起“1+N”的 Step 系列大模型矩阵。“1”是指 Step 3 基础大模型;“N”则为 Step 系列的多模态大模型矩阵,广泛覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。本次 WAIC 期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型 Step 3o Vision,第二代端到端语音大模型 Step-Audio 2。目前,所有这些模型都可以在“阶跃 AI”官网(stepfun.com)和 “阶跃 AI” App(应用商店搜索下载)进行体验。

 

同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。

 

新一代基模 Step 3:推理时代最适合应用的模型

 

随着大模型技术迈向推理时代,阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。这四个维度缺一不可,因为单点能力强,无法满足用户对于模型的综合需求。唯有模型全面发展,才能让模型真正用起来。基于这样的研发理念,阶跃星辰打造了新一代基模 Step 3,专为追求性能与成本极致均衡的企业和开发者设计。

 

原生多模态,性能达到开源 SOTA

 

Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。

 

Step 3 拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。

 


推理效率最高达 DeepSeek 三倍

 

在确保性能的前提下,阶跃星辰持续推进模型成本优化。在推理时代,模型性能随思维链的增长而提升,解码效率因此成为降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

 

Step 3 旨在通过系统性的技术创新,实现模型降本增效的目标。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。

 

并且,这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。这些结果充分验证了 Step 3 具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

 


目前,Step 3 已授权国内多家芯片公司,并完成了芯片适配。同时,Step 3 将于 7 月 31 日正式面向全球企业和开发者开源。Step 3 已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。(Step 3 Tech report 地址:https://github.com/stepfun-ai/Step3

 

全产业链联合创新,让大模型真正用起来

 

要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新。

 

阶跃星辰宣布,将联合近 10 家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。

 


发布会还宣布了上海国有资本投资有限公司与上海阶跃星辰智能科技有限公司的深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

 

阶跃星辰战略性聚焦智能终端 Agent 的方向,重点布局汽车、手机、IoT 设备等关键应用场景,目前头部客户效应显著:已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent 体验;联合吉利推出 AI 智能座舱,成功实现行业内端到端语音大模型首次量产上车。另一方面,阶跃星辰积极拓展垂直行业的应用,与金融财经、内容创作、零售等领域的行业头部公司深度合作,共同打造面向 C 端的场景化应用体验。

 

2025-07-26 21:075656

评论

发布
暂无评论

架构师训练营 - 第八周 - 作业

韩挺

作业

不在调上

架构师第8周练习

小蚂蚁

教培行业工程师面临着什么挑战?研发面板全栈式解决工程师的痛点

Deepexi

DevOps 运维 敏捷开发 研发管理 单元测试

TNFE-Weekly[第六十六周已更新]

莹姐🙈

小程序 大前端 周报

CompletableFuture运行流程源码详解

编号94530

Java 并发编程 多线程 CompletableFuture

37岁程序员被裁,想用6月工资跪舔领导划掉被裁名额,结果蒙了!

程序员生活志

程序员 职场

如何在微服务团队中高效使用 Git 管理代码?

看山

git 微服务 高效 签约计划第二季

总结

chenzt

华青融天战略拓展总监王旭详解IT运维的九阳神功

DT极客

第八周·总结·数据结构预算法

刘璐

最新硬件虚拟化检测技术,让攻击者逃不出“楚门的世界”

百度安全

云计算 安全 虚拟化

架构师第8周学习总结

小蚂蚁

如何让你的Nginx 提升10倍性能?

老大哥

Java

Hadoop 中的 Namenode 和 Datanode

dongge

架构师训练营 - 学习总结 第 8 周

铁血杰克

区块链+国防安全,科技是核心战斗力

CECBC

链表查找算法,HDFS数据节点宕机处理

dony.zhang

缓存思想在算法设计中的应用梳理

che-ri-sh

缓存

作业二

Kiroro

各类SQL中日期时间那些事

大唐小生

sql 大数据 SQL语法

架构师课程第八周总结

dongge

week8

不在调上

AI大有可为:NAIE平台助力垃圾分类

华为云开发者联盟

AI 模型训练 垃圾回收机制 数据集 华为云

架构训练营第八周感悟

张锐

单向链表合并节点

chenzt

PC人脸识别登录,出乎意料的简单

程序员小富

Java 人脸识别

实现DevOps的三步工作法

看山

DevOps 凤凰项目 签约计划第二季

作业一

Kiroro

第八周·命题作业

刘璐

Spring系列:请问各位大佬为何要学spring?

简爱W

阶跃星辰发布新一代基模Step 3,国产芯推理效率最高达DeepSeek三倍,几天后开源!_AI&大模型_华卫_InfoQ精选文章