写点什么

阶跃星辰发布新一代基模 Step 3,国产芯推理效率最高达 DeepSeek 三倍,几天后开源!

  • 2025-07-26
    北京
  • 本文字数:2129 字

    阅读完需:约 7 分钟

大小:1.08M时长:06:17
阶跃星辰发布新一代基模Step 3,国产芯推理效率最高达DeepSeek三倍,几天后开源!

整理 | 华卫

 

WAIC 2025 开幕前夕,阶跃星辰发布了新一代基础大模型 Step 3。作为阶跃的主力基座模型,Step 3 兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。据悉,Step 3 将于 7 月 31 日面向全球企业和开发者开源。

 

“从 Step 1 到 Step 2 两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代 Step 3 基础模型的出发点。”阶跃星辰创始人、CEO 姜大昕表示。

 


成立两年多以来,阶跃星辰构建起“1+N”的 Step 系列大模型矩阵。“1”是指 Step 3 基础大模型;“N”则为 Step 系列的多模态大模型矩阵,广泛覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。本次 WAIC 期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型 Step 3o Vision,第二代端到端语音大模型 Step-Audio 2。目前,所有这些模型都可以在“阶跃 AI”官网(stepfun.com)和 “阶跃 AI” App(应用商店搜索下载)进行体验。

 

同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。

 

新一代基模 Step 3:推理时代最适合应用的模型

 

随着大模型技术迈向推理时代,阶跃星辰提出,最适合实际应用的大模型需要满足强智能、低成本、可开源和多模态四个特征。这四个维度缺一不可,因为单点能力强,无法满足用户对于模型的综合需求。唯有模型全面发展,才能让模型真正用起来。基于这样的研发理念,阶跃星辰打造了新一代基模 Step 3,专为追求性能与成本极致均衡的企业和开发者设计。

 

原生多模态,性能达到开源 SOTA

 

Step 3 是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与 Scale Up。Step 3 采用 MoE 架构,总参数量 321B,激活参数量 38B。

 

Step 3 拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3 在 MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的 SOTA 成绩。

 


推理效率最高达 DeepSeek 三倍

 

在确保性能的前提下,阶跃星辰持续推进模型成本优化。在推理时代,模型性能随思维链的增长而提升,解码效率因此成为降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

 

Step 3 旨在通过系统性的技术创新,实现模型降本增效的目标。在架构设计阶段,Step 3 便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。根据原理分析,Step 3 在国产芯片上的推理效率最高可达 DeepSeek-R1 的 300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测 Step 3 相较于 DeepSeek-R1 的吞吐量提升超 70%。

 

并且,这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。这些结果充分验证了 Step 3 具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

 


目前,Step 3 已授权国内多家芯片公司,并完成了芯片适配。同时,Step 3 将于 7 月 31 日正式面向全球企业和开发者开源。Step 3 已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。(Step 3 Tech report 地址:https://github.com/stepfun-ai/Step3

 

全产业链联合创新,让大模型真正用起来

 

要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新。

 

阶跃星辰宣布,将联合近 10 家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现 Step 3 的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行 Step 3。其它联盟厂商的适配工作正在开展。

 


发布会还宣布了上海国有资本投资有限公司与上海阶跃星辰智能科技有限公司的深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

 

阶跃星辰战略性聚焦智能终端 Agent 的方向,重点布局汽车、手机、IoT 设备等关键应用场景,目前头部客户效应显著:已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent 体验;联合吉利推出 AI 智能座舱,成功实现行业内端到端语音大模型首次量产上车。另一方面,阶跃星辰积极拓展垂直行业的应用,与金融财经、内容创作、零售等领域的行业头部公司深度合作,共同打造面向 C 端的场景化应用体验。

 

2025-07-26 21:075385

评论

发布
暂无评论

关于聚合根,领域事件的那点事---深入浅出理解DDD | 京东云技术团队

京东科技开发者

DDD 企业号 4 月 PK 榜 聚合根 领域事件

大语言模型的本质:会思考的狗、聪明的马和随机鹦鹉

FN0

AIGC 大语言模型

企业数据平台建设的基石:构建统一的数据存算能力

星环科技

存算能力

分布式存储技术(上):HDFS 与 Ceph的架构原理、特性、优缺点解析

星环科技

hdfs 分布式存储 Ceph

华为ISDP数字化现场作业,如何助力电力行业安监风险管控?

YG科技

15个值得收藏的数据可视化开源工具

2D3D前端可视化开发

数据可视化 数据可视化工具 前端数据可视化 数据可视化设计 数据可视化软件

如何在微服务下保证事务的一致性 | 京东云技术团队

京东科技开发者

架构 微服务 事务 一致性 企业号 4 月 PK 榜

分布式存储技术(下):宽表存储与全文搜索引擎的架构原理、特性、优缺点解析

星环科技

分布式 全文搜索

戴尔科技园动力计划,携手中南高科赋能中小企业数字化转型

科技热闻

电力行业信息化年会 华为解读“低碳、安全、发展”新思路

YG科技

企业如何两步实现数据资产化?

星环科技

数据资产化

字节二面:HashMap线程不安全体现在哪里?

Java你猿哥

Java 线程 ssm 架构师 HashMap底层原理

聊聊「低代码」的实践之路

Java 架构 低代码

用友iuap 让企业数智化能力深入、让业务价值浅出

用友BIP

用友 用友iuap 用友技术大会 数智底座

校企共建|阿里云与西安电子科技大学人才培养交流会顺利举行

云布道师

校企合作

SQL数据库管理:RazorSQL 激活版

真大的脸盆

Mac 数据库管理工具 Mac 软件 数据库软件

Matlab实现蚂蚁群算法

Shine

三周年征文

Python面试题

袁袁袁袁满

三周年连更

浅谈测试用例设计 | 京东云技术团队

京东科技开发者

测试 测试用例 测试用例设计 企业号 4 月 PK 榜

Databend Parser 快速入门

Databend

电信及互联网行业数据安全内控审计建设实践 | 盾见

极盾科技

数据安全

请查收!一份2023年程序员不得不看的自救提升指南(彩色终极版)

Java你猿哥

Java 面试 JVM 面经

【专栏 03】数据仓库、数据集市、数据湖,你的企业更适合哪种数据管理架构?

星环科技

数据架构

统一、飞鹤等快消龙头企业,如何抓住未来10年数智化的机遇?

用友BIP

用友iuap 用友技术大会 快消行业

硬核!阿里P8耗时6月打造的架构师速成手册,颠覆你对架构师的认知

Java你猿哥

架构 分布式 ssm 软件架构 架构师

分布式技术剖析

星环科技

分布式

企业号 5 月 PK 榜,火热开启!

InfoQ写作社区官方

热门活动 企业号 5 月 PK 榜

第十七届工程建设行业信息化发展大会成功举办,华为工单宝表现亮眼

YG科技

构建系列之webpack窥探上

江湖修行

前端 Web webpack cli 构建

MySQL8.0.32的安装与配置

Java你猿哥

Java MySQL ssm Java工程师

如何创造数据资产价值?如何对内赋能业务运营,对外创造市场价值?

星环科技

数据资产 数据要素流通

阶跃星辰发布新一代基模Step 3,国产芯推理效率最高达DeepSeek三倍,几天后开源!_AI&大模型_华卫_InfoQ精选文章