在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

下载量超 1300 万,昇思 MindSpore:AI 框架迈入“超节点时代”

  • 2025-12-26
    北京
  • 本文字数:1575 字

    阅读完需:约 5 分钟

大小:800.87K时长:04:33
下载量超1300万,昇思MindSpore:AI 框架迈入“超节点时代”

在开源五周年之际,昇思 MindSpore 社区交出了一份高速增长的成绩单:MindSpore 累积下载量已经超过 1300 万,社区核心的贡献开发者已经超过了 5.2 万人,整个代码核入量超过 12 万,拥有全球 150 多个国家和地区用户,联合超过两千多家社区孵化 3100 多个行业应用。

 

异思 MindSpore 开源社区理事长丁诚表示,在社区协作推动下,MindSpore 已逐步完善三大 AI 框架核心能力:

 

  • 在大模型领域,MindSpore 已原生支持超大规模集群并行,可覆盖数万个计算节点,支持万亿级参数规模的一站式并行策略搜索与执行优化。

  • 在部署层面,MindSpore 打通了端、边、云全场景能力:从数据中心服务器集群,到耳机、手表等小型终端设备,均可提供完整的训练与推理能力。目前,MindSpore 已应用于从服务器到数亿台终端设备的广泛场景中,成为大量智能设备的内置 AI 能力基础。

  • 在科学计算方向,MindSpore 原生支持 NumPy、SciPy 等接口加速,并通过函数式自动微分能力,帮助科研人员探索更前沿的 AI for Science 应用。

 

自社区成立理事会与技术委员会以来,MindSpore 逐步形成了清晰的定位:专注 AI 框架本身,与训练推理加速库、模型社区、评测与工具社区协同发展。目前,MindSpore 已支持超过二十五类模型,覆盖脚本开发、并行训练、效果微调到部署的全流程开箱即用能力。

 

在执行优化、自动微分、图优化与集群调优等方面,MindSpore 通过框架能力为上层生态提供更高效的执行体验。例如在大模型推理场景中,MindSpore 已实现对 vLLM 社区能力的全面对接,在一体机等关键场景下,无需修改代码即可通过编译加速获得超过 15%的性能提升。

 

昇思 MindSpore 社区技术委员会主席金雪锋表示,在深度学习早期,模型规模较小,单卡即可承载,框架的核心并行形态以数据并行为主,本质是 SPMD 并行模式,对应单机编程范式,通过动态图提升开发效率、静态图提升运行效率。

 

随着大语言模型兴起,模型规模跃迁至百亿、千亿甚至万亿级,单机无法承载,计算形态转向集群。模型并行、序列并行、专家并行等方式应运而生,但本质仍是 SPMD,并逐步形成与 Transformer 强耦合的领域特定加速编程范式。

 

金雪锋指出,全模态模型与 Agentic AI 的兴起,以及算力底座向超节点架构演进,正在推动 AI 框架迈向新的架构范式。新范式的出现,主要源自三方面挑战:模型序列长度持续增长、稀疏化加剧带来的存储压力;全模态模型结构不规则化带来的并行与优化复杂度;以及 Agentic RL 等新训推范式对多任务异构调度的要求。

 

为此,MindSpore 与超节点硬件深度协同,提出 HyperParallel 架构,将超节点视为一台超级计算机进行统一编程与调度,并引入三项关键技术:

 

  • Hyperoffload 通过计算与状态分离,将权重、激活与优化器状态卸载到外部内存池,片上内存仅作为缓存,在保证性能的前提下显著缓解存储瓶颈。实际效果显示,训练性能可提升约 20%,推理场景下可支持的序列长度提升约七成。

  • HyperMPMD 引入多维 MPMD 并行,解决计算负载不均问题。在子模型内、子模型间以及跨模态跨任务三个维度提升通算掩盖率与资源利用率,使整体集群算力利用率提升约 15%。

  • Hypershard 则提供声明式并行编程范式,实现算法与并行策略解耦,使新算法的并行化改造时间缩短至一天以内,并行调优从天级降至小时级。

 

金雪锋表示,昇思 HyperParallel 架构把超节点看成一台“超级计算机”进行编程和调度,充分发挥超节点架构优势,实现 HyperShard 声明式并行编程、HyperMPMD 异构非规则并行、HyperOffload 多级智能卸载等特性,加速 Agentic AI、全模态等新模型结构和训推范式创新。

 

据悉,超节点亲和的 HyperParallel 架构正式版本及配套的全模态与强化学习加速套件将于明年上半年发布。

 

与此同时,未来 MindSpore 社区还将在端侧智能、架构开放以及行业使能等方向持续推进,覆盖端侧大模型与 Agent 加速、核心能力模块化开放,以及面向 AI for Science 与行业迁移的工具体系建设。

2025-12-26 19:088

评论

发布
暂无评论

深度参与,亲身体验,谨慎接受

mtfelix

28天写作 必然 未来趋势 2022开年学习

Mysql探索(一):B-Tree索引

程序员历小冰

MySQL 索引 28天写作

云原生:详解|容器云平台应用解析

息之

容器安全 容器应用

新公司安排的工作做不来怎么办?是不是该离职了?

石云升

28天写作 职场经验 12月日更

云原生:详解|容器核心技术解析

息之

Docker 镜像 技术优势

Java问题排查分享

捉虫大师

Java 问题排查

反脆弱漫谈

木风

质量管理 技术管理 28天写作

Java 项目中使用 Resilience4j 框架实现隔断机制/断路器

码界行者

Java circuit break 断路器 Resilience4j 隔断机制

TypeScript 之常见类型(上)

冴羽

JavaScript typescript 翻译 大前端

浪潮云说直播间-云溪数据库之ClickHouse原理解析今晚开讲

云计算,

工业区块链与关键关联技术融合创新

CECBC

31 K8S之StatefulSet控制器

穿过生命散发芬芳

k8s 28天写作 12月日更

在AI与信息交互之间:QQ 浏览器的边界探索

脑极体

架构实战总结

Geek_fc100d

「架构实战营」

王者荣耀商城异地多活架构设计

胡颖

架构实战营

模块五作业

ks

架构实战营

继续跑步

wood

创业 跑步

毕业设计-电商秒杀系统

小智

「架构实战营」

微博系统中“微博评论”的高可用高性能架构

AHUI

「架构实战营」

模块五作业 ”微博评论“的高性能高可用计算架构

小朱

架构实战营

Python Qt GUI设计:QCalendar日历类和QDateTimeEdit时间类(基础篇—20)

不脱发的程序猿

Python qt GUI设计 QCalendar日历类 QDateTimeEdit时间类

和12岁小同志搞创客开发:手撕代码,做一款节拍电子鼓

不脱发的程序猿

少儿编程 DIY 智能硬件 创客开发 Arduino

基于云的技术架构设计实践-第0篇

hackstoic

云计算 架构 云原生 创业公司 签约计划第二季

10个问题解答火热的元宇宙概念

CECBC

Java基础系列:反射

正向成长

Java 反射

由《组织行为学》讲义想到的两个问题(1/28)

赵新龙

TGO鲲鹏会 28天写作

微服务架构细节

卢卡多多

28天写作 12月日更

[架构实战营] 模块五作业

张祥

架构实战营

模块九作业

Geek_fc100d

「架构实战营」

Android C++系列:Linux信号(三)

轻口味

c++ android 28天写作 12月日更

高层与基层思考上的差异与解决办法

光环PMO社群

项目管理

下载量超1300万,昇思MindSpore:AI 框架迈入“超节点时代”_AI&大模型_褚杏娟_InfoQ精选文章