NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

大模型训推更高效!这款国产开源 AI 框架再迎重大升级

  • 2024-03-27
    北京
  • 本文字数:2113 字

    阅读完需:约 7 分钟

大小:1.08M时长:06:16
大模型训推更高效!这款国产开源AI框架再迎重大升级

人工智能作为我国“十四五”规划国家战略科技力量以及在数字新基建重点建设方向,前景广阔,大有作为。在今年的政府工作报告中更首次提出了开展人工智能+活动,不仅顺应了全球 AI 的发展潮流,更与中国产业升级的大趋势紧密相连,这一行动无疑将在人工智能技术在中国的各行各业的广泛应用开启新篇章。

 

人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会 2024 近日在北京国家会议中心举办,旨在汇聚 AI 产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。


人工智能作为引领未来的战略型技术,正在深刻地改变着我们的世界。人工智能技术的快速发展应用场景越来越多,走进我们的生活和企业生产系统。2023 年,自然语言处理领域中 Transformers 框架的应用和发展,让人工智能从感知理解迈向了生成创造的阶段,广泛应用于交互、创作、办公、生产等场景。

 

今年,长序列多模态的大模型技术快速,成为了大模型的标配,进一步拓宽了人工智能的应用边界,加速大模型落地更多专业领域。在人工智能发展的过程中,人工智能框架扮演着至关重要的角色,它为开发者提供了一个高效、灵活、便捷的开发平台,加速了人工智能技术的创新和应用。


昇思 MindSpore 作为国内主流开源框架,打造充满活力的开发者社区,致力于推动中国人工智能产业的进步。近两年包括昇思 MindSpore 在内的开源框架产品不断发展,IDC 的研究显示,昇思 MindSpore 在生态建设方面取得了不错的成绩。


华为在 2020 年 3 月 28 日开源昇思 MindSpore 框架,开源后获得了国内外开发者的积极响应,访问量数千万,社区核心贡献者超过 2.5 万,社区贡献比例超过 20%。


从 2020 年发布 1.0 版本到 2023 年发布 2.2 版本,版本持续快速迭代,能力也从支持端、边、云,全场景,到原生支持大模型分布式训练,到部署的全流程。并成为业界首个原生支持科学智能的人工智能融合框架,经过四年的发展,超过 687 万用户下载安装使用,服务企业数量超过 5500 家,合作高校 360 所。


同时,MindSpore 社区开源 500 多种模型,支持伙伴孵化,适配 50 多个大模型。大模型技术快速迭代演进,业界主流模型也从千亿的稠密走向万亿的稀疏模型,人工智能的框架并行计算能力、简洁的编程能力、便捷的部署能力成为大模型训练的关键成功要素。


中国工程院院士、中国人工智能学会副理事长何友在致辞中表示:中国人工智能学会与昇思 MindSpore 紧密合作,携手鹏城实验室、昇思 MindSpore 开展学术基金 2.0 项目,加速推动基于昇思的原生学术创新及论文成果发表,发挥学术人才的原生力,结合昇思的技术原创力,以学术创新支撑人工智能产业繁荣。


华为 ICT Marketing 总裁周军表示:AI 框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。昇思将持续创新探索,聚焦根技术,以更开放的技术体系,让伙伴和开发者更灵活的实现大模型创新,加速大模型应用规模落地。


2021 年图灵奖获得者、田纳西大学计算机科学杰出教授 Jack Dongarra 分享了计算和框架的发展趋势,他指出开源本质上有很多优点,能切实地为未来提供更好的软件基础,开发 MindSpore 开源框架推动了软件性能提升。

AI for Science 新范式,生成式 AI 赋能气动外形设计

中国科学院院士、中国空气动力学会理事长唐志共表示:基于昇思 MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月级缩短到分钟级,满足概念设计要求。未来该平台将扩展到航空、航天、船舶、高铁、能源、汽车等多个行业领域,引领工业装备的设计和制造能力跨越式发展。


生成式气动设计大模型平台基于昇思 AI 框架自主创新开发。模型开发阶段,昇思框架和流体力学套件 MindSpore Flow 提供全面的科学计算算法库和模型通用接口,提升模型开发效率;模型训练阶段,使用 MindSpore 多维度并行接口,基于成都智算中心算力支撑,模型和数据得以高效扩展;模型部署阶段,使用昇思大模型套件,将专业知识融入气动设计大模型平台。串联大语言模型、气动外形设计模型、气动预测模型和风雷软件等非 AI 工具,气动设计大模型平台可支撑多种气动外形设计场景。

昇思 MindSpore 2.3 全新发布,大模型开发训推更简、更稳、更高效

昇思 MindSpore 积极探索前沿技术,支撑大模型原生高效训练。通过原创的多副本、多流水交织等 8 种并行技术,使集群线性度达到 90%(业界不足 60%),通过整图优化及下沉执行等,使得算力利用率达到 55%(业界不足 40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性 CKPT 技术实现 20 分钟完成故障恢复。

 

在大模型部署上,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B 的推理部署只需 1 天。在大模型推理上,通过 LLM Serving 实现推理吞吐提升 2 倍多;升级模型压缩工具金箍棒 2.0 实现千亿大模型压缩至十倍。 


为降低开发门槛,昇思持续升级 MindSpore TransFormers 大模型套件,并提供 MindSpore One 生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发。

 

创新 AI+科学计算范式,孵化科学领域基础大模型。MindSpore 已在 AI 生物计算探索多年,联合顶级科研机构和伙伴打造了 AI 生物计算套件,包含蛋白质结构预测、生成等 20 多个 SOTA 模型,加速相关领域创新。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-03-27 07:122355
用户头像
李冬梅 加V:busulishang4668

发布了 814 篇内容, 共 381.9 次阅读, 收获喜欢 1002 次。

关注

评论

发布
暂无评论

亮点抢先看|StarRocks Summit Asia 2022 全议程公布!

StarRocks

数据库

系统实战-逻辑多租服务的高并发调优

三叶草

性能优化 高性能,

【C语言深度剖析】你真的懂C语言中的位操作符吗?

Albert Edison

C语言 9月月更 位移操作符 按位与 按位或

Qt|图片旋转缩放操作

中国好公民st

c++ qt 9月月更

挑战30天学完Python:Day2 夯实基础-变量和内置函数

MegaQi

9月月更 挑战30天学完Python

聚簇索引与覆盖索引

急需上岸的小谢

9月月更

低代码探索:Java模板引擎技术

程序员架构进阶

低代码 9月日更 模板引擎 技术探索

一站式数字藏品收款系统开发解决方案

开源直播系统源码

NFT 元宇宙 数字藏品 数字藏品系统

双“简”合璧:极简 Kubernetes 上使用极简服务网格

Flomesh

Service Mesh 服务网格

基于 iframe 的微前端框架 —— 擎天

vivo互联网技术

前端框架 微前端 项目管理工具 iframe

【JS】DOM键盘事件--div元素-设置键盘事件--失效的额外处理踩坑

Sam9029

JavaScript DOM 9月月更 键盘事件

C++学习------csetjmp头文件的源码学习

桑榆

c++ 源码阅读 9月月更

车载生态安全怎样靠小程序技术运转

Geek_99967b

小程序 车联网

单链表头插法,尾插法,循环链表,(线性表单链表)

IC00

c 链表 数据结构, 9月月更

【计算机网络原理】第三章 传输层

前端小刘不怕牛牛

TCP 计算机网络 HTTP 9月月更

Elasticsearch聚合学习之二:区间聚合

程序员欣宸

elasticsearch 9月月更

[MyBatisPlus]标准数据层开发(CRUD、分页)

十八岁讨厌编程

Java 后端开发 9月月更

【vue3】vue3-组合式API中实现深拷贝

Sam9029

Vue 深拷贝 9月月更

【精通内核】Linux内核seq(顺序)锁实现原理与源码解析

小明Java问道之路

源码 内核 Linux内核 9月月更 seq锁

编排流程/规则,编排本身也需要很深的逻辑思考!

waitmoon

规则引擎使用 规则引擎 流程引擎 可视化开发

做SaaS产品会遇到哪些坑?

PingCode

关于CMDB建设思路的一点思考

穿过生命散发芬芳

CMDB 9月月更

2022-09-13:给你两个整数 m 和 n ,分别表示一块矩形木块的高和宽。 同时给你一个二维整数数组 prices ,其中 prices[i] = [hi, wi, pricei] 表示你可以

福大大架构师每日一题

算法 rust 福大大

【精通内核】Linux内核读锁实现原理与源码解析

小明Java问道之路

源码 读写锁 内核 Linux内核 9月月更

Java进阶(十八)Java实现定时器(Timer)

No Silver Bullet

Java 定时器 9月月更

[SpringBoot系列]基础过渡与夯实(基础配置)

十八岁讨厌编程

Java 后端开发 9月月更

数据治理(十六):Ranger管理HDFS安全

Lansonli

数据治理 9月月更

企业要如何建立适合自己的PMF?

PingCode

ChatOps新型运维协作介绍

阿泽🧸

ChatOps 9月月更

[Go WebSocket] 多房间的聊天室(五)用多个小锁代替大锁,提高效率

HullQin

Go golang 后端 websocket 9月月更

Java进阶(十七)ArrayList与LinkedList的区别

No Silver Bullet

Java ArrayList linkedlist 9月月更

大模型训推更高效!这款国产开源AI框架再迎重大升级_生成式 AI_李冬梅_InfoQ精选文章