【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

大模型训推更高效!这款国产开源 AI 框架再迎重大升级

  • 2024-03-27
    北京
  • 本文字数:2113 字

    阅读完需:约 7 分钟

大小:1.08M时长:06:16
大模型训推更高效!这款国产开源AI框架再迎重大升级

人工智能作为我国“十四五”规划国家战略科技力量以及在数字新基建重点建设方向,前景广阔,大有作为。在今年的政府工作报告中更首次提出了开展人工智能+活动,不仅顺应了全球 AI 的发展潮流,更与中国产业升级的大趋势紧密相连,这一行动无疑将在人工智能技术在中国的各行各业的广泛应用开启新篇章。

 

人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会 2024 近日在北京国家会议中心举办,旨在汇聚 AI 产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。


人工智能作为引领未来的战略型技术,正在深刻地改变着我们的世界。人工智能技术的快速发展应用场景越来越多,走进我们的生活和企业生产系统。2023 年,自然语言处理领域中 Transformers 框架的应用和发展,让人工智能从感知理解迈向了生成创造的阶段,广泛应用于交互、创作、办公、生产等场景。

 

今年,长序列多模态的大模型技术快速,成为了大模型的标配,进一步拓宽了人工智能的应用边界,加速大模型落地更多专业领域。在人工智能发展的过程中,人工智能框架扮演着至关重要的角色,它为开发者提供了一个高效、灵活、便捷的开发平台,加速了人工智能技术的创新和应用。


昇思 MindSpore 作为国内主流开源框架,打造充满活力的开发者社区,致力于推动中国人工智能产业的进步。近两年包括昇思 MindSpore 在内的开源框架产品不断发展,IDC 的研究显示,昇思 MindSpore 在生态建设方面取得了不错的成绩。


华为在 2020 年 3 月 28 日开源昇思 MindSpore 框架,开源后获得了国内外开发者的积极响应,访问量数千万,社区核心贡献者超过 2.5 万,社区贡献比例超过 20%。


从 2020 年发布 1.0 版本到 2023 年发布 2.2 版本,版本持续快速迭代,能力也从支持端、边、云,全场景,到原生支持大模型分布式训练,到部署的全流程。并成为业界首个原生支持科学智能的人工智能融合框架,经过四年的发展,超过 687 万用户下载安装使用,服务企业数量超过 5500 家,合作高校 360 所。


同时,MindSpore 社区开源 500 多种模型,支持伙伴孵化,适配 50 多个大模型。大模型技术快速迭代演进,业界主流模型也从千亿的稠密走向万亿的稀疏模型,人工智能的框架并行计算能力、简洁的编程能力、便捷的部署能力成为大模型训练的关键成功要素。


中国工程院院士、中国人工智能学会副理事长何友在致辞中表示:中国人工智能学会与昇思 MindSpore 紧密合作,携手鹏城实验室、昇思 MindSpore 开展学术基金 2.0 项目,加速推动基于昇思的原生学术创新及论文成果发表,发挥学术人才的原生力,结合昇思的技术原创力,以学术创新支撑人工智能产业繁荣。


华为 ICT Marketing 总裁周军表示:AI 框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。昇思将持续创新探索,聚焦根技术,以更开放的技术体系,让伙伴和开发者更灵活的实现大模型创新,加速大模型应用规模落地。


2021 年图灵奖获得者、田纳西大学计算机科学杰出教授 Jack Dongarra 分享了计算和框架的发展趋势,他指出开源本质上有很多优点,能切实地为未来提供更好的软件基础,开发 MindSpore 开源框架推动了软件性能提升。

AI for Science 新范式,生成式 AI 赋能气动外形设计

中国科学院院士、中国空气动力学会理事长唐志共表示:基于昇思 MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月级缩短到分钟级,满足概念设计要求。未来该平台将扩展到航空、航天、船舶、高铁、能源、汽车等多个行业领域,引领工业装备的设计和制造能力跨越式发展。


生成式气动设计大模型平台基于昇思 AI 框架自主创新开发。模型开发阶段,昇思框架和流体力学套件 MindSpore Flow 提供全面的科学计算算法库和模型通用接口,提升模型开发效率;模型训练阶段,使用 MindSpore 多维度并行接口,基于成都智算中心算力支撑,模型和数据得以高效扩展;模型部署阶段,使用昇思大模型套件,将专业知识融入气动设计大模型平台。串联大语言模型、气动外形设计模型、气动预测模型和风雷软件等非 AI 工具,气动设计大模型平台可支撑多种气动外形设计场景。

昇思 MindSpore 2.3 全新发布,大模型开发训推更简、更稳、更高效

昇思 MindSpore 积极探索前沿技术,支撑大模型原生高效训练。通过原创的多副本、多流水交织等 8 种并行技术,使集群线性度达到 90%(业界不足 60%),通过整图优化及下沉执行等,使得算力利用率达到 55%(业界不足 40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性 CKPT 技术实现 20 分钟完成故障恢复。

 

在大模型部署上,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B 的推理部署只需 1 天。在大模型推理上,通过 LLM Serving 实现推理吞吐提升 2 倍多;升级模型压缩工具金箍棒 2.0 实现千亿大模型压缩至十倍。 


为降低开发门槛,昇思持续升级 MindSpore TransFormers 大模型套件,并提供 MindSpore One 生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发。

 

创新 AI+科学计算范式,孵化科学领域基础大模型。MindSpore 已在 AI 生物计算探索多年,联合顶级科研机构和伙伴打造了 AI 生物计算套件,包含蛋白质结构预测、生成等 20 多个 SOTA 模型,加速相关领域创新。

 

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-03-27 07:122368
用户头像
李冬梅 加V:busulishang4668

发布了 817 篇内容, 共 386.1 次阅读, 收获喜欢 1004 次。

关注

评论

发布
暂无评论

探探上当代单身青年的倔强

脑极体

几种设计模式的使用场景

Acker飏

极客大学架构师训练营

设计模式是架构师的必备武器

老姜

「架构师训练营」第 3 周作业

旭东(Frank)

极客大学架构师训练营 作业

第三周作业

赵龙

第三章 课后作业

姜 某某

环信大学:AI赋能万亿"618",0成本轻松5步开启您的智慧客服之旅

DT极客

命题作业—第三周

于江水

极客大学架构师训练营

职能合约将如何在未来掀起一场革命?

CECBC

智能合约 区块链技术 去中心化 防篡改 自动执行

学习总结—第三周

于江水

极客大学架构师训练营

架构师培训营第三周总结

王锟

第 3 周 - 学习总结

大海

架构师训练营第三周课后作业

Cloud.

第三周作业

田振宇

Apache Zeppelin:可能是开源届最好的Flink开发平台

章剑锋_Jeff

大数据 flink 流计算 Zeppelin

老板不断加需求、改需求的四种应对方法

金刚小书童

项目管理 需求管理

新基建核心技术人才缺口将达420万

CECBC

新基建 人才缺口 核心技术人才

架构师训练营——第三周作业

jiangnanage

第三周学习总结

赵龙

架构师训练营第三周课后作业

不谈

极客大学架构师训练营

关于区块链的那些事,看完可以防忽悠

CECBC

分布式 区块链技术 共识与信任

单例模式的三种

王锟

单例模式和组合模式练习

jason

KairosDB Client使用总结

二哥不再迷茫

案例篇:服务吞吐量下降很厉害,怎么分析?

程序员老王

「架构师训练营」第 3 周 学习总结

guoguo 👻

极客大学架构师训练营

第三周总结

Linuxer

百度CTO的故事中,藏着中国AI的底色

脑极体

作业 - 第三周

Happy-Coming

数据库周刊29│2020数据库研究报告;Oracle取消今年技术大会;腾讯云DBbridge发布支持一键迁库;饿了么迁至阿里云;PG数组查询;Oracle被比特币勒索;DM8 安全管理…

墨天轮

MySQL 数据库 postgresql 腾讯云 阿里云

架构师三期作业

老姜

大模型训推更高效!这款国产开源AI框架再迎重大升级_生成式 AI_李冬梅_InfoQ精选文章