【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

腾讯发布超大预训练系统派大星,聚焦解决 BERT 等超大模型训练时的“GPU 内存墙”问题

  • 2021-11-02
  • 本文字数:748 字

    阅读完需:约 2 分钟

腾讯发布超大预训练系统派大星,聚焦解决BERT等超大模型训练时的“GPU内存墙”问题

近日,腾讯微信 AI 团队联合 Tencent NLP Oteam 于 GitHub 上发布开源项目派大星“PatrickStar”。该开源项目将聚焦解决 GPT、BERT 等超大模型训练时产生的“GPU 内存墙”问题,使用更为创新的异构内存管理方法,让相同配置的机器能够训练更大的模型,以更节能环保的方式让预训练模型普惠每位 NLP 社区用户。经测试结果显示,派大星性能表现优于微软 DeepSpeed,在不到 5000 元价位的个人游戏电脑上,即可训练一个 7 亿参数的 GPT 模型。



以 GPT、BERT 为代表的预训练模型(PTM)是自然语言处理(NLP)领域的核心技术,但由于 GPU 硬件的存储空间有限,PTM 的可训练规模难以突破,专业人员称之为"GPU 内存墙",同时, PTM 预训练的过程具备高耗能、高成本、高碳等弊端——往往训练一次万亿级别的预训练模型要烧掉 154 万人民币,消耗的电能制释相当于数十辆小汽车从出厂到报废的碳排放总和。


为攻克该痛点,腾讯微信 AI 团队联合 TencentNLP Oteam 从头搭建了派大星。它通过细粒度的方式管理模型数据,更有效使用了异构内存空间,进一步突破 PTM 模型规模的极限。同时,派大星的设计比同类方法占用更低内存使用,减少了 CPU 和 GPU 之间数据搬移开销,从而显著提升了计算资源的利用率。并且,派大星可以和多种并行训练方式正交使用。比如,派大星使用微软提出的零冗余优化器来实现单机多卡的数据并行。


实验结果表明,派大星将模型规模上限在目前最佳方案 DeepSpeed 的基础上提升了 1.5 倍,并且展现了明显高于 DeepSpeed 的计算效率。这将极大降低了 PTM 训练过程中的碳排放,以技术优化的方式助力低碳环保事业。


目前,派大星已参与到微信搜一搜、微信对话开放平台、小微智能音响等产品研发工作中,助力降低 GPU 卡使用数量,提升机器的利用率,减少数据中心的碳排放规模。接下来,微信 AI 团队也将持续深化开源技术的研发及应用,以创新促进行业发展及生态建设。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-11-02 13:363965

评论

发布
暂无评论
发现更多内容

【架构师week01】作业

高程

架构师 作业

架构师训练营第1周作业

一叶知秋

架构师0期第一周总结

Nan Jiang

架构师训练营Week 01 学习总结

Just顾

就餐卡系统设计文档 【第一周】

mylove321

信息的表示与存储-浮点数的表示

引花眠

计算机基础

《架构师训练营》第一周学习总结

架构师训练营第1周-食堂就餐卡系统设计

海滨

极客大学架构师训练营

【架构师week01】总结

高程

总结 架构师

食堂就餐卡系统设计

漫步跑小鸡

架构师-Week1作业

龙7

极客大学架构师训练营

架构homework1-2

蜡笔小晗

架构师如何进行软件架构设计学习总结

一点点..

作业一:食堂就餐卡系统设计

亮灯

架构方法 - 架构师如何做架构总结(1)

Paula_l

「架构师训练营」第一周总结

极客

训练营第一周学习总结

毛叫

极客时间 极客大学架构师训练营

就餐系统架构设计

草原上的奔跑

极客大学架构师训练营

架构师-悟性和技能

yupi

食堂就餐卡系统设计

走过路过飞过

【第一周】食堂就餐卡架构设计

星星

作业二:根据当周学习情况,完成一篇学习总结

飞翔的风

第一周作业(2)

佳明

架构师训练营学习总结

weijin

架构师训练营 第一周 作业

极客大学架构师训练营

把生活找回来

zhoo299

随笔杂谈

架构师训练营第一周学习总结

跨域刀

极客大学架构师训练营

week01-就餐卡系统架构设计

强哥

极客大学架构师训练营

架构师训练营第一周学习总结

JUN

架构师训练营week01-食堂就餐卡系统设计

Just顾

ARTS打卡 第3周

引花眠

ARTS 打卡计划

腾讯发布超大预训练系统派大星,聚焦解决BERT等超大模型训练时的“GPU内存墙”问题_开源_InfoQ编辑部_InfoQ精选文章