写点什么

腾讯发布超大预训练系统派大星,聚焦解决 BERT 等超大模型训练时的“GPU 内存墙”问题

  • 2021-11-02
  • 本文字数:748 字

    阅读完需:约 2 分钟

腾讯发布超大预训练系统派大星,聚焦解决BERT等超大模型训练时的“GPU内存墙”问题

近日,腾讯微信 AI 团队联合 Tencent NLP Oteam 于 GitHub 上发布开源项目派大星“PatrickStar”。该开源项目将聚焦解决 GPT、BERT 等超大模型训练时产生的“GPU 内存墙”问题,使用更为创新的异构内存管理方法,让相同配置的机器能够训练更大的模型,以更节能环保的方式让预训练模型普惠每位 NLP 社区用户。经测试结果显示,派大星性能表现优于微软 DeepSpeed,在不到 5000 元价位的个人游戏电脑上,即可训练一个 7 亿参数的 GPT 模型。



以 GPT、BERT 为代表的预训练模型(PTM)是自然语言处理(NLP)领域的核心技术,但由于 GPU 硬件的存储空间有限,PTM 的可训练规模难以突破,专业人员称之为"GPU 内存墙",同时, PTM 预训练的过程具备高耗能、高成本、高碳等弊端——往往训练一次万亿级别的预训练模型要烧掉 154 万人民币,消耗的电能制释相当于数十辆小汽车从出厂到报废的碳排放总和。


为攻克该痛点,腾讯微信 AI 团队联合 TencentNLP Oteam 从头搭建了派大星。它通过细粒度的方式管理模型数据,更有效使用了异构内存空间,进一步突破 PTM 模型规模的极限。同时,派大星的设计比同类方法占用更低内存使用,减少了 CPU 和 GPU 之间数据搬移开销,从而显著提升了计算资源的利用率。并且,派大星可以和多种并行训练方式正交使用。比如,派大星使用微软提出的零冗余优化器来实现单机多卡的数据并行。


实验结果表明,派大星将模型规模上限在目前最佳方案 DeepSpeed 的基础上提升了 1.5 倍,并且展现了明显高于 DeepSpeed 的计算效率。这将极大降低了 PTM 训练过程中的碳排放,以技术优化的方式助力低碳环保事业。


目前,派大星已参与到微信搜一搜、微信对话开放平台、小微智能音响等产品研发工作中,助力降低 GPU 卡使用数量,提升机器的利用率,减少数据中心的碳排放规模。接下来,微信 AI 团队也将持续深化开源技术的研发及应用,以创新促进行业发展及生态建设。

2021-11-02 13:364916

评论

发布
暂无评论
发现更多内容

Lazada商品评论列表的开发应用与收益

科普小能手

API API 接口 lazada商品评价接口 lazada API接口 lazada

MQ消息乱序问题解析与实战解决方案

京东科技开发者

一文全答:什么是低代码?可靠吗?贵不贵?适合谁用?

优秀

低代码 低代码平台 低代码平台应用场景

中昊芯英创始人及CEO杨龚轶凡受邀出席2024企业家博鳌论坛

科技热闻

App自动化测试的高级定位与PO设计模式

测试人

软件测试

AI招聘API:2024年国内外顶级平台的智能化解决方案

幂简集成

招聘 API AI招聘

支持Teams Phone的microsoft Office 365版本

cts喜友科技

通讯 云通讯

【GreatSQL优化器-05】条件过滤condition_fanout_filter

GreatSQL

区块链智能合约的开发流程

北京木奇移动技术有限公司

区块链开发 智能合约开发 软件外包公司 新加坡

团队管理中如何做好目标管理

易成研发中心

团队管理 目标管理

移动端设备上稀奇古怪的前端问题收集(一)

京东科技开发者

Taro 鸿蒙技术内幕系列(三) - 多语言场景下的通用事件系统设计

京东零售技术

taro 前端

1688跨境寻源通代采集运系统PHP搭建攻略,实现采购订单物流自动化

tbapi

1688跨境寻源通 1688寻源通 1688代采集运系统 1688寻源通代采系统

异构算力开源社区HAMi举办首届沙龙,将发布新版本,效能全面提升

新消费日报

DSP 的 CV 算子调用

地平线开发者

算法 自动驾驶; 算法工具链 地平线征程5

HarmonyOS 5.0应用开发——UIAbility跳转

高心星

arkui ArkTS 鸿蒙Next HarmonyOS NEXT

为什么《程序员修炼之道》评分高达 9.1?

京东科技开发者

全球首家!京东发布“立影计划”裸眼3D商品营销方案

京东零售技术

快手前端动效大揭秘:告别低效,vision平台来袭!

快手技术

前端

FastAPI 依赖管理的三种方式对比:依赖注入 vs LRU缓存 vs 全局变量

大法师

FastApi 依赖注入

食品加工、预制菜行业MES系统解决方案

万界星空科技

mes 万界星空科技mes 食品MES 食品加工 预制菜加工

腾讯发布超大预训练系统派大星,聚焦解决BERT等超大模型训练时的“GPU内存墙”问题_开源_InfoQ编辑部_InfoQ精选文章