GMTC 全球大前端技术大会 8 折涨价倒计时 2 天,现在购票立减 ¥960 ! 了解详情
写点什么

莱斯大学和英特尔的新研究:训练深度神经网络,CPU 可以比 GPU 更快

2021 年 4 月 19 日

莱斯大学和英特尔的新研究:训练深度神经网络,CPU 可以比 GPU 更快

莱斯大学(Rice University)的计算机科学家展示了一种在普通处理器上运行的人工智能软件,它训练深度神经网络的速度是基于图形处理器的平台的 15 倍。

 

莱斯大学布朗工程学院计算机科学助理教授 Anshumali Shrivastava 表示:“训练成本是人工智能的真正瓶颈,企业每星期都要花上数百万美元,仅仅是为了训练和微调他们的人工智能工作负载。”

 

Shrivastava 和来自莱斯大学与英特尔的合作者在 4 月 8 日的机器学习系统会议 MLSys 上展示了解决这一瓶颈的研究成果。

 

深度神经网络是人工智能的一种强大形式,在某些任务上超越了人类。对于深度神经网络的训练通常是一系列矩阵乘法运算,而矩阵乘法运算是图形处理单元(GPU)的理想工作负载,其成本约为通用中央处理单元(CPU)的三倍。

 

Shrivastava 说:“整个行业都集中在一项改进上:更快的矩阵乘法。所有人都在寻找专门的硬件和架构来推进矩阵乘法。如今,甚至有人说要为特定种类的深度学习提供专用的软硬件组合。与其把整个系统优化的世界都抛到昂贵的算法面前,我还不如这么说:‘让我们重新审视一下算法。’”

 

Shrivastava 的实验室在 2019 年完成了这项工作,他们将深度神经网络的训练重铸为一个搜索问题,并使用哈希表解决。他们的“次线性深度学习引擎”(sub-linear deep learning engine,SLIDE)是专门为使用普通 CPU 而设计的,由 Shrivastava 和来自英特尔的合作者在 MLSys 2020 上发布,证明了它的性能能够超越基于 GPU 的训练。

 

不久前,他们在 MLSys 2021 上发表了一项研究,探索了在现代 CPU 中使用向量化和内存优化加速器是否可以提高 SLIDE 的性能。

 

该研究报告的共同作者,莱斯大学的研究生 Shabnam Daghaghi 说:“基于哈希表的加速性能已经超越了 GPU,但 CPU 也在不断发展,”。他说,“我们利用这些创新让 SLIDE 更进一步,表明如果你不坚持矩阵乘法,你可以利用现代 CPU 的能力,训练人工智能模型的速度比最好的专业硬件替代方案快 4 到 15 倍。”

 

研究报告的作者之一、莱斯大学本科生 Nicholas Meisburger 称:“CPU 仍然是计算领域最普遍的硬件。在人工智能工作负载中,让它们更有吸引力的好处是不可低估的。”

 

原文链接:


https://techxplore.com/news/2021-04-rice-intel-optimize-ai-commodity.html

2021 年 4 月 19 日 10:11724

评论

发布
暂无评论
发现更多内容

CPU高速缓存与极性代码设计

华为云开发者社区

缓存 数据 cpu 存储

BFF (Backend for frontend)避坑指南

码猿外

架构 微服务 BFF

Mybatis association关联查询

フェイト ゼロ

python与c++区别之print

沈阳

修改OpenCV一行代码,提升14%图像匹配效果

Smile

机器学习 OpenCV Python Turtle 图像处理

容器 & 服务:Docker应用的Jenkins构建

程序员架构进阶

Docker 容器化 七日更 28天写作 2月春节不断更

设计模式之代理模式

Geek_7cf491

Java 设计模式 代理模式

Windows下JMeter分布式压测环境搭建

行者AI

Jmeter

浅谈Python中遇到extend和append,该怎么区别使用

莫陌默

Python 列表 函数

区块链溯源系统开发解决方案,区块链应用底层平台搭建

WX13823153201

区块链溯源系统开发

我与声网Agora

june

几个小实践带你快速上手MindSpore

华为云开发者社区

华为 AI mindspore 智慧终端 端边云

效率工具分享-Quicker

十天、

效率 效率工具 工具 工具软件

程序员成长第十五篇:编码的注意事项

石云升

程序员成长 28天写作 2月春节不断更

Python入门-位运算

123568

Python 入门 位运算

cobra-强大的CLI应用程序库

happlyfox

golang GitHub cli 28天写作 2月春节不断更

数据驱动业务增长的底层逻辑2.0

小飞象@木木自由

产品 数据分析 运营 业务增长

Spark Shuffle 内部机制(三)

hanke

大数据 spark 数据 开源框架

kafka consumer group

Eric

新病毒兼容M1芯片,已经感染3万台Mac

Geek_b0cff7

2019年度CMMI V2.0性能报告

渠成CMMI

产品 项目管理 性能 质量 CMMI

可能是Java Stream的最佳实践(一)

ES_her0

28天写作

windows10+python3.8.0(anaconda)+MeCab安装总结

lauqasim

Python Mecab 日文分词

华云·云场景应用详解|安超DCM给数据中心“做主”

华云数据

Elasticsearch入门,这一篇就够了

知南茶温暖

华为云PB级数据库GaussDB(for Redis)解析第二期:Redis消息队列Stream的应用探讨

华为云开发者社区

数据库

c语言简介

Geek_f510ff

c C语言

基于matlab的控制系统与仿真3-根轨迹、bode图、Nyquist图

AXYZdong

matlab 2月春节不断更

日记 2021年2月24日(周三)

Changing Lin

2月春节不断更

以AI之名 | 给千万级合同管理安上“AI”,华为商务经理工作量大解放!

华为云开发者社区

人工智能 华为 合同 商务 合同管理

带你快速了解Flutter的发展和应用

anyRTC开发者

flutter 音视频 WebRTC 跨平台 sdk

莱斯大学和英特尔的新研究:训练深度神经网络,CPU 可以比 GPU 更快-InfoQ