【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

Raja Koduri:英特尔是现在唯一可以横跨从架构到软件等六大技术领域的企业

  • 2019-10-14
  • 本文字数:3179 字

    阅读完需:约 10 分钟

Raja Koduri:英特尔是现在唯一可以横跨从架构到软件等六大技术领域的企业

我们现在正处于人工智能发展的黄金时期。过去五年,应用于人工智能的现代计算已经增长超过一百万倍,这一增长速度是过去前所未有的。无穷尽的算力增长,对于英特尔这样的公司提出了更大的挑战。


过去几十年,在摩尔定律的持续作用下,芯片算力大幅提升,驱动了互联网以及移动互联网的快速发展。如今,我们正处于数据大爆炸的时代,这不仅意味着数据量的爆发,更带来了数据形态的多样化。单纯依靠摩尔定律提高晶体管密度来大幅提升性能的做法,已经无法满足大数据、5G、AI 等新技术的计算需求,业界要更多的并行解决方案。在这一时代背景下,英特尔提出了制程和封装、架构、内存和存储、互联、安全、软件六大技术支柱,希望以此为灯塔,照亮未来数年前行的方向。


而这六大技术支柱背后的核心人物,正是芯片界大神 Raja M. Koduri。Raja 在 2017 年加入英特尔,目前担任英特尔高级副总裁、首席架构师,兼架构、图形与软件部门总经理,他不仅直接负责英特尔独立显卡项目和显卡架构 Xe 的研发工作,也是跨架构统一编程框架oneAPI的核心负责人。


近日,InfoQ 记者有幸在上海紫竹园英特尔亚太研究院见到了 Raja,并对他进行了采访。在采访中,Raja 表示,英特尔正在快速从以 PC 为中心的时代进入到以数据为中心的时代,在这一转型过程中,异构计算至关重要,且对制程和封装、架构、内存和存储、互联、安全、软件这六大技术领域都提出了相当大的挑战。在 Raja 看来,英特尔是现在唯一一家可以横跨这所有六大技术领域的企业。



英特尔高级副总裁、首席架构师,兼架构、图形与软件部门总经理 Raja M.Koduri

软硬件结合加速计算性能提升

我们现在正处于人工智能发展的黄金时期。过去五年,应用于人工智能的现代计算已经增长超过一百万倍,这一增长速度是过去前所未有的。过去,英特尔在制程技术和 CPU 方面始终保持领先,但面对更强的计算需求,以及半导体芯片行业自身发展的瓶颈,英特尔必须突破制程和 CPU 领域,向六大领域迈进,并且都做到领先。


Raja 表示:“首先,制程的重要性已经不言而喻了;而从 CPU 到 XPU 的发展,也让架构变得日益重要;随着数据的不断爆发,内存和存储可以说是现在发展的最大瓶颈;还有互连,我们希望能够实现从微米到英里的全面互连,这也是英特尔一个重要的技术蓝图之一;安全的重要性这里也不再多说,相信大家都了解到它有多么关键;最后是软件,它的重要性是其他技术领域的十倍,如果没有软件的支持,我们是无法实现计算性能的指数级增长的。”


“软件为先”是英特尔近两年新提出的技术口号,Raja 更是在多个场合不断强调“全新的硬件架构每一个数量级的性能提升,软件就能带来两个数量级的性能提升。”在采访中,Raja 也给出了几组实际数据:从 JDK8 到 JDK9,现有硬件的性能提升了 6 倍;结合内存层级架构,加上软件栈技术,借由傲腾 + 软件的方式能够将工作负载的性能提升 8 倍;利用 DL Boost 等架构扩展,从 Skylake 升级到 Cascade Lake 之后,相比上一代硬件能够提速 28 倍之多。这相当于在一次软件发布中就能实现数代硬件的性能提升。


Raja 进一步表示,通过软件和硬件的结合可以让摩尔定律的提升变成十倍。因为摩尔定律会带来更多的晶体管,而软件可以将越来越多的晶体管的极致性能释放出来。将软件和硬件结合,是英特尔接下来的战略重点,也是英特尔未来面临的非常巨大的机会。

通过 Xe 架构+统一编程框架挖掘计算潜力

带领团队开发出英特尔自己的高性能独立显卡,是 Raja 加入英特尔之后最重要的工作之一。此前,英特尔宣布将在明年六月份正式发布其高性能独立显卡,这距离英特尔着手开始研发仅仅三年。Raja 告诉 InfoQ 记者,在独立显卡研发过程当中,团队面临的最大挑战在于如何为独立显卡准备成熟的软件,这其中有大量工作要做。


集成显卡领域是英特尔的强项,研发团队已经为集成显卡开发了非常好的软件,而这些技术需要借鉴到独立显卡上,尤其是数据中心的图形卡,这是对团队的挑战。但是,Raja 对此并不担心。在他看来,在过去很长时间里,英特尔在 CPU 软件方面拥有大量的历史经验和技术积累,研发团队将充分利用这些优势并将之应用在 GPU 领域的开发上。


Xe 架构就是目前的阶段性成果之一。它是英特尔全新的 GPU 计算架构,专为高性能计算领域打造,将于 2021 年上市的英特尔首款 7 纳米产品便将是基于英特尔 Xe 架构的通用 GPU。虽然在本次访谈中 Raja 表示无法透露太多关于 Xe 架构的技术细节,但对于 Xe 架构本身,Raja 表现得相当有信心:“有关 Xe 架构和市面上现有的 GPU 架构有什么不同,这里我先卖个关子,等我们真正发布这款产品的时候,大家可以拭目以待,相信大家对我们的产品特点是非常期待的。”


Raja 仅仅向我们透露了一个有关 Xe 架构的特点,那就是其同时提供两个不同的微架构,分别针对不同的应用场景,一种应对数据中心的高性能要求,另一种应对客户端的低功耗要求。可扩展性将是 Xe 架构的核心优势,有了两种微架构的加持,Xe 架构的应用可以横跨多个计算和图形细分市场,从主流笔记本电脑和发烧友级游戏系统到数据中心的高性能计算,满足广泛的市场和工作负载需求。


此外,英特尔还提出了名为 oneAPI 的统一软件编程框架,旨在提供一个跨不同硬件架构的统一编程接口,使开发者可以随意在底层硬件之间切换和优化。oneAPI 在设计之初,就对充分发挥 Xe 架构性能做了充分考量,不管是高性能还是低功耗,都能支持 Xe 架构输出最佳性能。另外,OneAPI 的设计也符合英特尔所有其他不同计算和应用的需求。无论是 CPU、FPGA 还是加速器,OneAPI 的设计都可以和它们进行非常完整的配合。


英特尔的目标是实现最简流程,通过一个统一的软件栈、统一的 API 就可以适应从性能、功耗到成本上的不同优化需求。

进军独立显卡市场,英特尔无惧竞争对手

事实上,如果论 GPU 芯片占有率,英特尔是当之无愧的世界第一,尤其在消费领域里,每年都有超过两亿台搭载英特尔核芯显卡的新 PC 出货,除此之外超过 10 亿用户都在使用英特尔 GPU 和显卡的一系列产品,因此英特尔有着非常深厚且广泛的用户基础。在此基础之上,英特尔希望通过研发高性能独立显卡更进一步,借此进军到余下的市场,继续发掘英特尔在 PC 市场上的潜力,这是英特尔推动高性能独立显卡研发的主要原因。


既然决心向高性能独显 GPU 领域发展,那么英特尔自然避不开两个强大的竞争对手,NVIDIA 和 AMD。不过 Raja 认为,英特尔与 NVIDIA、AMD 有明显的区别,得益于在 CPU、存储、软件等领域的深厚底蕴,英特尔有能力和自信提供更加一致的用户体验。这意味着不管是在台式机、手机还是在其他设备上,都可以获得完全一致的用户体验,这可能是 NVIDIA 和 AMD 很难做到的。

六大技术支柱,软件是重中之重

面向未来五年,Raja 和英特尔的工程师们有一个大胆的工程愿景,那就是在 10 毫秒内,向世界上每个人提供每秒万万亿次浮点运算的计算能力和 10PB 数据。为此,英特尔在设计与工程模式方面进行了战略性转变。无论是 CPU 还是 GPU,无论是 oneAPI 还是 Xe 架构,都与英特尔六大技术息息相关。英特尔在传统的制程和封装领域拥有丰富的经验,但当前面临的挑战越来越多样化和复杂化。单纯依靠晶体管密度提高获得性能大幅优化的时代已经不复存在,英特尔需要找到其他更多的并行解决方案。


Raja 认为,“英特尔选择六大技术支柱作为未来发展的重要愿景,并不是因为它们中的哪个很简单,或者哪一个不重要,而是因为每一个都非常关键。在每个单独的技术领域以及支柱体系之下都有着非常复杂的问题需要解决,而英特尔也是现在唯一一家可以横跨这所有六大技术领域的企业。如果今天此时此刻一定要让我选出一个最大的挑战,我可能会说软件。因为毕竟现在我们很大一部分精力都是放在像人工智能领域,为了更好地取得突破以及进展,软件是非常重要、需要着手的地方。但是如果放眼未来的 5 年和 10 年,我要说的是,六个都非常关键,都面临很大的挑战,需要不断地创新。”


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-10-14 10:191909
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 496.6 次阅读, 收获喜欢 2749 次。

关注

评论

发布
暂无评论
发现更多内容

未来法律科技发展现五大趋势,区块链、AI、大数据吸引资本目光

CECBC

5W1H聊开源之Who和How——谁、如何参与开源?

禅道项目管理

开源 开源文化

iOS面试残篇-辟邪剑谱

程序员 面试 编程之路 移动开发 iOS 知识体系

深度学习分类任务常用评估指标

华为云开发者联盟

机器学习 深度学习

Vue Conf关于Vite的分享给我带来的启发

前端森林

vite esm Vue 3

解密开源技术的污点

WorkPlus

安卓工控主板显示接口有哪些呢?

双赞工控

安卓主板 工控主板 ARM开发主板

使用高级视频质量工具 AVQT 评估视频 | WWDC 演讲实录

网易云信

机器学习 算法 音视频

数字人民币双层运营架构下缘何衍生出2.5层?看完才明白,原来这么重要!

CECBC

dubbo 2.7应用级服务发现踩坑小记

捉虫大师

dubbo 服务发现

阿里最新秋招面经,腾讯/美团/字节1千道Java中高级面试题

Java 编程 程序员 架构 面试

CloudQuery 使用教程之《No.2数据查询(上)》

BinTools图尔兹

sql dba 数据库管理工具 国产数据库 开发运维

网络攻防学习笔记 Day55

穿过生命散发芬芳

网络攻防 6月日更

数字化时代,为什么解决信任问题是科技公司最重要的事情?

CECBC

字节跳动三面拿offer:网络+IO+redis+JVM+GC+红黑树+数据结构

Java 编程 程序员 架构 面试

41 位 Contributor 参与,1574 个 PR,不容错过的版本更新!

SphereEx

在北鲲云超算平台上做球体落入水中的流固耦合仿真模拟记录

北鲲云

社群编码识别黑灰产攻击实践

百度Geek说

Windows 11 这项亮点功能源自英特尔Bridge技术支持

E科讯

奇亚矿机系统源码,Bzz节点分币系统搭建

多路三线RTD电阻温度采集电路设计方案

不脱发的程序猿

电路设计 硬件开发 RTD电阻 温度采集电路

存储大师班:NFS 的诞生与成长

青云技术社区

存储 分布式存储 NFS

CloudQuery 安全系列(一): Http 与 Https

BinTools图尔兹

数据库 网络安全 https 数据安全 数据库管理

数仓备机DN重建:快速修复你的数仓DN单点故障

华为云开发者联盟

数据仓库 主机 华为云 备机 DN

深入C语言中数据的存储

小写丶H

让AI发展避开“暗礁”,索信达控股推出自研区块链+联邦学习解决方案

索信达控股

区块链 金融科技 联邦学习 金融监管 风控

技术解密 |阿里云多媒体 AI 团队拿下 CVPR2021 5 冠 1 亚成绩的技术分享

阿里云视频云

阿里云 AI 计算机视觉 经验分享 CVPR

我的新书《C++服务器开发精髓》终于出版啦

张小方

c++ 网络编程 Linux服务器开发 C++后端开发 网路通信

性能利器Takin来了!首个生产环境全链路压测平台正式开源

TakinTalks稳定性社区

开源 高可用 性能测试 压力测试

透过 3.0 Preview 看 Dubbo 的云原生变革

try catch

Java 的函数式接口(必懂知识点!)

Java MySQL 程序员 面试

Raja Koduri:英特尔是现在唯一可以横跨从架构到软件等六大技术领域的企业_文化 & 方法_蔡芳芳_InfoQ精选文章