NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Raja Koduri:英特尔是现在唯一可以横跨从架构到软件等六大技术领域的企业

  • 2019-10-14
  • 本文字数:3179 字

    阅读完需:约 10 分钟

Raja Koduri:英特尔是现在唯一可以横跨从架构到软件等六大技术领域的企业

我们现在正处于人工智能发展的黄金时期。过去五年,应用于人工智能的现代计算已经增长超过一百万倍,这一增长速度是过去前所未有的。无穷尽的算力增长,对于英特尔这样的公司提出了更大的挑战。


过去几十年,在摩尔定律的持续作用下,芯片算力大幅提升,驱动了互联网以及移动互联网的快速发展。如今,我们正处于数据大爆炸的时代,这不仅意味着数据量的爆发,更带来了数据形态的多样化。单纯依靠摩尔定律提高晶体管密度来大幅提升性能的做法,已经无法满足大数据、5G、AI 等新技术的计算需求,业界要更多的并行解决方案。在这一时代背景下,英特尔提出了制程和封装、架构、内存和存储、互联、安全、软件六大技术支柱,希望以此为灯塔,照亮未来数年前行的方向。


而这六大技术支柱背后的核心人物,正是芯片界大神 Raja M. Koduri。Raja 在 2017 年加入英特尔,目前担任英特尔高级副总裁、首席架构师,兼架构、图形与软件部门总经理,他不仅直接负责英特尔独立显卡项目和显卡架构 Xe 的研发工作,也是跨架构统一编程框架oneAPI的核心负责人。


近日,InfoQ 记者有幸在上海紫竹园英特尔亚太研究院见到了 Raja,并对他进行了采访。在采访中,Raja 表示,英特尔正在快速从以 PC 为中心的时代进入到以数据为中心的时代,在这一转型过程中,异构计算至关重要,且对制程和封装、架构、内存和存储、互联、安全、软件这六大技术领域都提出了相当大的挑战。在 Raja 看来,英特尔是现在唯一一家可以横跨这所有六大技术领域的企业。



英特尔高级副总裁、首席架构师,兼架构、图形与软件部门总经理 Raja M.Koduri

软硬件结合加速计算性能提升

我们现在正处于人工智能发展的黄金时期。过去五年,应用于人工智能的现代计算已经增长超过一百万倍,这一增长速度是过去前所未有的。过去,英特尔在制程技术和 CPU 方面始终保持领先,但面对更强的计算需求,以及半导体芯片行业自身发展的瓶颈,英特尔必须突破制程和 CPU 领域,向六大领域迈进,并且都做到领先。


Raja 表示:“首先,制程的重要性已经不言而喻了;而从 CPU 到 XPU 的发展,也让架构变得日益重要;随着数据的不断爆发,内存和存储可以说是现在发展的最大瓶颈;还有互连,我们希望能够实现从微米到英里的全面互连,这也是英特尔一个重要的技术蓝图之一;安全的重要性这里也不再多说,相信大家都了解到它有多么关键;最后是软件,它的重要性是其他技术领域的十倍,如果没有软件的支持,我们是无法实现计算性能的指数级增长的。”


“软件为先”是英特尔近两年新提出的技术口号,Raja 更是在多个场合不断强调“全新的硬件架构每一个数量级的性能提升,软件就能带来两个数量级的性能提升。”在采访中,Raja 也给出了几组实际数据:从 JDK8 到 JDK9,现有硬件的性能提升了 6 倍;结合内存层级架构,加上软件栈技术,借由傲腾 + 软件的方式能够将工作负载的性能提升 8 倍;利用 DL Boost 等架构扩展,从 Skylake 升级到 Cascade Lake 之后,相比上一代硬件能够提速 28 倍之多。这相当于在一次软件发布中就能实现数代硬件的性能提升。


Raja 进一步表示,通过软件和硬件的结合可以让摩尔定律的提升变成十倍。因为摩尔定律会带来更多的晶体管,而软件可以将越来越多的晶体管的极致性能释放出来。将软件和硬件结合,是英特尔接下来的战略重点,也是英特尔未来面临的非常巨大的机会。

通过 Xe 架构+统一编程框架挖掘计算潜力

带领团队开发出英特尔自己的高性能独立显卡,是 Raja 加入英特尔之后最重要的工作之一。此前,英特尔宣布将在明年六月份正式发布其高性能独立显卡,这距离英特尔着手开始研发仅仅三年。Raja 告诉 InfoQ 记者,在独立显卡研发过程当中,团队面临的最大挑战在于如何为独立显卡准备成熟的软件,这其中有大量工作要做。


集成显卡领域是英特尔的强项,研发团队已经为集成显卡开发了非常好的软件,而这些技术需要借鉴到独立显卡上,尤其是数据中心的图形卡,这是对团队的挑战。但是,Raja 对此并不担心。在他看来,在过去很长时间里,英特尔在 CPU 软件方面拥有大量的历史经验和技术积累,研发团队将充分利用这些优势并将之应用在 GPU 领域的开发上。


Xe 架构就是目前的阶段性成果之一。它是英特尔全新的 GPU 计算架构,专为高性能计算领域打造,将于 2021 年上市的英特尔首款 7 纳米产品便将是基于英特尔 Xe 架构的通用 GPU。虽然在本次访谈中 Raja 表示无法透露太多关于 Xe 架构的技术细节,但对于 Xe 架构本身,Raja 表现得相当有信心:“有关 Xe 架构和市面上现有的 GPU 架构有什么不同,这里我先卖个关子,等我们真正发布这款产品的时候,大家可以拭目以待,相信大家对我们的产品特点是非常期待的。”


Raja 仅仅向我们透露了一个有关 Xe 架构的特点,那就是其同时提供两个不同的微架构,分别针对不同的应用场景,一种应对数据中心的高性能要求,另一种应对客户端的低功耗要求。可扩展性将是 Xe 架构的核心优势,有了两种微架构的加持,Xe 架构的应用可以横跨多个计算和图形细分市场,从主流笔记本电脑和发烧友级游戏系统到数据中心的高性能计算,满足广泛的市场和工作负载需求。


此外,英特尔还提出了名为 oneAPI 的统一软件编程框架,旨在提供一个跨不同硬件架构的统一编程接口,使开发者可以随意在底层硬件之间切换和优化。oneAPI 在设计之初,就对充分发挥 Xe 架构性能做了充分考量,不管是高性能还是低功耗,都能支持 Xe 架构输出最佳性能。另外,OneAPI 的设计也符合英特尔所有其他不同计算和应用的需求。无论是 CPU、FPGA 还是加速器,OneAPI 的设计都可以和它们进行非常完整的配合。


英特尔的目标是实现最简流程,通过一个统一的软件栈、统一的 API 就可以适应从性能、功耗到成本上的不同优化需求。

进军独立显卡市场,英特尔无惧竞争对手

事实上,如果论 GPU 芯片占有率,英特尔是当之无愧的世界第一,尤其在消费领域里,每年都有超过两亿台搭载英特尔核芯显卡的新 PC 出货,除此之外超过 10 亿用户都在使用英特尔 GPU 和显卡的一系列产品,因此英特尔有着非常深厚且广泛的用户基础。在此基础之上,英特尔希望通过研发高性能独立显卡更进一步,借此进军到余下的市场,继续发掘英特尔在 PC 市场上的潜力,这是英特尔推动高性能独立显卡研发的主要原因。


既然决心向高性能独显 GPU 领域发展,那么英特尔自然避不开两个强大的竞争对手,NVIDIA 和 AMD。不过 Raja 认为,英特尔与 NVIDIA、AMD 有明显的区别,得益于在 CPU、存储、软件等领域的深厚底蕴,英特尔有能力和自信提供更加一致的用户体验。这意味着不管是在台式机、手机还是在其他设备上,都可以获得完全一致的用户体验,这可能是 NVIDIA 和 AMD 很难做到的。

六大技术支柱,软件是重中之重

面向未来五年,Raja 和英特尔的工程师们有一个大胆的工程愿景,那就是在 10 毫秒内,向世界上每个人提供每秒万万亿次浮点运算的计算能力和 10PB 数据。为此,英特尔在设计与工程模式方面进行了战略性转变。无论是 CPU 还是 GPU,无论是 oneAPI 还是 Xe 架构,都与英特尔六大技术息息相关。英特尔在传统的制程和封装领域拥有丰富的经验,但当前面临的挑战越来越多样化和复杂化。单纯依靠晶体管密度提高获得性能大幅优化的时代已经不复存在,英特尔需要找到其他更多的并行解决方案。


Raja 认为,“英特尔选择六大技术支柱作为未来发展的重要愿景,并不是因为它们中的哪个很简单,或者哪一个不重要,而是因为每一个都非常关键。在每个单独的技术领域以及支柱体系之下都有着非常复杂的问题需要解决,而英特尔也是现在唯一一家可以横跨这所有六大技术领域的企业。如果今天此时此刻一定要让我选出一个最大的挑战,我可能会说软件。因为毕竟现在我们很大一部分精力都是放在像人工智能领域,为了更好地取得突破以及进展,软件是非常重要、需要着手的地方。但是如果放眼未来的 5 年和 10 年,我要说的是,六个都非常关键,都面临很大的挑战,需要不断地创新。”


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2019-10-14 10:191904
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 495.6 次阅读, 收获喜欢 2748 次。

关注

评论

发布
暂无评论
发现更多内容

香港服务器如何帮助企业在线业务提供卓越性能和稳定性

一只扑棱蛾子

香港服务器

Triband QCN9024 work with IPQ6010-IPQ8072 - achieve higher speed bandwidth, more available channels

wifi6-yiyi

解锁Java面试中的锁:深入了解不同类型的锁和它们的用途

程序那些事

Java 面试 java面试 程序那些事 面试秘籍

向上管理:三个技巧,教会你如何与上级、老板高效协作

LigaAI

产品经理 技术管理 职场成长 向上管理 企业号9月PK榜

MySQL事务死锁问题排查 | 京东云技术团队

京东科技开发者

MySQL 数据库 事务 死锁 企业号9月PK榜

网络分析、自动化处理的强大工具

百度开发者中心

大模型训练 #人工智能 千帆大模型平台

垂直领域LLM训练推理全栈利器

百度开发者中心

#人工智能 LLM 大语言模型

专为小白打造—Kafka一篇文章从入门到入土 | 京东云技术团队

京东科技开发者

云计算 kafka 中间件 消息列队 企业号9月PK榜

DAPP代币通缩燃烧销毁质押挖矿系统开发(成熟技术)

l8l259l3365

用友出席第六届中国企业论坛,分享央国企数智化转型方案

用友BIP

数智化转型

OpenHarmony自定义构建函数:@Builder装饰器

OpenHarmony开发者

OpenHarmony

在统信UOS上部署DotNet(Core)服务

为自己带盐

国产化 UOS dotnetcore

合约跟单丨合约交易丨秒合约项目系统开发(源码案例)

西安链酷科技

合约交易所开发

代码层面探索前端性能 | 京东云技术团队

京东科技开发者

CSS 性能优化 前端 企业号9月PK榜

可观测成熟度模型介绍(二)

乘云 DataBuff

Springboot vs Quarkus

Kevin_913

数字化转型与架构-架构设计篇|软件开发框架帮我们做了什么?

数字随行

数字化转型

Comparing QCN9274 and QCN9074: WPA3 Support in Qualcomm Wi-Fi Chips

wallyslilly

QCN9074 qcn9274

线下Meetup:在数智化转型背景下,火山引擎VeDI的大数据技术揭秘

字节跳动数据平台

大数据 数据治理 数据安全 数据研发 企业号9月PK榜

大模型在超算上的应用与发展

百度开发者中心

#人工智能 LLM 大模型推理 千帆大模型平台

释放创新:与加密货币交易软件开发公司合作

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 链游开发 NFT开发

如何使用API接口获取商品数据,从申请API接口、使用API接口到实际应用,一一讲解

Noah

API 文档 API 开发

Java开发分析软件JProfiler Macv14.0.0永久激活版 附注册

晴雯哥

2023中国智能产业高峰论坛丨文档图像大模型的思考与探索

热爱编程的小白白

从索引实现上来看看你用的 TDengine 为什么这么快!

TDengine

tdengine 时序数据库 国产时序数据库

如何教会小白使用API接口获取商品数据

Noah

API 文档 API 开发

Vitess全局唯一ID生成的实现方案 | 京东云技术团队

京东科技开发者

MySQL 数据库 企业号9月PK榜 vitess

中文导航、本地指南一个App搞定,华为手机国庆出境游用Petal Maps就够了!

最新动态

JDK安装与配置教程

小齐写代码

飞桨黑客马拉松第五期即刻开启报名!

飞桨PaddlePaddle

飞桨 黑客松

大语言模型的微调与优化

百度开发者中心

#人工智能 LLM 大语言模型

Raja Koduri:英特尔是现在唯一可以横跨从架构到软件等六大技术领域的企业_文化 & 方法_蔡芳芳_InfoQ精选文章