Graph + AI 中国峰会火热报名中,点击探索图分析更多可能! 了解详情
写点什么

面向 CPU、GPU 和 IPU,英特尔发布重大技术架构的改变和创新

2021 年 8 月 20 日

面向CPU、GPU和IPU,英特尔发布重大技术架构的改变和创新

8 月 20 日消息,在2021年英特尔架构日上,英特尔公司高级副总裁兼加速计算系统和图形事业部总经理 Raja Koduri 连同多位英特尔架构师,介绍了面向 CPU、GPU 及 IPU 的重大技术架构改变和创新细节。



其中,英特尔第一次深入介绍了其首个性能混合架构 CPU Alder Lake,它不是简单地提供下一代更强大的 CPU 内核,而是重构了多核架构,集成了两款不同的 x86 内核(能效核和性能核)以及硬件线程调度器(在合适的时间把合适的线程分配给合适的内核),基于 Intel 7 制程工艺打造。据悉,基于 Alder Lake 的系列产品将在今年开始出货。



新的 x86 性能核(曾用代号 “Golden Cove”),是英特尔迄今为止性能最高的 CPU 内核,内置 AI 加速技术,用于学习推理和训练。与第 11 代酷睿架构(Cypress Cove 内核)相比,相同频率下,性能核在一系列工作负载上平均提升了约 19%。


而新的 x86 能效核(曾用代号“Gracemont”)为规模化处理而设计,旨在推动每瓦多核性能突破极限。对比英特尔迄今为止最多产的 CPU 微架构——Skylake,能效核在提供同样的单线程性能时,功耗仅为 Skylake 的 40%不到。与运行四个线程的两个 Skylake 内核相比,四个能效核在性能提升 80%的同时功耗更低。


值得一提的是,英特尔通过与微软合作,专门优化了新的 Alder Lake CPU 和硬件线程调度器在 Windows11 上的性能。


“在整个 Windows 11 的开发周期中,我的团队一直与英特尔同事合作,改进并优化我们即将推出的操作系统,使其充分利用‘性能混合’架构的优势,尤其是硬件线程调度器。大部分工作围绕操作系统线程调度程序展开,内核组件决定运行哪些线程在哪里运行。”微软 Windows 内核团队开发经理 Mehmet Iyigun 介绍道,除了线程调度之外,Windows 11 还利用硬件线程调度器的提示决定挂起或唤醒哪些内核,以节省电量。


在 GPU 方面,英特尔很早就与开发者和游戏引擎厂商展开合作,共同为游戏发烧友设计新的独立 GPU。本次架构日英特尔发布了全新的独立显卡微架构 Xe HPG,专为游戏和创作工作负载提供发烧级的高性能。基于 Xe HPG 的 Alchemist Soc(之前代号为 DG2)将于明年第一季度上市,并采用新的品牌名英特尔®锐炫™。


而另一个面向百亿亿次计算的 GPU——Ponte Vecchio,是英特尔至今最复杂的 SoC,基于 Xe HPC 微架构,并采用多种先进的半导体制程工艺、英特尔的 EMIB 技术以及 Foveros 3D 封装技术,包含 1000 亿个晶体管,提供业界领先的浮点运算和计算密度。英特尔官方甚至将其比喻为“堪比登月难度创新后的一款产品”。



在架构日上,英特尔表示,早期的 Ponte Vecchio 芯片展示了领先的性能,在流行的 AI 基准测试中创造了推理和训练吞吐量的行业记录。比如 A0 芯片性能提供了高于 45 TFLOPS 的 FP32 吞吐量,高于 5 TBps 的内存结构带宽,以及高于 2 TBps 的连接带宽。同时,英特尔分享了一段演示视频,展示了 ResNet 推理性能超过 43000 张图像/秒和超过每秒 3400 张图像/秒的 ResNet 训练,并且这两项性能都有望实现行业领先。


Ponte Vecchio 已走下生产线进行上电验证,并已开始向客户提供限量样品。Ponte Vecchio 预计将于 2022 年面向 HPC 和 AI 市场发布。


此外,英特尔还发布了专为数据中心设计的下一代处理器 Sapphire Rapids,它的核心是一个模块化的分区 SoC 架构,具有异构计算基础设施的架构基础,并搭配最高的计算密度和内存带宽。Sapphire Rapids 也是基于 Intel 7 制程工艺技术,并采用新的性能核微架构。


IPU 方面,英特尔与一家云服务提供商合作架构了 Mount Evans 来减轻基础设施负载。Mount Evans 也是英特尔首款专用 ASIC IPU,融合了多代 FPGA SmartNIC 的经验。


最后,英特尔还提及了oneAPI,这是英特尔在 2019 年推出的开源软件解决方案,它可以提供单一、开放和统一的编程模型,能够简化跨不同架构的开发工作。除此之外,英特尔也提供了商用部署的完整 oneAPI 堆栈,包括基本的 oneAPI 基础工具包,它在规范语言和库之外增加了编译器、分析器、调试器和移植工具。据 Raja 介绍,自从 2020 年 12 月发布第一个版本以来,超过 20 万名开发者在获得 Xe HPC 之前就已经安装了英特尔的 oneAPI 产品,市场上有超过 300 个采用 oneAPI 统一编程模型的应用软件。今年 5 月份发布的 1.1 版临时规范为深度学习工作负载和高级光线追踪库添加了新的图形接口,预计正式的 1.1 版将在年底完成。

2021 年 8 月 20 日 13:463868
用户头像
罗燕珊 InfoQ中文站编辑

发布了 153 篇内容, 共 54.1 次阅读, 收获喜欢 260 次。

关注

评论 1 条评论

发布
用户头像
AMD,Yes
2021 年 08 月 20 日 16:06
回复
没有更多了
发现更多内容

从草根到百万年薪C/C++程序员的二十年风雨之路

C语言技术网-码农有道

c++ 编程语言 C语言

断章取义,不一样的C/C++语言的学习策略

C语言技术网-码农有道

C/C++

基于大疆无人机SDK二次开发

sydMobile

android 无人机

Linux初学-01

Flychen

new[]和delete[]为何要配对使用?

helloworld

c c++ C#

Flink 作为现代数据仓库的统一引擎:Hive 集成生产就绪!

Apache Flink

大数据 flink 流计算 实时计算 大数据处理

如何消除写作过程中的痛苦,让写作变成一种享受

董一凡

写作

原创 | 类应该是匀称和均匀的

编程道与术

LeetCode 565: Array Nesting

隔壁小王

算法

游戏夜读 | 有哪几种游戏玩家?

game1night

MyBatis 3 解析mybatis-config.xml配置

杨家昌

深度解析 mybatis 初始化 XMLConfigBuilder Configuration

从2009到2020,世界编程语言排行榜分析

C语言技术网-码农有道

编程语言

IT培训机构那些不得不说的事儿

C语言技术网-码农有道

IT培训机构

我们迫切需要块状时间

Neco.W

效率 时间分配 时间管理 工作效率 提升效率

Flutter 中SharedPreferences 的初始化?

三爻

flutter android

快速开发那点事儿 | 选择最合适的轮子,量产跑车

Java_若依框架教程

敏捷开发 JAVA开发 RouYI 快速开发

DataGrip常用快捷键

fliter

企业招聘的需求决定了C/C++程序员的学习方向

C语言技术网-码农有道

C/C++

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (一)什么是单元测试

编程道与术

MyBatis 3 XML配置

杨家昌

mybatis mybatis-config.xml XML配置 配置

终端Terminal:程序员是如何查询天气预报的?

lmymirror

GitHub 工具 命令行 terminal 终端工具

新人怎么寻求解决问题的方法

波波

编程 职场 新人

LeetCode 153. Find Minimum in Rotated Sorted Array

隔壁小王

算法

1分钟理解M2M和IoT概念

老任物联网杂谈

物联网 M2M IoT

职场发展的思考

子不语

生涯规划 职业规划

源码分析shared_ptr实现

helloworld

c c++ C#

部署Hexo博客到VPS

ini

产品周刊 | 第 13 期(20200503)

Herbert

产品 设计 产品经理 产品设计

零基础、非计算机相关专业的如何转型程序员

C语言技术网-码农有道

程序员 转型

中年危机,我们如何面对?

石云升

言简意赅,聊聊RPC的123事

一叶而不知秋

RPC

面向CPU、GPU和IPU,英特尔发布重大技术架构的改变和创新-InfoQ