【专题推荐】AI大模型落地的前景和痛点,技术人面临哪些机会和挑战? 了解详情
写点什么

面向 CPU、GPU 和 IPU,英特尔发布重大技术架构的改变和创新

  • 2021-08-20
  • 本文字数:1692 字

    阅读完需:约 6 分钟

面向CPU、GPU和IPU,英特尔发布重大技术架构的改变和创新

8 月 20 日消息,在2021年英特尔架构日上,英特尔公司高级副总裁兼加速计算系统和图形事业部总经理 Raja Koduri 连同多位英特尔架构师,介绍了面向 CPU、GPU 及 IPU 的重大技术架构改变和创新细节。



其中,英特尔第一次深入介绍了其首个性能混合架构 CPU Alder Lake,它不是简单地提供下一代更强大的 CPU 内核,而是重构了多核架构,集成了两款不同的 x86 内核(能效核和性能核)以及硬件线程调度器(在合适的时间把合适的线程分配给合适的内核),基于 Intel 7 制程工艺打造。据悉,基于 Alder Lake 的系列产品将在今年开始出货。



新的 x86 性能核(曾用代号 “Golden Cove”),是英特尔迄今为止性能最高的 CPU 内核,内置 AI 加速技术,用于学习推理和训练。与第 11 代酷睿架构(Cypress Cove 内核)相比,相同频率下,性能核在一系列工作负载上平均提升了约 19%。


而新的 x86 能效核(曾用代号“Gracemont”)为规模化处理而设计,旨在推动每瓦多核性能突破极限。对比英特尔迄今为止最多产的 CPU 微架构——Skylake,能效核在提供同样的单线程性能时,功耗仅为 Skylake 的 40%不到。与运行四个线程的两个 Skylake 内核相比,四个能效核在性能提升 80%的同时功耗更低。


值得一提的是,英特尔通过与微软合作,专门优化了新的 Alder Lake CPU 和硬件线程调度器在 Windows11 上的性能。


“在整个 Windows 11 的开发周期中,我的团队一直与英特尔同事合作,改进并优化我们即将推出的操作系统,使其充分利用‘性能混合’架构的优势,尤其是硬件线程调度器。大部分工作围绕操作系统线程调度程序展开,内核组件决定运行哪些线程在哪里运行。”微软 Windows 内核团队开发经理 Mehmet Iyigun 介绍道,除了线程调度之外,Windows 11 还利用硬件线程调度器的提示决定挂起或唤醒哪些内核,以节省电量。


在 GPU 方面,英特尔很早就与开发者和游戏引擎厂商展开合作,共同为游戏发烧友设计新的独立 GPU。本次架构日英特尔发布了全新的独立显卡微架构 Xe HPG,专为游戏和创作工作负载提供发烧级的高性能。基于 Xe HPG 的 Alchemist Soc(之前代号为 DG2)将于明年第一季度上市,并采用新的品牌名英特尔®锐炫™。


而另一个面向百亿亿次计算的 GPU——Ponte Vecchio,是英特尔至今最复杂的 SoC,基于 Xe HPC 微架构,并采用多种先进的半导体制程工艺、英特尔的 EMIB 技术以及 Foveros 3D 封装技术,包含 1000 亿个晶体管,提供业界领先的浮点运算和计算密度。英特尔官方甚至将其比喻为“堪比登月难度创新后的一款产品”。



在架构日上,英特尔表示,早期的 Ponte Vecchio 芯片展示了领先的性能,在流行的 AI 基准测试中创造了推理和训练吞吐量的行业记录。比如 A0 芯片性能提供了高于 45 TFLOPS 的 FP32 吞吐量,高于 5 TBps 的内存结构带宽,以及高于 2 TBps 的连接带宽。同时,英特尔分享了一段演示视频,展示了 ResNet 推理性能超过 43000 张图像/秒和超过每秒 3400 张图像/秒的 ResNet 训练,并且这两项性能都有望实现行业领先。


Ponte Vecchio 已走下生产线进行上电验证,并已开始向客户提供限量样品。Ponte Vecchio 预计将于 2022 年面向 HPC 和 AI 市场发布。


此外,英特尔还发布了专为数据中心设计的下一代处理器 Sapphire Rapids,它的核心是一个模块化的分区 SoC 架构,具有异构计算基础设施的架构基础,并搭配最高的计算密度和内存带宽。Sapphire Rapids 也是基于 Intel 7 制程工艺技术,并采用新的性能核微架构。


IPU 方面,英特尔与一家云服务提供商合作架构了 Mount Evans 来减轻基础设施负载。Mount Evans 也是英特尔首款专用 ASIC IPU,融合了多代 FPGA SmartNIC 的经验。


最后,英特尔还提及了oneAPI,这是英特尔在 2019 年推出的开源软件解决方案,它可以提供单一、开放和统一的编程模型,能够简化跨不同架构的开发工作。除此之外,英特尔也提供了商用部署的完整 oneAPI 堆栈,包括基本的 oneAPI 基础工具包,它在规范语言和库之外增加了编译器、分析器、调试器和移植工具。据 Raja 介绍,自从 2020 年 12 月发布第一个版本以来,超过 20 万名开发者在获得 Xe HPC 之前就已经安装了英特尔的 oneAPI 产品,市场上有超过 300 个采用 oneAPI 统一编程模型的应用软件。今年 5 月份发布的 1.1 版临时规范为深度学习工作负载和高级光线追踪库添加了新的图形接口,预计正式的 1.1 版将在年底完成。

2021-08-20 13:464330
用户头像
罗燕珊 InfoQ中文站编辑

发布了 352 篇内容, 共 178.4 次阅读, 收获喜欢 685 次。

关注

评论 1 条评论

发布
用户头像
AMD,Yes
2021-08-20 16:06
回复
没有更多了
发现更多内容

Week02总结

leis

week2-依赖倒置原则&接口隔离原则

暖丶冬

架构师训练营week2 命题作业

a晖

第三课 容我三思

Geek_bobo

架构师训练营-Week 02 命题作业

华乐彬

极客大学架构师训练营 设计原则

第二课作业

lwyanhao

架构师训练营 No.2 周总结

连增申

【第二周】命题作业——软件设计原则

三尾鱼

面向对象 极客大学架构师训练营

第二周总结

孙强

Homework-依赖倒置原则的理解

River Tree

Homework 依赖倒置原则

架构师训练营第二周总结

草原上的奔跑

第二周作业

nihuihua

第二课学习总结

lwyanhao

设计模式与设计原则(第二周总结)

麻辣

第二周作业

Geek_2b3614

架构师训练营第二周学习总结

fenix

设计模式中的依赖倒置原则和接口隔离原则

dongge

第二周作业

孙强

设计原则之依赖倒置与接口隔离

L001

架构是训练营

第2周 学习总结

sunpengjian

架构师课程第二周总结

dongge

极客大学第二周作业

方堃

极客大学

第二周学习笔记

方堃

学习

架构师训练营第二周作业

15359861984

ARTS 02 - 解决 Jenkins 中使用代理来执行 npm install 的问题

jerry.mei

算法 大前端 练习 ARTS 打卡计划 ARTS活动

解决 Jenkins 中使用代理来执行 npm install 的问题

jerry.mei

Docker DevOps 运维 jenkins

架构师训练营总结 -2

River Tree

架构 总结 软件设计原则

架构师训练营第二周总结

好名字

极客大学架构师训练营 作业

Wireshark的使用与数据分析(三)--显示过滤器

姬翔

Wireshark

第2周 架构师实现自己架构目标的主要手段

陆不得

架构师训练营-第二周-总结

狂奔嘀兔纸

极客大学架构师训练营

面向CPU、GPU和IPU,英特尔发布重大技术架构的改变和创新_AI_罗燕珊_InfoQ精选文章