NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

“芯经济”崛起,英特尔加速 AI 抢位战

  • 2023-09-20
    北京
  • 本文字数:4706 字

    阅读完需:约 15 分钟

大小:2.64M时长:15:23
“芯经济”崛起,英特尔加速AI抢位战

 当地时间 9 月 19 日,英特尔 On 技术创新大会(Intel Innovation) 2023 在美国加州圣何塞拉开帷幕,InfoQ 有幸受邀参会并从现场发回报道。英特尔 On 技术创新大会是一场面向开发者的大会,更是一个了解过去一年英特尔在不同方向(包括端侧计算、数据中心、边缘计算和云计算)取得的最新进展的好方法。来自全球的上千位开发者、英特尔合作伙伴和客户亲临这场盛会,以期全面了解英特尔将以怎样的新策略、新产品应对生成式 AI 大爆发带来的机遇和挑战。


图:InfoQ 记者拍摄于现场

 

AI 毫无疑问是贯穿大会首日主题演讲全程的重要关键词。围绕“让 AI 无处不在”这一主题,英特尔 CEO 帕特·基辛格在主题演讲中展示了英特尔如何在其各种硬件产品中加入 AI 能力,并通过开放、多架构的软件解决方案推动 AI 应用的普及。

AI 推动“芯经济”崛起


基辛格在主题演讲开场表示:“AI 代表着新时代的到来。AI 正在催生全球增长的新时代,在新时代中,算力起着更为重要的作用,让所有人迎来更美好的未来。对开发者而言,这将带来巨大的社会和商业机遇,以创造更多可能,为世界上的重大挑战打造解决方案,并造福地球上每一个人。”

 

基辛格提到,如今芯片形成了规模达 5740 亿美元的行业,并驱动着全球约 8 万亿美元的技术经济。世界对计算的需求呈指数级增长,而且这种需求与芯片的面积、成本和功耗成反比。简而言之,这就是摩尔定律。随后他提出了“芯经济”(Siliconomy)这一概念:“芯经济”是一个由可持续、开放、安全的算力需求所驱动的经济增长新时代。



 更充足、更强大、更具性价比的处理能力,是经济增长的关键组成。而人工智能代表着计算的新时代,促进了“芯经济”的崛起。基辛格表示,五大超级技术力量——计算、连接、基础设施、人工智能、传感和感知,由“芯经济”推动。随后他分享了一系列 AI 相关的软硬件产品方案新进展和技术路线图。

英特尔开发者云全面上线


基辛格宣布英特尔开发者云平台自今日起全面上线。英特尔开发者云平台能够帮助开发者利用最新的英特尔软硬件创新来进行 AI 开发(包括用于深度学习的英特尔 Gaudi2 加速器),并授权他们使用英特尔最新的硬件平台,如即将在未来几周内上线的第五代英特尔至强可扩展处理器(代号为 Emerald Rapids),以及将在 12 月 14 日上线的英特尔数据中心 GPU Max 系列 1100 和 1550。



 在使用英特尔开发者云平台时,开发者可以构建、测试并优化 AI 以及 HPC 应用程序,他们还可以运行从小规模到大规模的 AI 训练、模型优化和推理工作负载,以实现高性能和高效率。

 

英特尔开发者云平台建立在支持多架构、多厂商硬件的 oneAPI 开放编程模型基础之上,为开发者提供硬件选择,并摆脱了专有编程模型,以支持加速计算、代码重用和满足可移植性需求。

 

据 InfoQ 了解,已经有不少客户基于英特尔开发者云构建自己的 AI 应用,埃森哲是其中之一。

 

此外,基辛格还在会上发布了英特尔发行版 OpenVINO 工具套件 2023.1 版,并表示 Arm 也将参与到 OpenVINO 工作中。OpenVINO 是英特尔的 AI 推理和部署运行工具套件,在客户端和边缘平台上为开发人员提供了优质选择。该版本包括针对跨操作系统和各种不同云解决方案的集成而优化的预训练模型,包括多个生成式 AI 模型,例如 Meta 的 Llama 2 模型。

 


为了更好地将 AI 扩展到边缘侧,英特尔还将推出 Strata 项目以及边缘原生软件平台。其中边缘原生软件平台平台将于 2024 年推出,提供模块化构件、优质服务和产品支持。这是一种横向扩展智能边缘(intelligent edge)和混合人工智能(hybrid AI)所需基础设施的方式,并将英特尔和第三方的垂直应用程序整合在一个生态系统内。该解决方案将使开发人员能够构建、部署、运行、管理、连接和保护分布式边缘基础设施和应用程序。

AI 芯片路线图、下一代至强处理器亮相

 

自今年 7 月英特尔发布 Gaudi 2 训练加速器以来,其性能表现一直备受关注。最近的 MLPerf AI 推理性能测试结果进一步证明了 Gaudi 2 性能在市场上的竞争力,其是目前市场上满足 AI 计算需求的唯一可行替代方案。基辛格披露了一台完全基于英特尔至强处理器和 4000 个英特尔 Gaudi2 AI 硬件加速器构建的大型 AI 超级计算机。这台 AI 超级计算机将跻身全球 TOP15 超算,而 AI 独角兽企业 Stability AI 是其主要客户。

 


作为第四代英特尔至强处理器的早期采用者,阿里巴巴也被邀请来为英特尔站台。阿里云首席技术官周靖人阐述了阿里巴巴如何将内置 AI 加速器的第四代英特尔至强可扩展处理器用于其生成式 AI 和大语言模型,即“阿里云通义千问大模型”。周靖人表示,英特尔技术“大幅缩短了模型响应时间,平均加速可达 3 倍”。

 

面向 AI 计算,基辛格亮出了英特尔最新的三代 AI 芯片路线图,其中采用 5nm 制程的 Gaudi 3 将于 2024 年推出,再下一代 AI 芯片代号为 Falcon Shores,计划于 2025 年推出。



其中 Gaudi 3 的算力将达到 Gaudi 2 的两倍,网络带宽、HBM 容量将达到 Gaudi 2 的 1.5 倍。



基辛格还在演讲中预览了下一代英特尔至强处理器,并透露第五代英特尔至强处理器将于 12 月 14 日发布,届时,将在相同的功耗下为全球数据中心提高性能和存储速度。此外,具备高能效的能效核(E-core)处理器 Sierra Forest 将于 2024 年上半年上市。与第四代至强相比,拥有 288 核的该处理器预计将使机架密度提升 2.5 倍,每瓦性能提高 2.4 倍。紧随 Sierra Forest 发布的是具备高性能的性能核(P-core)处理器 Granite Rapids,与第四代至强相比,其 AI 性能预计将提高 2 到 3 倍。




展望 2025 年,代号为 Clearwater Forest 的下一代至强能效核处理器将基于 Intel 18A 制程节点制造。

迈向 AI PC 新时代

 

为了让 AI 的使用更加普及化,英特尔也将目光放到了个人 PC 上。基辛格在演讲中表示:“AI 将通过云与 PC 的紧密协作,进而从根本上改变、重塑和重构 PC 体验,释放人们的生产力和创造力。我们正迈向 AI PC 的新时代。”



这一全新的 PC 体验,即将在接下来推出的产品代号为 Meteor Lake 的英特尔酷睿 Ultra 处理器上得到展现。该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在 PC 上带来高能效的 AI 加速和本地推理体验。基辛格透露,酷睿 Ultra 将在 12 月 14 日发布。

 

酷睿 Ultra 处理器

 

基辛格将酷睿 Ultra 处理器称作英特尔客户端处理器路线图的一个转折点:该款处理器是首个采用 Foveros 封装技术的客户端芯粒设计。除了 NPU 以及 Intel 4 制程节点在性能功耗比上的重大进步外,这款处理器还通过集成英特尔锐炫显卡,带来独立显卡级别的性能。

 

基辛格展示了全新 AI PC 的众多使用场景,并邀请宏碁首席运营官高树国上台介绍了搭载酷睿 Ultra 处理器的宏碁笔记本电脑。高树国表示:“我们与英特尔团队合作,通过 OpenVINO 工具包共同开发了一套宏碁 AI 库,以充分利用英特尔酷睿 Ultra 平台,还共同开发了 AI 库,最终将这款产品带给用户。”

 

AI 创业公司 Rewind AI 也来到现场,演示在断网的情况下,由英特尔 OpenVINO 驱动在 PC 本地运行大语言模型,与 AI 聊天机器人进行实时问答。

制程、封装最新进展


在 2022 年英特尔投资者大会上,英特尔公布了接下来几年间的制程发展规划。按照英特尔的计划,未来的四年间,英特尔将跨过五个制程节点。此后一年间,这个计划的进展颇受关注。

 

在今天的主题演讲中,基辛格表示,英特尔的“四年五个制程节点”计划进展顺利,Intel 7 已经实现大规模量产,Intel 4 已经生产准备就绪,Intel 3 也在按计划推进中,目标是 2023 年年底。



基辛格还展示了基于 Intel 20A 制程节点打造的英特尔 Arrow Lake 处理器的首批测试芯片。他表示,Arrow Lake 将于 2024 年面向客户端市场推出。Intel 20A 将是首个应用 PowerVia 背面供电技术和新型全环绕栅极晶体管 RibbonFET 的制程节点。同样将采用这两项技术的 Intel 18A 制程节点也在按计划推进中,将于 2024 年下半年生产准备就绪。

 

此前英特尔已经官宣 Intel 18A 进程的多项进展。今年 4 月,英特尔代工服务事业部(IFS)和 Arm 宣布签署协议,旨在使芯片设计公司能够利用 Intel 18A 制程工艺来开发低功耗计算系统级芯片(SoC)。今年 7 月,爱立信宣布与英特尔达成战略合作协议,将采用英特尔 18A 制程和制造技术为爱立信的下一代 5G 基础设施优化提供支持。

 

除制程外,英特尔向前推进摩尔定律的另一路径是使用新材料和新封装技术,如玻璃基板(glass substrates)。这是英特尔刚于本周宣布的一项突破。玻璃基板将于 2020 年代后期推出,继续增加单个封装内的晶体管数量,助力满足 AI 等数据密集型高性能工作负载的需求,并在 2030 年后继续推进摩尔定律。


基辛格展示玻璃基板材料

 

英特尔还展示了基于通用芯粒高速互连开放规范(UCIe)的测试芯片封装。基辛格表示,摩尔定律的下一波浪潮将由多芯粒封装技术所推动,如果开放标准能够解决 IP 集成的障碍,它将很快变成现实。发起于去年的 UCIe 标准将让来自不同厂商的芯粒能够协同工作,从而以新型芯片设计满足不同 AI 工作负载的扩展需求。目前,UCIe 开放标准已经得到了超过 120 家公司的支持。

 

该测试芯片集成了基于 Intel 3 制程节点的英特尔 UCIe IP 芯粒,和基于 TSMC N3E 制程节点的 Synopsys UCIe IP 芯粒。这些芯粒通过 EMIB(嵌入式多芯片互连桥接)先进封装技术互连在一起。英特尔代工服务(Intel Foundry Services)、TSMC 和 Synopsys 携手推动 UCIe 的发展,体现了三者支持基于开放标准的芯粒生态系统的承诺。

先进计算和前沿研究


除了大众关注更多的软硬件进展,英特尔研究院还在诸多前沿技术方向上展开探索,包括神经拟态计算、量子计算等。在主题演讲的最后,基辛格也对这些前沿研究方向的最新进展做了介绍。

 

基于 Loihi 2 第二代研究芯片和开源 Lava 软件框架,英特尔研究院正在推动神经拟态计算的发展。Loihi 2 是性能业界领先的神经拟态研究芯片,基于 Intel 4 制程节点开发,每个芯片最多可包含 100 万个神经元。

 


Loihi 2 还具有可扩展性,8 芯片 Loihi 2 开发板 Kapoho Point,可通过堆叠满足大规模工作负载的需求。英特尔还提供开源、模块化、可扩展的 Lava 软件框架,助力神经拟态应用的开发。

 

量子计算方面,今年 6 月,英特尔发布了包含 12 个硅自旋量子比特(silicon spin qubit)的全新量子芯片 Tunnel Falls,继续探索量子实用性。



在英特尔的晶圆厂里,Tunnel Falls 是在 300 毫米的硅晶圆上生产的,利用了英特尔领先的晶体管工业化制造能力,如极紫外光刻技术(EUV),以及栅极和接触层加工技术。

 

虽然这次在主题演讲中并未提及,但也有部分开发者对于英特尔在 RISC-V 方向的动态十分关注。英特尔近几年一直在投资 RISC-V,去年英特尔加入了全球开放硬件标准组织 RISC-V International,该组织成员包括阿里云、谷歌、IBM、Nvidia、三星等;旗下的 Mobileye 还推出了基于 RISC-V 的 EyeQ Ultra 芯片。但今年 1 月份,英特尔停止 Intel Pathfinder for RISC-V 项目,引发了 RISC-V 社区对于英特尔是否会继续投入的担忧。根据 InfoQ 获知的最新消息,英特尔只是停止了一个针对 RISC-V 的前期探路项目,并没有停止对 RISC-V 的支持,而是转而继续正式支持 RISC-V,相关研究工作英特尔中国团队将会重点投入。

写在最后


在生成式 AI 这波大潮之下,更多人只关注到了 GPU 的成功和抢手程度,但 GPU 可能并这波浪潮唯一的受益者。随着大模型热潮爆发,未来将有海量潜在的 AI 应用需求,业内有观点认为,未来运行大模型所消耗的计算量(即推理的算力规模),将超过用于训练模型的计算量。从硬件层面来看,这意味着 AI 研究的重点将转向如何降低推理成本,而这恰恰是英特尔的优势所在。在本次活动现场与英特尔高层的交流中,我们也听到了类似的观点。


训练并非生成式 AI 的全部,我们可以看到,英特尔正试图在 AI 工作流的各个环节全面发力,从训练到 Fine-tuning,再到部署和推理,英特尔都有软硬件层面对应的产品和技术布局。这些布局能否帮助英特尔在生成式 AI 浪潮下继续取得成功,归根结底还是在于其能否很好地匹配客户需求、给客户带来足够的商业价值,这也是英特尔当前仍然面临的挑战,让我们一起拭目以待。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2023-09-20 09:333801
用户头像
蔡芳芳 InfoQ主编

发布了 781 篇内容, 共 495.6 次阅读, 收获喜欢 2748 次。

关注

评论

发布
暂无评论
发现更多内容

使用 TypeScript 从零搭建自己的 Web 框架:领域特定语言(DSL) 与 Prisma 模型

RoyLin

typescript

一文读懂BTC生态新贵Giants Planet,将L2与现实世界整合

大瞿科技

鸿蒙HarmonyOS实战-ArkUI组件(Flex)

蜀道山

鸿蒙 HarmonyOS Flex 鸿蒙开发 鸿蒙系统

数字先锋| 加“数”蝶变,打造政务服务“心温度”!

天翼云开发者社区

人工智能 云计算 大数据 数字化

Python编程与算法面试-编程面试的重点

测试人

软件测试

IPQ4019 PK IPQ9574——Processor chip performance and application comparison

wifi6-yiyi

WiFi 7 WiFi 5

MacOS Mojave10.14.6系统安装包 MacOSv10.14正式版安装

影影绰绰一往直前

从零开始学习大模型

百度开发者中心

人工智能 大模型 LLM

Hugging Face推出全新代码大模型:支持80+编程语言,集成VSCode

百度开发者中心

人工智能 深度学习 大模型

东周APP:投资新兴实业资产,助力实体经济高质量发展

Geek_2d6073

智能商品计划系统如何提升鞋服零售品牌的竞争力

第七在线

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

阿里云大数据AI技术

大数据 阿里云

一本书精通推荐算法,轻松搞定入门、面试、进阶

博文视点Broadview

鸿蒙HarmonyOS实战-ArkUI组件(Stack)

蜀道山

鸿蒙 HarmonyOS stack 鸿蒙开发 鸿蒙系统

一文读懂BTC生态新贵Giants Planet,将L2与现实世界整合

加密眼界

如何在面试中应对编程与算法面试?

霍格沃兹测试开发学社

OpenAI前商业化负责人Zack Kass中国行系列活动圆满落幕!

科技热闻

支持国密加密卡的堡垒机是什么牌子?电话多少?

行云管家

数据安全 堡垒机 国密 国密加密卡

和鲸科技将参与第五届空间数据智能学术会议并于应急减灾与可持续发展专题论坛做报告分享

ModelWhale

人工智能 大数据 空间数据库 空间数据智能学术会议

使用 Apifox 设置 OAuth 2.0 并快速获取访问令牌

Apifox

程序员 后端 oauth2.0 OAuth 2.0 API 安全

秒开率破90%!交易后台渲染性能优化 | 得物技术

得物技术

性能优化 前端 企业号 4 月 PK 榜 后台管理

基于afx透明视频的视觉增强前端方案

百度Geek说

开发效率 企业号 4 月 PK 榜 前端动效 透明视频 视觉增强

AI数字人永生、数字分身、人均一个数字人会成为未来标配吗?

青否数字人

数字人

NL2SQL进阶系列(4):ConvAI、DIN-SQL等16个业界开源应用实践详解[Text2SQL]

汀丶人工智能

大模型 text2sql NL2SQL

第47期 | GPTSecurity周报

云起无垠

2024年腾讯微信朋友圈广告代理商怎么申请 全媒体广告渠道对接合作

微点全媒体微信推广渠道

天翼云入选“2023年度数据要素价值创新标杆示范案例”!

天翼云开发者社区

云计算 大数据

NineData正式将SQL开发正式升级为数据库DevOps

NineData

DevOps 数据库设计 数据管理 SQL开发 NineData

掌握 HTTP:网络通信的核心技术详解

Liam

程序员 前端 Web 后端 HTTP

PrismNET棱镜协议丨没有信仰,谈何成功?

PrismNET

区块链 dapp Web3.0 PrismNET棱镜协议 PrismNET

干货分享 | MatrixOne 如何基于K8S+S3构建HTAP数据库

MatrixOrigin

数据库 分布式 云原生

“芯经济”崛起,英特尔加速AI抢位战_英特尔_蔡芳芳_InfoQ精选文章