【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

英伟达的核弹级 GPU 来了:800 亿个晶体管,20 块就可承托全球互联网流量

  • 2022-03-23
  • 本文字数:4650 字

    阅读完需:约 15 分钟

英伟达的核弹级GPU来了:800亿个晶体管,20块就可承托全球互联网流量

北京时间 3 月 22 日晚间,在英伟达 GTC2022 上,英伟达首席执行官黄仁勋在名为“I AM AI”的线上主题演讲中,介绍了 Hopper 架构、H100 GPU、元宇宙、新型超级计算机、软件、数据中心等方面的最新进展。


英伟达公司创始人兼 CEO 黄仁勋在本届英伟达 GTC 大会的开幕仪式上,盛赞 AI 技术已经取得“惊人”进展,并展望了 AI 与 Omniverse 将如何把真实世界与虚拟世界合二为一。


黄仁勋做出承诺,意欲改造总值达万亿美元规模的多个行业,并应对人类社会当前时代下的“重大挑战”。他还分享了新的时代愿景:希望立足产业规模实现智能创造,并真正将现实与虚拟世界融合起来。


在本届英伟达 GTC 大会上,黄仁勋还介绍了新一代芯片——包括新的 Hopper GPU 架构与 H100 GPU,外加新的 AI 与加速计算软件、以及强大的新型数据中心规模系统。


这一次,由英伟达 Omniverse 实时 3D 协作与模拟平台生成的虚拟环境成了黄仁勋的新舞台,他表示“企业客户正积极处理、提炼自己的数据,开发 AI 软件,逐步转化为智能制造商。”当前,AI 科技正“朝着各个方向飞速向前。”


而 Omniverse 能够将这一切整合起来,加速人与 AI 间的协作、更好地理解现实世界并加以建模,并成为新型机器人、即“下一波 AI”的试验场。


在主题演讲开头,画面以飞行视角引领观众们穿越英伟达的全新园区。这段场景完全由 Omniverse 渲染而成,我们在画面中还能看到正在研究先进机器人项目各处实验室。


黄仁勋分享了英伟达公司如何与广泛生态系统开展合作,通过助力医疗保健与药物发现来拯救生命、甚至拯救这颗我们赖以生存的星球。


黄仁勋表示,“科学家们预测,要想有效模拟特定区域内的气候变化,我们需要一台 10 亿倍于当前水平的超级计算机才能实现。”


“但英伟达决定通过我们的「地球 2 号」(Earth-2,全球第一台 AI 数字孪生超级计算机)向这一挑战发起冲击。我们还发明了新的 AI 与计算技术,希望抢在气候发生不可逆转的破坏之前阻止这一切。”

重磅发布基于 Hopper 架构的新芯片


为了推动这些雄心勃勃的目标,黄仁勋又介绍了基于 Hopper 架构的英伟达 H100,号称是“为全球 AI 基础设施打造的新引擎”。


他解释道,语音、对话、客户服务及推荐系统等 AI 应用,正在推动数据中心设计迎来一波根本性的变化。


黄仁勋表示,“AI 数据中心负责处理大量连续数据,用以训练并改进 AI 模型。输入的原始数据经过提炼,即可逐步转化为输出的智能成果,企业则利用这些成果建设并运营大型人工智能工厂。”


这样的工厂将 24/7 全天候高强度运行。他提到,质量层面的任何一点微小提升都将显著改善客户参与度、大大拉升企业利润。


而 H100 将帮助这些工厂加快发展的脚步。这款采用台积电 4 纳米制程工艺的芯片将容纳有 800 亿个“海量”晶体管。英伟达表示这是目前性能最为强大的 GPU。黄仁勋表示,20 块 H100 GPU 就可承托全球互联网的流量。



黄仁勋表示,“Hopper H100 也将实现有史以来幅度最大的代际性能飞跃,其大规模训练性能可达 A100 的 9 倍,大型语言模型推理吞吐量更将达到 A100 的 30 倍。”


Hopper 的技术突破还不止于此,其中包含新的 Transformer 引擎、能够在不损失准确性的前提下实现 6 倍网络加速性能。


黄仁勋指出,“这意味着 transformer 模型的训练周期将由几周缩短至数天。” H100 目前已经投入生产,预计从第三季度起正式供货。


黄仁勋还公布了 Grace CPU Superchip,这也是英伟达首款用于高性能计算的离散数据中心 CPU。其中包含两个 CPU 芯片,通过每秒 900 GB 的 NVLink 芯片到芯片互连将 144 个计算核心彼此连通,内存带宽则为每秒 1 TB。


“Grace 是一款专为全球 AI 基础设施打造的理想 CPU。”


此外,黄仁勋还公布了基于 Hopper GPU 的多款新型 AI 超级计算机,分别为 DGX H100、H100 DGX POD 以及 DGX SuperPOD。


为了将这一切连接起来,英伟达研发的全新 NVLink 高速互连技术将全面覆盖后续推出的所有英伟达芯片,包括 CPU、GPU、DPU 与 SOC。


黄仁勋还谈到,英伟达将面向客户与合作伙伴提供 NVLink 以构建配套芯片。在他看来,“NVLink 将为客户们开启一个充满可能性的新世界,帮助客户利用英伟达平台与生态系统构建起各种半定制化芯片与系统。”

新软件:AI 已经“彻底改变”了软件的面貌


加速计算的成熟为 AI 带来了“惊人”的发展轨迹。


“AI 已经从根本上改变了软件所能实现的效果、以及软件开发的基本方式。”


他解释道,transformers 开启了自监督学习的大门,也消除了传统 AI 对于人工标记数据的高度依赖。结果就是,如今 transformers 开始在各个领域遍地开花。


“Transformers 让自监督学习成为可能,由此推动着 AI 技术飞速发展。”


无论是用于语言理解的 Google BERT、用于药物研发的英伟达 MegaMilBART,还是用于预测蛋白质结构的 DeepMind AlphaFold2,其根源都能追溯至 transformers 带来的这一波技术突破。


黄仁勋还提到,新型深度学习模型已经在自然语言理解、物理、创意设计、角色动画乃至 NVCell 芯片布局等领域有所建树。


“AI 正朝着各个方向飞速向前,新架构、新学习策略、更大更强的模型、新科学、新应用、新行业等等,各个领域已经迎来一波并行发展。”


而英伟达则“全力以赴”加速 AI 领域的新突破,希望助力 AI 和机器学习技术在各个行业的实践应用。


目前,英伟达 AI 平台正经历一轮重大更新,包括 Triton 推理服务器、用于训练大型语言模型的 NeMo Megatron 0.9 框架、以及用于音频和视频质量增强的 Maxine 框架等。


平台中还包含英伟达 AI Enterprise 2.0,这是一款端到端、云原生的 AI 与数据分析工具和框架套件,已经由英伟达进行过优化与认证,现可支持所有主要数据中心及云平台。


黄仁勋指出,“我们在本届 GTC 上公布了 60 项 SDK 更新。所以英伟达可以向我们 300 万开发者、科学家、AI 研究人员以及数以万计的初创企业宣布,现在您运行英伟达系统的速度更快了。”


英伟达 AI 软件与加速计算 SDK 目前已经在全球多家企业中落地应用。微软 Translator 借助英伟达 Triton 支持的实时翻译功能提升全球沟通效率。


AT&T 采用英伟达 RAPIDS 软件加速内部数据科学团队,得以轻松处理数万亿条消息记录。“英伟达 SDK 目前已经服务于医疗保健、能源、交通运输、零售、金融、媒体及娱乐等总值高达 100 万亿美元的多个行业。”

下一个进化方向:为虚拟世界而生的元宇宙


半个世纪之前,阿波罗 13 号登月计划遭遇意外。为了拯救机组人员,NASA 的工程师们决定在地球上建造一个乘员舱模型、探索可行的救援办法。


“数字孪生的思路相当于对此进行规模扩展,创造出一个与物理世界连通的虚拟世界。结合当前的互联网背景,这无疑就是下一波进化的方向。”


英伟达 Omniverse 软件专为构建数字孪生而生,新的数据中心规模英伟达 OVX 系统则将成为“面向行动的 AI”当中不可或缺的组成部分。


黄仁勋在本次大会上带来了 Omniverse 的新版本,并在介绍更新内容时表示“Omniverse 是我们机器人平台的核心所在。与 NASA 和 Amazon 一样,我们自己和来自机器人/工业自动化领域的英伟达客户都深切意识到数字孪生与 Omniverse 的重要意义。”


OVX 系统将成为 Omniverse 数字孪生的运行载体,负责在同一时空内为多个自主系统运行大规模模拟。


OVX 的骨干在于其网络结构,而这一结构的实现源自此次公布的英伟达 Spectrum-4 高性能数据网络基础设施平台。


作为全球首个 400 Gbps 端到端网络平台,英伟达 Spectrum-4 由 Spectrum-4 系列交换机、英伟达 ConnectX-7 SmartNIC、英伟达 BlueField-3 DPU 以及英伟达 DOCA 数据中心基础设施软件共同组成。


为了让更多用户能够访问 Omniverse,英仁勋还在会上公布了 Omniverse Cloud。现在只需点击几下,协作方就能接入云端、参与到 Omniverse 当中。


黄仁勋还通过四位设计师(包括一位 AI「设计师」)之手,展示了如何协同构建虚拟世界。


他还介绍了 Amazon 如何利用 Omniverse Enterprise“设计并优化极端复杂的物流中心运营体系”。


“现代物流中心本身就是一大技术奇迹,设施的运营需要由人类和机器人协同完成。”



机器人与自动驾驶将掀起下一波 AI 浪潮


新的芯片、新的软件与新的模拟功能融合在一起,必将掀起“下一波 AI”的浑然天成巨浪。由此孕育而成的机器人将具备“设计、规划与行动”能力。


英伟达 Avatar、DRIVE、Metropolis、Isaac 以及 Holoscan 正是围绕“四大支柱”构建而成的端到端、全堆栈机器人平台,而这里的四大支柱则是指:真实数据生成、AI 模型训练、机器人堆栈与 Omniverse 数字孪生。


其中英伟达 DRIVE 自动驾驶汽车系统在本质上就属于“AI 司机”。


至于英伟达用于构建英伟达 DRIVE 自动驾驶汽车硬件架构的 Hyperion 8,它能够通过 360 度摄像头、雷达、激光雷达及超声波传感器套件实现完全自动驾驶。Hyperion 8 将从 2024 年起登陆梅赛德斯-奔驰汽车,并在一年后入驻捷豹路虎产品线。


黄仁勋还宣布,作为新一代电动汽车、机器人出租车、穿梭巴士与货运卡车自动驾驶引擎的集中式 AV 与 AI 计算机英伟达 Orin,也将在本月内开始发货。


此次公布的还有 Hyperion 9,搭载即将推出的 DRIVE Atlan SoC,其性能达到基于 DRIVE Orin 架构的前代 Hyperion 8 的两倍。这套方案将于 2026 年正式推出。



全球第二大电动汽车制造商比亚迪也将在 2023 年上半年起,在出厂的汽车上采用 DRIVE Orin 计算设备。Lucid Motors 公司也透露,其 DreamDrive Pro 高级驾驶辅助系统正是基于英伟达 DRIVE 打造而成。


总体而言,未来六年之内,英伟达公司的汽车产品线将增长至超 110 亿美元。


Clara Holoscan 则将 DRIVE 中的大部分实时计算功能引入医疗食品与实时传感器,用以实现射频超声、4K 手术视频、高能量摄像头与激光导引等用例。


黄仁勋还展示了一段全息扫描加速图像的视频,画面中来自激光显微镜的图像被转化成了关于细胞移动与分裂活动的“影片”。


以往,这类仪器在一小时之内产生的 3 TB 数据,相应处理周期往往需要一整天时间。


但在加州大学伯克利分校的高级生物成像中心,Holoscan 得以帮助研究人员实时处理这些数据,确保实验过程中显微镜能够持续实现自动对焦。


Holoscan 开发平台目前已经向早期用户开放,计划将在今年 5 月正式上市,医疗级应用则暂定在 2023 年第一季度。


英伟达还与客户和开发人员合作,共同为制造业、零售业、医疗保健、农业、建筑业、机场及市政治理等领域构建机器人方案。


英伟达的机器人平台由 Metropolis 与 Isaac 共同构成,其中 Metropolis 是一台能够跟踪移动物体的固定机器人,而 Isaac 则是承载物体移动的平台。


为了帮助机器人在室内空间(例如厂房和仓库)中导航,英伟达发布了基于 Jetson AGX Orin 的 Isaac Nova Orin。这是一种先进的计算与传感器参考平台,能够加快自主移动机器人的开发与部署速度。


在一段视频中,黄仁勋展示了百事公司如何同时使用 Metropolis 与 Omniverse 数字孪生。


四层堆栈,五大动力

在演讲的最后,黄仁勋将所有技术成果、产品发布与演示内容,跟英伟达公司的下一代计算发展战略联系了起来。


英伟达为其四层堆栈公布了新产品:硬件,系统软件和库,英伟达 HPC、英伟达 AI 和英伟达 Omniverse 等软件平台,再加上 AI 与机器人应用框架。


此外,黄仁勋又介绍了重塑行业面貌的五大动力:百万倍计算提速、transformers 加速 AI、数据中心转 AI 工厂、对于机器人系统的指数级需求增长,以及 AI 次世代下的数字孪生。


“我们将在未来十年继续努力,争取在整体堆栈与数据中心规模之上实现百万倍加速。我迫不及待想看到下一波百万倍提速又能带来哪些新的可能性。”


演讲的最后,黄仁勋提到“大家在这里看到的每一段渲染、每项模拟”均由 Omniverse 生成。英伟达卓越的创意团队也邀请各位观众“再一次体验 Omniverse”,英伟达园区内的设备竟“活了过来”,共同演奏了一曲美妙的爵士乐。当然,黄仁勋的数字虚拟人化身 Toy Jensen 也有登场,而且老黄还跟这个萌小版的自己进行了一段问答对话。


原文链接:


https://blogs.nvidia.com/blog/2022/03/22/ai-factories-hopper-h100-nvidia-ceo-jensen-huang/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2022-03-23 13:356997
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 492.9 次阅读, 收获喜欢 1966 次。

关注

评论 1 条评论

发布
用户头像
微服务架构趋势下如何处理存量系统
https://xie.infoq.cn/article/3f9e2ea9e02ef60a90f7dac3d
2022-03-26 00:20
回复
没有更多了
发现更多内容

LeetCode 数据库刷题 - 1179. 重新格式化部门表

小马哥

七日更 二月春节不断更

还傻傻分不清楚equals和==的区别吗?看完就明白了

codevald

Java 源码分析 string Object

SpringMVC专栏 第1篇 - 快速入门

小马哥

Java spring Spring MVC 七日更 二月春节不断更

浅谈性能优化

跳蚤

《我们脑中挥之不去的问题》 - 卓克科普(2)

石云升

读书笔记 科普 2月春节不断更

9. Python 学习过程的第一个山坡,99%的人都倒在了山坡下

梦想橡皮擦

Python 2月春节不断更 python入门 python学习

Chrome浏览器多进程架构3个必会知识点

梁龙先森

面试 大前端 浏览器

第十二周 数据应用一 作业 「架构师训练营 3 期」

胡云飞

性能压测的时候,随着并发压力的增加,系统响应时间和吞吐量如何变化,为什么?

跳蚤

熬夜总结了 “HTML5画布” 的知识点(共10条)

我是哪吒

学习 读书笔记 程序员 随笔杂谈 2月春节不断更

深入浅出函数式编程:Stream流水线的实现原理

码农架构

Java 架构 微服务

Scrum Patterns:梳理产品待办列表(译)

Bruce Talk

敏捷开发 译文 Agile Scrum Patterns

架构师训练营 4 期 第7周

引花眠

架构师训练营 4 期

《我们脑中挥之不去的问题》- 卓克科普(1)

石云升

读书笔记 科普 2月春节不断更

日记 2021年2月13日(周六)

Changing Lin

2月春节不断更

Java SE最佳实践

jiangling500

Java 最佳实践 Java SE

杨明越:Kubernetes的下一仗可能是提升标准化程度

杨明越

「架构师训练营 4 期」 第七周 - 001&2

凯迪

架构师训练营 4 期

日记 2021年2月14日(周日)

Changing Lin

2月春节不断更

盘点关于程序员的那些经典案例

孙叫兽

程序员 程序人生 话题讨论 薪水 计算机原理

Spring框架源码:BeanFactory与Bean的生命周期

程序员架构进阶

Java spring 源码阅读 七日更 2月春节不断更

gradle中的build script详解

程序那些事

maven Gradle 程序那些事 构建脚本 构建程序

写一个用例(总结)第四周

mas

机器学习·笔记之:

Nydia

Elasticsearch Mapping Overview

escray

elastic 七日更 死磕Elasticsearch 60天通过Elastic认证考试 2月春节不断更

【STM32】串口通信---用代码与芯片对话

AXYZdong

硬件 stm32 2月春节不断更

并发编程系列:线上问题定位

程序员架构进阶

Java 并发 问题排查 七日更 2月春节不断更

Tomcat速查手册

jiangling500

Java tomcat

JDBC速查手册

jiangling500

Java JDBC

聊聊大公司创新的机制:饱和攻击

boshi

创新 七日更

【LeetCode】情侣牵手Java题解

Albert

算法 LeetCode 2月春节不断更

英伟达的核弹级GPU来了:800亿个晶体管,20块就可承托全球互联网流量_AI&大模型_BRIAN CAULFIELD_InfoQ精选文章