【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

英伟达的核弹级 GPU 来了:800 亿个晶体管,20 块就可承托全球互联网流量

  • 2022-03-23
  • 本文字数:4650 字

    阅读完需:约 15 分钟

英伟达的核弹级GPU来了:800亿个晶体管,20块就可承托全球互联网流量

北京时间 3 月 22 日晚间,在英伟达 GTC2022 上,英伟达首席执行官黄仁勋在名为“I AM AI”的线上主题演讲中,介绍了 Hopper 架构、H100 GPU、元宇宙、新型超级计算机、软件、数据中心等方面的最新进展。


英伟达公司创始人兼 CEO 黄仁勋在本届英伟达 GTC 大会的开幕仪式上,盛赞 AI 技术已经取得“惊人”进展,并展望了 AI 与 Omniverse 将如何把真实世界与虚拟世界合二为一。


黄仁勋做出承诺,意欲改造总值达万亿美元规模的多个行业,并应对人类社会当前时代下的“重大挑战”。他还分享了新的时代愿景:希望立足产业规模实现智能创造,并真正将现实与虚拟世界融合起来。


在本届英伟达 GTC 大会上,黄仁勋还介绍了新一代芯片——包括新的 Hopper GPU 架构与 H100 GPU,外加新的 AI 与加速计算软件、以及强大的新型数据中心规模系统。


这一次,由英伟达 Omniverse 实时 3D 协作与模拟平台生成的虚拟环境成了黄仁勋的新舞台,他表示“企业客户正积极处理、提炼自己的数据,开发 AI 软件,逐步转化为智能制造商。”当前,AI 科技正“朝着各个方向飞速向前。”


而 Omniverse 能够将这一切整合起来,加速人与 AI 间的协作、更好地理解现实世界并加以建模,并成为新型机器人、即“下一波 AI”的试验场。


在主题演讲开头,画面以飞行视角引领观众们穿越英伟达的全新园区。这段场景完全由 Omniverse 渲染而成,我们在画面中还能看到正在研究先进机器人项目各处实验室。


黄仁勋分享了英伟达公司如何与广泛生态系统开展合作,通过助力医疗保健与药物发现来拯救生命、甚至拯救这颗我们赖以生存的星球。


黄仁勋表示,“科学家们预测,要想有效模拟特定区域内的气候变化,我们需要一台 10 亿倍于当前水平的超级计算机才能实现。”


“但英伟达决定通过我们的「地球 2 号」(Earth-2,全球第一台 AI 数字孪生超级计算机)向这一挑战发起冲击。我们还发明了新的 AI 与计算技术,希望抢在气候发生不可逆转的破坏之前阻止这一切。”

重磅发布基于 Hopper 架构的新芯片


为了推动这些雄心勃勃的目标,黄仁勋又介绍了基于 Hopper 架构的英伟达 H100,号称是“为全球 AI 基础设施打造的新引擎”。


他解释道,语音、对话、客户服务及推荐系统等 AI 应用,正在推动数据中心设计迎来一波根本性的变化。


黄仁勋表示,“AI 数据中心负责处理大量连续数据,用以训练并改进 AI 模型。输入的原始数据经过提炼,即可逐步转化为输出的智能成果,企业则利用这些成果建设并运营大型人工智能工厂。”


这样的工厂将 24/7 全天候高强度运行。他提到,质量层面的任何一点微小提升都将显著改善客户参与度、大大拉升企业利润。


而 H100 将帮助这些工厂加快发展的脚步。这款采用台积电 4 纳米制程工艺的芯片将容纳有 800 亿个“海量”晶体管。英伟达表示这是目前性能最为强大的 GPU。黄仁勋表示,20 块 H100 GPU 就可承托全球互联网的流量。



黄仁勋表示,“Hopper H100 也将实现有史以来幅度最大的代际性能飞跃,其大规模训练性能可达 A100 的 9 倍,大型语言模型推理吞吐量更将达到 A100 的 30 倍。”


Hopper 的技术突破还不止于此,其中包含新的 Transformer 引擎、能够在不损失准确性的前提下实现 6 倍网络加速性能。


黄仁勋指出,“这意味着 transformer 模型的训练周期将由几周缩短至数天。” H100 目前已经投入生产,预计从第三季度起正式供货。


黄仁勋还公布了 Grace CPU Superchip,这也是英伟达首款用于高性能计算的离散数据中心 CPU。其中包含两个 CPU 芯片,通过每秒 900 GB 的 NVLink 芯片到芯片互连将 144 个计算核心彼此连通,内存带宽则为每秒 1 TB。


“Grace 是一款专为全球 AI 基础设施打造的理想 CPU。”


此外,黄仁勋还公布了基于 Hopper GPU 的多款新型 AI 超级计算机,分别为 DGX H100、H100 DGX POD 以及 DGX SuperPOD。


为了将这一切连接起来,英伟达研发的全新 NVLink 高速互连技术将全面覆盖后续推出的所有英伟达芯片,包括 CPU、GPU、DPU 与 SOC。


黄仁勋还谈到,英伟达将面向客户与合作伙伴提供 NVLink 以构建配套芯片。在他看来,“NVLink 将为客户们开启一个充满可能性的新世界,帮助客户利用英伟达平台与生态系统构建起各种半定制化芯片与系统。”

新软件:AI 已经“彻底改变”了软件的面貌


加速计算的成熟为 AI 带来了“惊人”的发展轨迹。


“AI 已经从根本上改变了软件所能实现的效果、以及软件开发的基本方式。”


他解释道,transformers 开启了自监督学习的大门,也消除了传统 AI 对于人工标记数据的高度依赖。结果就是,如今 transformers 开始在各个领域遍地开花。


“Transformers 让自监督学习成为可能,由此推动着 AI 技术飞速发展。”


无论是用于语言理解的 Google BERT、用于药物研发的英伟达 MegaMilBART,还是用于预测蛋白质结构的 DeepMind AlphaFold2,其根源都能追溯至 transformers 带来的这一波技术突破。


黄仁勋还提到,新型深度学习模型已经在自然语言理解、物理、创意设计、角色动画乃至 NVCell 芯片布局等领域有所建树。


“AI 正朝着各个方向飞速向前,新架构、新学习策略、更大更强的模型、新科学、新应用、新行业等等,各个领域已经迎来一波并行发展。”


而英伟达则“全力以赴”加速 AI 领域的新突破,希望助力 AI 和机器学习技术在各个行业的实践应用。


目前,英伟达 AI 平台正经历一轮重大更新,包括 Triton 推理服务器、用于训练大型语言模型的 NeMo Megatron 0.9 框架、以及用于音频和视频质量增强的 Maxine 框架等。


平台中还包含英伟达 AI Enterprise 2.0,这是一款端到端、云原生的 AI 与数据分析工具和框架套件,已经由英伟达进行过优化与认证,现可支持所有主要数据中心及云平台。


黄仁勋指出,“我们在本届 GTC 上公布了 60 项 SDK 更新。所以英伟达可以向我们 300 万开发者、科学家、AI 研究人员以及数以万计的初创企业宣布,现在您运行英伟达系统的速度更快了。”


英伟达 AI 软件与加速计算 SDK 目前已经在全球多家企业中落地应用。微软 Translator 借助英伟达 Triton 支持的实时翻译功能提升全球沟通效率。


AT&T 采用英伟达 RAPIDS 软件加速内部数据科学团队,得以轻松处理数万亿条消息记录。“英伟达 SDK 目前已经服务于医疗保健、能源、交通运输、零售、金融、媒体及娱乐等总值高达 100 万亿美元的多个行业。”

下一个进化方向:为虚拟世界而生的元宇宙


半个世纪之前,阿波罗 13 号登月计划遭遇意外。为了拯救机组人员,NASA 的工程师们决定在地球上建造一个乘员舱模型、探索可行的救援办法。


“数字孪生的思路相当于对此进行规模扩展,创造出一个与物理世界连通的虚拟世界。结合当前的互联网背景,这无疑就是下一波进化的方向。”


英伟达 Omniverse 软件专为构建数字孪生而生,新的数据中心规模英伟达 OVX 系统则将成为“面向行动的 AI”当中不可或缺的组成部分。


黄仁勋在本次大会上带来了 Omniverse 的新版本,并在介绍更新内容时表示“Omniverse 是我们机器人平台的核心所在。与 NASA 和 Amazon 一样,我们自己和来自机器人/工业自动化领域的英伟达客户都深切意识到数字孪生与 Omniverse 的重要意义。”


OVX 系统将成为 Omniverse 数字孪生的运行载体,负责在同一时空内为多个自主系统运行大规模模拟。


OVX 的骨干在于其网络结构,而这一结构的实现源自此次公布的英伟达 Spectrum-4 高性能数据网络基础设施平台。


作为全球首个 400 Gbps 端到端网络平台,英伟达 Spectrum-4 由 Spectrum-4 系列交换机、英伟达 ConnectX-7 SmartNIC、英伟达 BlueField-3 DPU 以及英伟达 DOCA 数据中心基础设施软件共同组成。


为了让更多用户能够访问 Omniverse,英仁勋还在会上公布了 Omniverse Cloud。现在只需点击几下,协作方就能接入云端、参与到 Omniverse 当中。


黄仁勋还通过四位设计师(包括一位 AI「设计师」)之手,展示了如何协同构建虚拟世界。


他还介绍了 Amazon 如何利用 Omniverse Enterprise“设计并优化极端复杂的物流中心运营体系”。


“现代物流中心本身就是一大技术奇迹,设施的运营需要由人类和机器人协同完成。”



机器人与自动驾驶将掀起下一波 AI 浪潮


新的芯片、新的软件与新的模拟功能融合在一起,必将掀起“下一波 AI”的浑然天成巨浪。由此孕育而成的机器人将具备“设计、规划与行动”能力。


英伟达 Avatar、DRIVE、Metropolis、Isaac 以及 Holoscan 正是围绕“四大支柱”构建而成的端到端、全堆栈机器人平台,而这里的四大支柱则是指:真实数据生成、AI 模型训练、机器人堆栈与 Omniverse 数字孪生。


其中英伟达 DRIVE 自动驾驶汽车系统在本质上就属于“AI 司机”。


至于英伟达用于构建英伟达 DRIVE 自动驾驶汽车硬件架构的 Hyperion 8,它能够通过 360 度摄像头、雷达、激光雷达及超声波传感器套件实现完全自动驾驶。Hyperion 8 将从 2024 年起登陆梅赛德斯-奔驰汽车,并在一年后入驻捷豹路虎产品线。


黄仁勋还宣布,作为新一代电动汽车、机器人出租车、穿梭巴士与货运卡车自动驾驶引擎的集中式 AV 与 AI 计算机英伟达 Orin,也将在本月内开始发货。


此次公布的还有 Hyperion 9,搭载即将推出的 DRIVE Atlan SoC,其性能达到基于 DRIVE Orin 架构的前代 Hyperion 8 的两倍。这套方案将于 2026 年正式推出。



全球第二大电动汽车制造商比亚迪也将在 2023 年上半年起,在出厂的汽车上采用 DRIVE Orin 计算设备。Lucid Motors 公司也透露,其 DreamDrive Pro 高级驾驶辅助系统正是基于英伟达 DRIVE 打造而成。


总体而言,未来六年之内,英伟达公司的汽车产品线将增长至超 110 亿美元。


Clara Holoscan 则将 DRIVE 中的大部分实时计算功能引入医疗食品与实时传感器,用以实现射频超声、4K 手术视频、高能量摄像头与激光导引等用例。


黄仁勋还展示了一段全息扫描加速图像的视频,画面中来自激光显微镜的图像被转化成了关于细胞移动与分裂活动的“影片”。


以往,这类仪器在一小时之内产生的 3 TB 数据,相应处理周期往往需要一整天时间。


但在加州大学伯克利分校的高级生物成像中心,Holoscan 得以帮助研究人员实时处理这些数据,确保实验过程中显微镜能够持续实现自动对焦。


Holoscan 开发平台目前已经向早期用户开放,计划将在今年 5 月正式上市,医疗级应用则暂定在 2023 年第一季度。


英伟达还与客户和开发人员合作,共同为制造业、零售业、医疗保健、农业、建筑业、机场及市政治理等领域构建机器人方案。


英伟达的机器人平台由 Metropolis 与 Isaac 共同构成,其中 Metropolis 是一台能够跟踪移动物体的固定机器人,而 Isaac 则是承载物体移动的平台。


为了帮助机器人在室内空间(例如厂房和仓库)中导航,英伟达发布了基于 Jetson AGX Orin 的 Isaac Nova Orin。这是一种先进的计算与传感器参考平台,能够加快自主移动机器人的开发与部署速度。


在一段视频中,黄仁勋展示了百事公司如何同时使用 Metropolis 与 Omniverse 数字孪生。


四层堆栈,五大动力

在演讲的最后,黄仁勋将所有技术成果、产品发布与演示内容,跟英伟达公司的下一代计算发展战略联系了起来。


英伟达为其四层堆栈公布了新产品:硬件,系统软件和库,英伟达 HPC、英伟达 AI 和英伟达 Omniverse 等软件平台,再加上 AI 与机器人应用框架。


此外,黄仁勋又介绍了重塑行业面貌的五大动力:百万倍计算提速、transformers 加速 AI、数据中心转 AI 工厂、对于机器人系统的指数级需求增长,以及 AI 次世代下的数字孪生。


“我们将在未来十年继续努力,争取在整体堆栈与数据中心规模之上实现百万倍加速。我迫不及待想看到下一波百万倍提速又能带来哪些新的可能性。”


演讲的最后,黄仁勋提到“大家在这里看到的每一段渲染、每项模拟”均由 Omniverse 生成。英伟达卓越的创意团队也邀请各位观众“再一次体验 Omniverse”,英伟达园区内的设备竟“活了过来”,共同演奏了一曲美妙的爵士乐。当然,黄仁勋的数字虚拟人化身 Toy Jensen 也有登场,而且老黄还跟这个萌小版的自己进行了一段问答对话。


原文链接:


https://blogs.nvidia.com/blog/2022/03/22/ai-factories-hopper-h100-nvidia-ceo-jensen-huang/

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2022-03-23 13:356932
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 489.9 次阅读, 收获喜欢 1966 次。

关注

评论 1 条评论

发布
用户头像
微服务架构趋势下如何处理存量系统
https://xie.infoq.cn/article/3f9e2ea9e02ef60a90f7dac3d
2022-03-26 00:20
回复
没有更多了
发现更多内容

华秋PCB生产工艺 | 第十二道主流程之FQC

华秋电子

阿里P8架构师爆肝分享内部开源的JVM垃圾回收PDF文档,共23.3W字

做梦都在改BUG

Java JVM 垃圾回收

全新适配鸿蒙生态,Cocos引擎助力3D应用开发

HarmonyOS开发者

HarmonyOS

Greptime 的 GitOps 实践

Greptime 格睿科技

k8s gitops IaC

Parallels Desktop PD 18虚拟机关闭、停止、中止和暂停操作的区别

互联网搬砖工作者

总结一下Redis的缓存雪崩、缓存击穿、缓存穿透

做梦都在改BUG

每日 Scrum 与站立会议:有什么区别?

码语者

Scrum

【坚果派-坚果】OpenHarmony新增并编译芯片解决方案

坚果

OpenHarmony OpenHarmony3.2 三周年连更

从零学习SDK(6)调试和测试SDK的库

MobTech袤博科技

OpenHarmony社区运营报告(2023年3月)

OpenHarmony开发者

OpenHarmony

更安全、更低耗的微服务架构改造之道

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

新手测试必学的 API 接口文档知识

Apifox

测试 入门 接口文档 API API 文档

一名开发者眼中的TiDB与MySQL选择

TiDB 社区干货传送门

数据库架构选型

精华!Redis 知识总结

会踢球的程序源

Java Java进阶 redis 底层原理

SpringBoot 集成 atomikos 实现分布式事务

做梦都在改BUG

活久见,java8 lamdba Collectors.toMap()报NPE

做梦都在改BUG

Netty框架详解:高性能网络编程的设计与实现

做梦都在改BUG

网络编程 Netty 高性能

企业级安全运维审计产品-行云管家堡垒机全新V7.0举行线上发布会

行云管家

运维 云堡垒机 安全运维 等级

BAT必刷!GitHub顶级“2023并发编程全优笔记”晋升公司架构组!

Java你猿哥

Java 多线程 面经 SSM框架 多线程并发

得帆云DeMDM,业内首家基于低代码技术构建的主数据管理平台

得帆信息

低代码 数据治理 数据清洗 主数据管理 主数据管理平台

Java中的异常处理详解(try、catch、finally、throw、throws) | 社区征文

共饮一杯无

Java 异常处理 三周年连更

SLBR通过自校准的定位和背景细化来去除可见的水印

合合技术团队

人工智能 图像处理 水印消除

国内功率半导体需求将持续快速增长

华秋电子

【4.7-4.14】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

高可靠多层板制造服务再获认可!华秋荣获创想三维优秀质量奖

华秋电子

太强了!阿里技术官新产"Spring高级源码阅读指南",爆火全网

Java你猿哥

Java spring SSM框架 spring ioc spring aoc

EMQX Cloud BYOC版本发布:在您的云上体验全托管的MQTT消息服务

EMQ映云科技

物联网 IoT 云服务 mqtt 企业号 4 月 PK 榜

HummerRisk V1.0.0:架构全面升级,开启新篇章

HummerCloud

云原生安全

TiDB 6.1/6.5 在 Rocky Linux 8 中的部署升级与 PITR 初体验

TiDB 社区干货传送门

版本升级 安装 & 部署 备份 & 恢复 扩/缩容 6.x 实践

关键的Java JVM选项和参数

码语者

JVM

网站不收录是受哪些因素影响?

海拥(haiyong.site)

三周年连更

英伟达的核弹级GPU来了:800亿个晶体管,20块就可承托全球互联网流量_AI&大模型_BRIAN CAULFIELD_InfoQ精选文章