写点什么

市值暴涨至万亿美元后,英伟达再放大招!推出超级 AI 计算平台:集成 256 个 GH200 芯片、共享内存 144TB

  • 2023-05-30
    北京
  • 本文字数:3438 字

    阅读完需:约 11 分钟

市值暴涨至万亿美元后,英伟达再放大招!推出超级AI计算平台:集成256个GH200芯片、共享内存144TB

美国企业对 H100 处理器的旺盛需求,推动英伟达市值飙升至 1 万亿美元。

 

上周,英伟达股价一周内上涨了 25%,市值直逼万亿美元,其创始人黄仁勋的身价也突破了 330 亿美元。

 

春风得意的黄老板于 5 月 29 日现身在中国台北举办的 COMPUTEX 大会,并在大会上发布了面向所有行业的生成式AI平台。“我们正在重新发明计算机,加速计算和人工智能标志着计算正在被重新定义。”黄仁勋表示。

 

黄仁勋正在带领英伟达从一家芯片公司转向提供AI计算系统的公司,他此前称,人工智能的 iPhone 时刻已经来临。

英伟达发布超级芯片 GH200 和 AI 计算平台


受 AI 热潮的推动,英伟达也在硬件领域紧跟技术潮流,发布了一系列产品和解决方案:推出大内存生成式AI超级计算机 DGX GH200,可加速生成式 AI 设计的 Grace Hopper 超级芯片 GH200 已全面投产;推出全新加速以太网平台 Spectrum-X,为游戏提供定制化 AI 模型代工服务;与全球最大的营销服务机构 WPP 合作打造生成式 AI 内容引擎,多家世界顶级电子制造商采用英伟达生成式 AI 工具与 Omniverse 平台构建先进的数字工厂。

 

据悉,NVIDIA® GH200 Grace Hopper 超级芯片将为全球各地即将上线的系统提供运行复杂 AI 和 HPC 工作负载所需的动力。在 COMPUTEX 上,黄仁勋公布了关于 GH200 Grace Hopper 超级芯片的更多细节。

 

NVIDIA® GH200 Grace Hopper 超级芯片使用 NVIDIA NVLink®-C2C 互连技术,将基于 Arm 的 NVIDIA Grace CPU 和 Hopper GPU 架构互联,实现了高达 900GB/s 的总带宽,比传统加速系统中的标准 PCIe Gen5 通道高出 7 倍,算力有了很大程度的提高,并且能够满足要求最苛刻的生成式 AI 和 HPC 应用。

 

具体来说, GH200 超级芯片是将 72 核的 Grace CPU、H100 GPU、96GB 的 HBM3 和 512 GB 的 LPDDR5X 集成在同一个封装中,拥有高达 2000 亿个晶体管。这种组合提供了 CPU 和 GPU 之间惊人的数据带宽,高达 900 GB/s,为某些内存受限的工作负载提供了巨大的优势。

 

值得一提的,英伟达正式发布了一款新型大内存 AI 超级计算机——由 NVIDIA GH200 Grace Hopper 超级芯片和 NVIDIA NVLink Switch System 驱动的 NVIDIA DGX 超级计算机,旨在助力开发面向生成式 AI 语言应用、推荐系统和数据分析工作负载的巨型、下一代模型。


DGX GH200 的细节还不太清楚,但已确认英伟达使用了一种新的 NVLink Switch 系统,包含 36 个 NVLink 开关,将 256 个 GH200 Grace Hopper 芯片和 144TB 的共享内存连接成一个单元,英伟达 CEO 黄仁勋表示,GH200 芯片为“巨型 GPU”。英伟达表示,256 颗 Grace Hopper 超级芯片将 DGX GH200 的“AI 性能”提升到了 exaflop(一百万万亿次)。

 

NVIDIA 加速计算副总裁 Ian Buck 表示:“生成式AI正在迅速带来业务变革,解锁医疗、金融、商业服务等行业的新机遇并加速这些行业的研发工作。随着 Grace Hopper 超级芯片的全面投产,全球的制造商很快将会提供企业使用专有数据构建和部署生成式 AI 应用所需的加速基础设施。”

ChatGPT 问世后,芯片行业变天了

 

2022 年,英伟达发布了 H100——这是其有史以来最强大、也最昂贵的处理器之一,单位价格约为 4 万美元。当时看来,这款产品的发布时机并不理想,企业客户纷纷在巨大的通胀压力下削减开支。

 

但就在 11 月,ChatGPT横空出世后,情况发生了变化。

 

英伟达首席执行官黄仁勋表示,“刚刚经历艰难的一年,情况似乎一夜之间就出现了转机。”OpenAI 打造的这款热门聊天机器人堪称“尤里卡时刻”(或顿悟时刻),“立即创造出巨大需求”。

 

ChatGPT 的迅速蹿红在全球领先的科技巨头和初创公司之间掀起一波军备竞赛,各方开始竞相争夺宝贵的 H100 资源。黄仁勋称这款产品是“全球首个为生成式 AI 专门设计的计算机芯片”,能够帮助 AI 系统更快输出顺畅自然的文本、图像和内容。

 

就在过去一周,在正确的时间推出正确的产品再次成为决胜的关键。英伟达上周三宣布,其截至 7 月的本季度销售额预计将达 110 亿美元,较华尔街之前的估计高出 50%以上。这波强劲浪潮背后,无疑是众多大型科技公司恢复数据中心支出和疯狂采购 AI 芯片的现实需求。

 

投资人对此番预测也给出了积极回应,仅上周四一天之内就让英伟达公司的市值增加了 1840 亿美元。于是这家已经是全球最有价值的芯片公司在估值方面开始逼近万亿大关。

 

这项技术有望重塑各行各业,带来巨大的生产力提升并取代数百万个工作岗位。

 

而 H100 芯片将加快这一技术飞跃。H100 基于名为“Hopper”的英伟达全新芯片架构,以美国编程先驱 Grace Hopper 的名字命名,如今已经是整个硅谷最炙手可热的稀缺资源。

 

黄仁勋表示,“就在我们着手将 Hopper 投入量产之际,AI 突破到来了。”也就是说,Hopper 刚好是在 ChatGPT 正式亮相的几周之前开始大规模生产。

 

黄仁勋对于持续收益的信心,很大程度来自与芯片制造巨头台积电的密切合作。双方计划扩大 H100 的生产规模,以满足微软、亚马逊和谷歌等云服务商,Meta 等互联网大厂以及其他企业客户的爆发式需求。

 

CoreWeave 是一家专注 AI 的云基础设施初创公司。作为首批收到 H100 的客户之一,公司首席战略官 Brannin McBee 表示“这已经成为地球上最稀缺的工程资源之一”。

 

也有部分客户要等待半年之久,才能拿到自己用来训练大规模数据模型的 H100 芯片供应。更多 AI 初创公司则纷纷表示担心,称在需求起飞那一刻,H100 就将面临供不应求。

英伟达成为了 AI 浪潮中的首批赢家

 

马斯克也已经为自己的 AI 初创公司 X.ai 买下大量英伟达芯片,他本人也在本周《华尔街日报》的活动中表示,目前 GPU“比药品更难获得”,还开玩笑说“而且这种情况在旧金山随处可见”。

 

“计算成本已经飙升至天文数字,最低的准入门槛也是投入 2.5 亿美元为生成式 AI 系统构建服务器硬件。”

 

事实证明,H100 特别受到微软和亚马逊等大型科技企业的欢迎。他们正纷纷建立以 AI 工作负载为中心的更多数据中心。此外,OpenAI、Anthropic、Stability AI 和 Inflection AI 等 AI 初创公司也在密切关注 H100 的性能承诺,希望借助它的力量加快产品发布、降低训练成本。

 

英伟达超大规模与高性能计算业务负责人 Ian Buck 表示,“从购买难度来讲,没错,新架构 GPU 就是不容易买到。”肩负增加 H100 以满足需求这项艰巨任务的 Buck 承认,“目前供不应求已经成为规模性事件”,部分大客户正疯狂采购数以万计的 GPU。

 

这种性能极强的芯片负责充当数据中心的“加速器”,其搭载的 800 亿个晶体管达到最新款 iPhone 处理器晶体管数的 5 倍。尽管 H100 的售价高达 2020 年发售的上代 A100 芯片的 2 倍,但早期买家纷纷表示其性能至少提高了 3 倍,所以仍然极具性价比。

 

作为 Stable Diffusion 图像生成服务背后的厂商,Stability AI 联合创始人兼 CEO Emad Mostaque 表示“H100 解决了长期困扰 AI 模型创建者的可扩展性问题”。“这非常重要,它能让我们更快训练出更大的模型,真正将研究问题转化为工程问题。”

 

虽然 H100 的发布可谓正当其时,但英伟达在 AI 领域的突破实际源自近 20 年前的软件创新。

 

英伟达的 Cuda 软件诞生于 2006 年,作用就是让 GPU 在图形之外作为其他工作负载类型的加速器。待时间来到 2012 年左右,“AI 终于找上了我们。”

 

加拿大的研究人员们很快意识到 GPU 非常适合用于创建神经网络,这是一种由人脑内神经元间相互作用启发而来的 AI 形式,后来成为 AI 开发的新焦点。Buck 感慨道,“我们花了近 20 年才最终走到了今天。”

 

英伟达如今拥有的软件工程师比硬件工程师还多,这也使其得以支持后续几年出现的多种不同类型的 AI 框架,也使其芯片在训练 AI 模型所需要的统计计算方面愈发高效。

 

Hopper 是首个针对 transformers 进行优化的架构,而 transformers 则是支持 OpenAI 聊天机器人明星的底层 AI 方法。通过与 AI 研究人员的密切合作,英伟达在 2017 年就注意到了 transformers 的出现,并开始相应调整自己的软件。

 

AI 初创企业投资方 Air Street Capital 的普通合伙人 Nathan Benaich 指出,“英伟达可以说比其他人更早看到了未来,并将重点放在了 GPU 可编程方面。在发现机遇并押下赌注之后,英伟达获得了持续领先于竞争对手的优势。”

 

Benaich 估计,英伟达比其他竞争对手要领先约两年。但他也补充称,“英伟达硬件和软件方面的市场地位恐怕还达不到坚不可摧的水平。”

 

Stability AI 的 Mostaque 对此表示赞同。“谷歌、英特尔和其他公司打造的下一代芯片正在迎头赶上。而且随着软件标准化的普及,就连 Cuda 也不足以构成可靠的技术护城河。”

 

但对 AI 领先的另一些从业者来说,华尔街本周的热情似乎有点过度乐观。不过芯片咨询公司 D2D Advisory 创始人 Jay Goldberg 仍然承认,“从目前的情况看,AI 半导体市场仍然保持着英伟达赢家通吃的局面。”

 

参考链接:

https://www.ft.com/content/315d804a-6ce1-4fb7-a86a-1fa222b77266

2023-05-30 14:397639
用户头像
李冬梅 加V:busulishang4668

发布了 1136 篇内容, 共 755.0 次阅读, 收获喜欢 1276 次。

关注

评论

发布
暂无评论
发现更多内容

JAVA编程规范之应用分层

源字节1号

软件开发 前端开发 后端开发 小程序开发

OpenAtom OpenHarmony分论坛圆满举办,生态与产业发展迈向新征程

OpenHarmony开发者

OpenHarmony

开源社区三十年 | 2022 开放原子全球开源峰会开源社区三十年专题活动圆满召开

kk-OSC

开放原子全球开源峰会

企业数字化本质

奔向架构师

数据治理 7月月更

完完整整地看完这个故事,你敢说还不懂Docker?

程序员啊叶

Java 编程 程序员 架构 java面试

巧用ngx_lua做流量分组

转转技术团队

nginx

华为发布HarmonyOS 3及全场景新品,智慧体验更进一步

极客天地

分布式定时器

腾讯企点技术团队

redis 分布式 定时器

疫情期间佩戴口罩检测之训练检测口罩模型算法实现口罩检测步骤以及报错解决

南蓬幽

Python AI OpenCV 7月月更

易观分析:以用户为中心提升手机银行用户体验,助力用户价值增长

易观分析

数据分析 用户体验 手机银行

不用Swagger,那我用啥?

江南一点雨

论治理与创新 | 2022 开放原子全球开源峰会 OpenAnolis 分论坛圆满召开

kk-OSC

开放原子全球开源峰会

要想组建敏捷团队,这些方法不可少

敏捷开发

团队管理 敏捷开发 敏捷团队

API 网关 APISIX 在Google Cloud T2A 和 T2D 的性能测试

API7.ai 技术团队

网关 API Gateway 谷歌云 网关性能测试

什么样的知识付费系统功能,更有利于平台与讲师发展?

CRMEB

本地化、低时延、绿色低碳:阿里云正式启用福州数据中心

阿里云弹性计算

公有云 本地Region

精品方案|海泰方圆全栈式数据安全治理方案 为数据设一把“安全锁”

电子信息发烧客

18张图,直观理解神经网络、流形和拓扑

OneFlow

神经网络 深度学习

AI落地难?灵雀云助力企业快速应用云原生机器学习MLOps

York

人工智能 机器学习 云原生 降本增效 MLOps

谈谈基于JS实现阻止别人调试通过控制台调试网站的问题

南极一块修炼千年的大冰块

7月月更

什么是WordPress

hum建应用专家

Wordpress 博客部署 WordPress

行业落地呈现新进展 | 2022 开放原子全球开源峰会 OpenAtom OpenHarmony 分论坛圆满召开

kk-OSC

开放原子全球开源峰会

产学研用 共建开源人才生态 | 2022 开放原子全球开源峰会教育分论坛圆满召开

kk-OSC

开放原子全球开源峰会

新闻速递 | MobTech袤博科技参与中国信通院“绿色SDK产业生态共建行动”

MobTech袤博科技

数据安全 sdk

苹果手机iCloud钥匙串的加密缺陷

神锁离线版

apple 密码管理 密码技术 icloud keychain

开源汇智创未来 | 2022 开放原子全球开源峰会 OpenAtom openEuler 分论坛圆满召开

kk-OSC

开放原子全球开源峰会

聚变云原生,赋能新里程 | 2022 开放原子全球开源峰会云原生分论坛圆满召开

kk-OSC

数字经济时代的开源数据库创新 | 2022 开放原子全球开源峰会数据库分论坛圆满召开

kk-OSC

开放原子全球开源峰会

定了!就在7月30日!

腾源会

开源

备战金九银十,Java研发面试题整理PDF,走到哪刷

程序知音

Java 程序员 java面试 后端技术 八股文

市值暴涨至万亿美元后,英伟达再放大招!推出超级AI计算平台:集成256个GH200芯片、共享内存144TB_文化 & 方法_李冬梅_InfoQ精选文章