InfoQ Geekathon 大模型技术应用创新大赛 了解详情
写点什么

Meta 宣布推出新一代 AI 硬件平台 Grand Teton,将英伟达 Hopper 架构引入数据中心

  • 2022-11-17
    北京
  • 本文字数:1098 字

    阅读完需:约 4 分钟

Meta宣布推出新一代AI硬件平台Grand Teton,将英伟达 Hopper 架构引入数据中心

最近,Meta宣布推出下一代用于人工智能训练的硬件平台Grand Teton,与前代相比有多项优化,包括两倍的网络带宽及四倍的主机到 CPU 带宽升级。


Meta 公司工程副总裁Alex Bjorlin于近期的开放计算项目(OCP)全球峰会的主题演讲中宣布了这一消息。Grand Teton 的开放硬件设计是 Meta 对数据中心人工智能工作负载的最新迭代贡献,与前一代由三个“盒子”组成的 Zion-EX 不同,Grand Teton 的集成机箱让它可以更快、更容易地部署。Meta 还为 Grand Teton 设计了一个新的数据中心机架和冷却系统,用于支撑大型人工智能模型训练所需要的服务集群电力需求。Bjorlin 称:


Meta 是全心全意支持人工智能的,但人工智能的未来不可能完全由我们创造,而是通过合作,通过如 OCP 一样的组织分享想法和技术来创造。我们渴望继续合作,建立新的工具和技术以推进人工智能的未来。希望人们能加入我们的各种努力,无论是现在开发新的人工智能方法,还是从根本上重新思考未来的软硬件设计,我们对这个行业的未来发展非常乐观。


Meta 训练并部署了许多大型人工智能模型,其中不乏包含数万亿参数,需要等量规模数据集训练的模型,这也意味着他们会需要大量与 GPU 互联的服务器。Meta 自 2016 年起便开源了他们的人工智能硬件设计,且推出了Big Sur平台。去年,InfoQ 同步报道了 Meta 的最新迭代Zion-EX平台,该迭代是由数千计算节点组成集群,其中每个节点都含有四个 CPU 插座和八个 GPU。


图源:https://engineering.fb.com/2022/10/18/open-source/ocp-summit-2022-grand-teton/


然而,Zion 平台的每个节点都需要外部布线才能整合三个不同的组件:CPU“头部”、GPU 系统,以及一个交换系统。全新的 Grand Teton 则将这些组件全部整合到一个机箱之中,且该机箱也包括了电源、计算和网络接口,“以实现更好的整体性能、信号完整性和散热性能”。英伟达称,Grand Teton 还拥有英伟达基于Hopper架构H100 Tensor核心GPU。Meta 还更新了他们的底层存储平台:新版本的Grand Canyon在前代 Bryce Canyon 架构的基础上进行了改进,让 Meta 公司“达到驱动器的极限水平”。


在 Grand Teton 的设计之外,Meta 公司还发布了一款数据中心机架设计:开放式机架v3(ORV3)。与其他将电源架直连母线的机甲不同,ORV3 的电源架可以安装在任何位置,设计更加灵活。改进后的备用电源与前代仅支持 90 秒的供电相比,可提供长达四分钟的供电。ORV3 还支持多个电源架和 48 VDC 的输出,可部署处理高达 30 kW 的机架。Meta 还为这代更高的功率容量设计了新的冷却策略:ORV3 支持空气辅助液冷,设施水冷,以及“可选盲配液体冷却接口设计”。


Meta 公司设计的可互动 3D 模型可在这个官网找到。

 

原文链接:

Meta Announces Next Generation AI Hardware Platform Grand Teton

活动推荐:

2023年9月3-5日,「QCon全球软件开发大会·北京站」 将在北京•富力万丽酒店举办。此次大会以「启航·AIGC软件工程变革」为主题,策划了大前端融合提效、大模型应用落地、面向 AI 的存储、AIGC 浪潮下的研发效能提升、LLMOps、异构算力、微服务架构治理、业务安全技术、构建未来软件的编程语言、FinOps 等近30个精彩专题。咨询购票可联系票务经理 18514549229(微信同手机号)。

2022-11-17 08:003510

评论

发布
暂无评论
发现更多内容

如何做好高并发系统设计

架构精进之路

高并发 8月日更

你的孩子爱读书吗

箭上有毒

8月日更

Django QuerySet 就学那么一点点,一点点就够了

梦想橡皮擦

8月日更

Java 项目还需要 joda 吗

HoneyMoose

「让我们一起Golang」怎样出让协程资源和设置可用CPU核心数

Regan Yue

高并发 协程 Go 语言 8月日更

rosedb 事务实践

roseduan

数据库 事务 存储 KV存储引擎

Java实现基于朴素贝叶斯的情感词分析

码农参上

Java 贝叶斯公式 文本情感分析 8月日更

Swift 仿自如 App 裸眼 3D 效果

fuyoufang

ios swift 8月日更

对数字化的审视思维

boshi

数字化转型

占楼

IT蜗壳-Tango

8月日更

【设计模式】迭代器模式

Andy阿辉

C# 后端 设计模式 8月日更

oeasy教您玩转vim - 16 - # 行内贴靠

o

摸鱼小技巧之IDEA调试篇一

4ye

Java debug 后端 IDEA 8月日更

B 端产品经理如何快速成长?

蒋川

数据产品经理 b端产品经理

ISO-8601 如何解读

HoneyMoose

【Dubbo3.0技术专题】总体技术体系介绍及技术指南(序章)

洛神灬殇

dubbo RPC 8月日更 Dubbo3

数据库知识整理

十二万伏特皮卡丘

【Flutter 专题】67 图解基本约束 Box (二)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 8月日更

手撸二叉树之二叉树的中序遍历

HelloWorld杰少

数据结构与算法 8月日更

架构实战营毕业总结

Vic

架构实战营

Linux之telnet命令

入门小站

Linux

装机必备的软件里,绝对不能少了这一款 | 剪贴板增强工具

彭宏豪95

效率 工具 windows 实用工具

Intellij运行Java程序启动等待BUG分享

FunTester

Java IDEA intellij bug

面向用户的产品进度汇报会

boshi

项目管理 客户

飞书 + Lua 实现企业级组织架构登录认证

K8sCat

lua openresty 网关 飞书 组织架构

聊聊Java数据类型的那些事

Bob

Java 后端 8月日更

架构实战营毕设

Vic

架构实战营

spring 循环依赖与三级缓存

Rubble

springboot 8月日更

在线IP地址查询工具

入门小站

工具

NDK 使用入门

Changing Lin

8月日更

Vue进阶(三十二):npm install、npm install --save与 npm install --save-dev 区别

No Silver Bullet

Vue 8月日更

  • 扫码添加小助手
    领取最新资料包
Meta宣布推出新一代AI硬件平台Grand Teton,将英伟达 Hopper 架构引入数据中心_AI_Anthony Alford_InfoQ精选文章