英伟达推出自动驾驶专用超算DGX SuperPOD，全球排名22_AI&大模型_陈思_InfoQ精选文章

英伟达推出自动驾驶专用超算DGX SuperPOD，全球排名22

为了清楚地展示人工智能领导层为何需要最佳计算能力，NVIDIA 今天推出了全球排名第 22 的超级计算机：DGX SuperPOD，据英伟达官方介绍：它提供的 AI 基础设施可满足公司自动驾驶车辆部署计划的大量需求。

英伟达方面称：这套系统仅用三周时间就内置了 96 台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术，具有 9.4 petaflops 的处理能力，可以训练安全自动驾驶车辆所需的大量深度神经网络。

而客户可以根据 DGX SuperPOD 设计从任何 DGX-2 合作伙伴购买该系统的全部或部分内容。

曾有专家表示：自动驾驶汽车的 AI 训练是计算密集型的终极挑战。

单个数据收集工具每小时产生 1TB 的数据，而相比之下，通过驾驶整个车队，可以快速获得数以 PB 计算的数据。这些巨大的数据会被用于训练关于道路规则的算法，并且在车辆中操作的深度神经网络中找到潜在的故障，然后在连续循环中重新训练。

NVIDIA 人工智能基础架构副总裁 Clement Farabet 说：“人工智能企业需要在计算基础设施领域处于领先地位，很少有人工智能挑战与训练自动驾驶汽车一样苛刻，这需要对神经网络进行数万次重新训练，以满足极端的精确度需求。”

DGX SuperPOD 由 NVIDIA NVSwitch 和 Mellanox 网络结构互连的 1,536 个 NVIDIA V100 Tensor Core GPU 提供支持，可以为其超大型计算机提供强大的性能数据。该系统能够全天候工作，优化自动驾驶软件，并以更快的周转时间重新训练神经网络。

例如，DGX SuperPOD 硬件和软件平台只需不到两分钟的时间来训练 ResNet-50。当这款 AI 模型于 2015 年问世时，当时最先进的系统：单一的 NVIDIA K80 GPU 也需要 25 天的时间来训练，而 DGX SuperPOD 提供的结果显示，训练速度提高了 18,000 倍。

虽然具有相似性能水平的其他 TOP500 系统是由数千台服务器构建的，但 DGX SuperPOD 占用的空间比排名相近的系统要小 400 倍。

据了解，NVIDIA DGX 系统已经被一些公司或组织所采用，这些企业或组织都有大量的计算需求，如从宝马、福特等汽车公司，还有包括 Facebook、微软等科技企业，甚至美国国家能源实验室也采用了这套系统。

当然，DGX SuperPOD 不仅可以快速运行深度学习模型，由于其模块化的企业级设计，它的部署速度也非常快。

一般来说，这种规模的系统通常需要 6 到 9 个月的时间来部署，但 DGX SuperPOD 仅用了三周时间就完成了部署工作。

英伟达方面表示：构建像 DGX SuperPOD 这样的超级计算机，帮助 NVIDIA 学习了如何为大型 AI 机器设计系统，它标志着超级计算技术的一次重要演变，并为学术界以及运输公司和其他希望使用高性能计算加速其计划的行业带来了巨大的力量。

评论

发布

暂无评论

Create 2024 分论坛：百度大模型安全解决方案护航开发者一起创造未来

调试 WebSocket API 教程实践

程序员前端后端 websocket WebSocket API

TiDB与MySQL在备份容灾体系的衡量对比

TiDB 社区干货传送门

管理与运维

TiDB 版本升级常见问题处理（v6.0 及以上版本）

TiDB 社区干货传送门

版本升级故障排查/诊断

记一次某节点没有Leader的问题分析

TiDB 社区干货传送门

实践案例故障排查/诊断 7.x 实践

工程中实践的微服务设计模式

京东科技开发者

NL2SQL实践系列(2)：2024最新模型实战效果(Chat2DB-GLM、书生·浦语2、InternLM2-SQL等)以及工业级案例教学

汀丶人工智能

text2sql NL2SQL

我们开源啦！一键部署免费使用！Kubernetes上直接运行大数据平台！

智领云科技

开源大数据平台 K8s 多集群管理

旅游电商的智能化升级：携程景点详情API引领新潮流

技术冰糖葫芦

API 接口 API 测试 pinduoduo API

PTCP认真学习始（不是错别字，啊喂

TiDB 社区干货传送门

社区活动学习&认证&课程

尝鲜 TiDB 企业管理器TEM 2.1.3 新版本

TiDB 社区干货传送门

AI从入门到入门之手写数字识别模型java方式Dense全连接神经网络实现

京东科技开发者

TiDB学习认证之路：数据库界的“快乐大本营”

TiDB 社区干货传送门

社区活动学习&认证&课程

云PBX的相关介绍

cts喜友科技

通信通讯云通讯

Kafka 线上性能调优

不在线第一只蜗牛

kafka 分布式

Python与数据库交互的最佳实践

技术冰糖葫芦

api 货币化 API 接口 pinduoduo API

RocketMQ 存储机制浅析

字节跳动云原生计算

企业im即时通讯工具推荐，企业内部即时通讯软件工具怎么选？

TiDB Vector抢先体验之用TiDB实现以图搜图

TiDB 社区干货传送门

数据库架构选型新版本/特性解读数据库前沿趋势

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道

汀丶人工智能

自然语言处理 text2sql NL2SQL

全球AI音乐会，第一次听见中国声音

WorkPlus企业即时通讯国密加固-为企业信息安全保障

一个游戏服务器多少钱?价格与配置的完美指南

一只扑棱蛾子

HAS2024：华为云以系统性创新加速千行万业智能化升级

华为云开发者联盟

云计算华为云华为云开发者联盟企业号2024年4月PK榜 HAS2024

TiDB 新特性解读（6.0~6.6）

TiDB 社区干货传送门

管理与运维版本测评新版本/特性解读 6.x 实践 7.x 实践

写给职场新人｜从迷茫到屡获殊荣的技术人成长之路

京东科技开发者

高效的 API 自动化测试

Jmeter 自动化测试 API测试测试工具 API 自动化测试

BizDevOps全局建设思路：横向串联，纵向深化

DevOps Dev Ops BizDevOps