10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

英伟达推出自动驾驶专用超算 DGX SuperPOD,全球排名 22

  • 2019-06-17
  • 本文字数:1052 字

    阅读完需:约 3 分钟

英伟达推出自动驾驶专用超算DGX SuperPOD,全球排名22

为了清楚地展示人工智能领导层为何需要最佳计算能力,NVIDIA 今天推出了全球排名第 22 的超级计算机:DGX SuperPOD,据英伟达官方介绍:它提供的 AI 基础设施可满足公司自动驾驶车辆部署计划的大量需求。


英伟达方面称:这套系统仅用三周时间就内置了 96 台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术,具有 9.4 petaflops 的处理能力,可以训练安全自动驾驶车辆所需的大量深度神经网络。



而客户可以根据 DGX SuperPOD 设计从任何 DGX-2 合作伙伴购买该系统的全部或部分内容。


曾有专家表示:自动驾驶汽车的 AI 训练是计算密集型的终极挑战。


单个数据收集工具每小时产生 1TB 的数据,而相比之下,通过驾驶整个车队,可以快速获得数以 PB 计算的数据。这些巨大的数据会被用于训练关于道路规则的算法,并且在车辆中操作的深度神经网络中找到潜在的故障,然后在连续循环中重新训练。


NVIDIA 人工智能基础架构副总裁 Clement Farabet 说:“人工智能企业需要在计算基础设施领域处于领先地位,很少有人工智能挑战与训练自动驾驶汽车一样苛刻,这需要对神经网络进行数万次重新训练,以满足极端的精确度需求。”


DGX SuperPOD 由 NVIDIA NVSwitch 和 Mellanox 网络结构互连的 1,536 个 NVIDIA V100 Tensor Core GPU 提供支持,可以为其超大型计算机提供强大的性能数据。该系统能够全天候工作,优化自动驾驶软件,并以更快的周转时间重新训练神经网络。


例如,DGX SuperPOD 硬件和软件平台只需不到两分钟的时间来训练 ResNet-50。当这款 AI 模型于 2015 年问世时,当时最先进的系统:单一的 NVIDIA K80 GPU 也需要 25 天的时间来训练,而 DGX SuperPOD 提供的结果显示,训练速度提高了 18,000 倍。


虽然具有相似性能水平的其他 TOP500 系统是由数千台服务器构建的,但 DGX SuperPOD 占用的空间比排名相近的系统要小 400 倍。


据了解,NVIDIA DGX 系统已经被一些公司或组织所采用,这些企业或组织都有大量的计算需求,如从宝马、福特等汽车公司,还有包括 Facebook、微软等科技企业,甚至美国国家能源实验室也采用了这套系统。


当然,DGX SuperPOD 不仅可以快速运行深度学习模型,由于其模块化的企业级设计,它的部署速度也非常快。


一般来说,这种规模的系统通常需要 6 到 9 个月的时间来部署,但 DGX SuperPOD 仅用了三周时间就完成了部署工作。


英伟达方面表示:构建像 DGX SuperPOD 这样的超级计算机,帮助 NVIDIA 学习了如何为大型 AI 机器设计系统,它标志着超级计算技术的一次重要演变,并为学术界以及运输公司和其他希望使用高性能计算加速其计划的行业带来了巨大的力量。


2019-06-17 15:556040
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 299.7 次阅读, 收获喜欢 1306 次。

关注

评论

发布
暂无评论
发现更多内容

CoinList打新以太坊虚拟机Neon

币离海

以太坊虚拟机 neon Coinlist Solana

【Netty】「NIO」(四)消息边界与可写事件

sidiot

Java 后端 Netty 6 月 优质更文活动

瓴羊Quick BI报表分析工具,大幅提升企业经营效率

夜雨微澜

开源赋能 工业铸魂 | 2023开放原子全球开源峰会开源工业软件分论坛即将启幕

开放原子开源基金会

开源 开放原子全球开源峰会 开源工业软件

红杉中国独立,艰难时期“美元基金”投资路径浮出水面

B Impact

聊聊那些奇葩的代码规范 —— 滥用 lombok

HoneyMoose

Unlimiformer:用搜索的思路来处理注意力机制长度限制

Zilliz

Transformer

能力,责任心和危机感(67/100)

hackstoic

管理

如何设计一组会出现死锁(Deadlock)的 ABAP 程序

汪子熙

Java 死锁 SAP abap 6 月 优质更文活动

首款搭载OpenHarmony 3.2的智能POS终端通过“开源鸿蒙”兼容性测评

科技热闻

阿里P8现身说法,解密“架构”原理与实战笔记:从分布式到微服务

Java 架构 分布式 微服务

首个锚定BTC Mining算力的HAG证券通证,或成传统投资者的另一选择

股市老人

文心一言 VS 讯飞星火 VS chatgpt (34)-- 算法导论5.3 1题

福大大架构师每日一题

福大大 ChatGPT

深度学习应用篇-计算机视觉-图像分类[3]:ResNeXt、Res2Net、Swin Transformer、Vision Transformer等模型结构、实现、模型特点详细介绍

汀丶人工智能

人工智能 深度学习 计算机视觉 图像分类 6 月 优质更文活动

C语言编程—预处理器

芯动大师

C语言 预处理器 6 月 优质更文活动

JMeter笔记10 | JMeter检查点

测试 Jmeter 性能测试 自动化测试 接口测试

ESP8266获取天气预报信息,并使用CJSON解析天气预报数据

DS小龙哥

6 月 优质更文活动

GitOps 最佳实践(上)| 基于 Amazon EKS 构建 CI/CD 流水线

亚马逊云科技 (Amazon Web Services)

微服务

程序员如何成长

光毅

成长 程序员‘

ChatGPT赋能产品管理

俞凡

人工智能 产品管理 ChatGPT

来自大佬的洗礼!全网独家的SpringBoot核心文档,讲的太清晰了

Java Spring Boot

搞定大模型,AI 大底座系列云智公开课 6 月 20 日开始上线

Baidu AICLOUD

大模型 AI 大底座

开放源代码平台Flynn的架构与实现原理

穿过生命散发芬芳

Flynn 6 月 优质更文活动

Flink实例:Flink流处理程序编程模型

TiAmo

scala 数据流 Flink 平台 6 月 优质更文活动

2023-06-07:Redis 持久化方式有哪些?以及有什么区别?

福大大架构师每日一题

redis 福大大

【Python金融-002】快速计算收益,批量做T必备!

程序员晚枫

Python 数据分析 金融 股票 做T

LeetCode:2695. 包装数组,详细解释

Lee Chen

JavaScript LeetCode

架构模块一作业

sandywrh

Java 8升级Java 17过程记录

程序员架构进阶

jdk8 升级 java17 6月月更 6 月 优质更文活动

Web 界面开发指南,持续更新

南城FE

CSS 前端 交互设计

英伟达推出自动驾驶专用超算DGX SuperPOD,全球排名22_AI&大模型_陈思_InfoQ精选文章