写点什么

英伟达推出自动驾驶专用超算 DGX SuperPOD,全球排名 22

  • 2019-06-17
  • 本文字数:1052 字

    阅读完需:约 3 分钟

英伟达推出自动驾驶专用超算DGX SuperPOD,全球排名22

为了清楚地展示人工智能领导层为何需要最佳计算能力,NVIDIA 今天推出了全球排名第 22 的超级计算机:DGX SuperPOD,据英伟达官方介绍:它提供的 AI 基础设施可满足公司自动驾驶车辆部署计划的大量需求。


英伟达方面称:这套系统仅用三周时间就内置了 96 台 NVIDIA DGX-2H 超级计算机和 Mellanox 互连技术,具有 9.4 petaflops 的处理能力,可以训练安全自动驾驶车辆所需的大量深度神经网络。



而客户可以根据 DGX SuperPOD 设计从任何 DGX-2 合作伙伴购买该系统的全部或部分内容。


曾有专家表示:自动驾驶汽车的 AI 训练是计算密集型的终极挑战。


单个数据收集工具每小时产生 1TB 的数据,而相比之下,通过驾驶整个车队,可以快速获得数以 PB 计算的数据。这些巨大的数据会被用于训练关于道路规则的算法,并且在车辆中操作的深度神经网络中找到潜在的故障,然后在连续循环中重新训练。


NVIDIA 人工智能基础架构副总裁 Clement Farabet 说:“人工智能企业需要在计算基础设施领域处于领先地位,很少有人工智能挑战与训练自动驾驶汽车一样苛刻,这需要对神经网络进行数万次重新训练,以满足极端的精确度需求。”


DGX SuperPOD 由 NVIDIA NVSwitch 和 Mellanox 网络结构互连的 1,536 个 NVIDIA V100 Tensor Core GPU 提供支持,可以为其超大型计算机提供强大的性能数据。该系统能够全天候工作,优化自动驾驶软件,并以更快的周转时间重新训练神经网络。


例如,DGX SuperPOD 硬件和软件平台只需不到两分钟的时间来训练 ResNet-50。当这款 AI 模型于 2015 年问世时,当时最先进的系统:单一的 NVIDIA K80 GPU 也需要 25 天的时间来训练,而 DGX SuperPOD 提供的结果显示,训练速度提高了 18,000 倍。


虽然具有相似性能水平的其他 TOP500 系统是由数千台服务器构建的,但 DGX SuperPOD 占用的空间比排名相近的系统要小 400 倍。


据了解,NVIDIA DGX 系统已经被一些公司或组织所采用,这些企业或组织都有大量的计算需求,如从宝马、福特等汽车公司,还有包括 Facebook、微软等科技企业,甚至美国国家能源实验室也采用了这套系统。


当然,DGX SuperPOD 不仅可以快速运行深度学习模型,由于其模块化的企业级设计,它的部署速度也非常快。


一般来说,这种规模的系统通常需要 6 到 9 个月的时间来部署,但 DGX SuperPOD 仅用了三周时间就完成了部署工作。


英伟达方面表示:构建像 DGX SuperPOD 这样的超级计算机,帮助 NVIDIA 学习了如何为大型 AI 机器设计系统,它标志着超级计算技术的一次重要演变,并为学术界以及运输公司和其他希望使用高性能计算加速其计划的行业带来了巨大的力量。


2019-06-17 15:555960
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 292.8 次阅读, 收获喜欢 1305 次。

关注

评论

发布
暂无评论
发现更多内容

C++使用protobuf嵌套结构体总结

中国好公民st

c++ protobuf 10月月更

数据中台选型前必读:数据中台与大数据平台有什么区别

雨果

数据中台 大数据平台

资源成本降低80%!Serverless云函数的弹性架构实践

极客天地

大数据ELK(二十四):安装Kibana

Lansonli

10月月更 安装Kibana

Python进阶(十九)Python3安装第三方爬虫库BeautifulSoup4

No Silver Bullet

Python 字符串 10月月更 BeautifulSoup4

Jib使用小结(Maven插件版)

程序员欣宸

Docker 10月月更 Jib

React循环DOM时为什么需要添加key

beifeng1996

React

react高频面试题自测

beifeng1996

React

给 SAP BTP 创建的 Java 应用添加 Custom Event Handler 支持创建功能

汪子熙

spring 云原生 Cloud SAP 10月月更

Python进阶(二十)Python爬虫实例讲解

No Silver Bullet

Python 数据分析 10月月更

Java对象的使用和对象内存图解

共饮一杯无

Java 对象 10月月更

22道js输出顺序问题,你能做出几道

loveX001

JavaScript

JVM诊断工具中的深堆、浅堆、支配树,你都明白吗

JAVA旭阳

Java JVM 10月月更

腾讯云继续加码布局云原生,将披露全新产品战略

科技热闻

React组件之间的通信方式总结(下)

beifeng1996

React

聚焦六大典型应用场景,博云金融行业容器解决方案更新发布!

BoCloud博云

云计算 云原生 容器云

80%的前端开发都答不上来的js异步面试题

loveX001

JavaScript

面向对象思想和Java中类的定义

共饮一杯无

Java 面向对象 10月月更

为什么编程第一课都要学Hello World?

博文视点Broadview

深度解析:智能合约DAPP(bsc)币安链系统项目开发解决方案

I8O28578624

【一Go到底】第十四天---break快速入门

指剑

Go golang 10月月更

不同的子序列 II

掘金安东尼

算法 10月月更

金九银十前端面试题总结(附答案)

loveX001

JavaScript

PriorityQueue源码-成员变量解析

知识浅谈

Priority Queue 10月月更

开源无国界,从openEuler Maintainer到Spark Committer的贡献开源之路

openEuler

spark 开源 openEuler

【LeetCode】合并两个有序链表Java题解

Albert

算法 LeetCode 10月月更

SAST + SCA: 结合使用安全升级

SEAL安全

SCA 安全测试 攻击 SAST 应用安全测试

国产分布式数据库发展趋势与难点

亚信AntDB数据库

AntDB 国产数据库 AntDB数据库 企业号十月PK榜 企业号十月 PK 榜

流程引擎的架构设计

京东科技开发者

架构设计 报表 workflow BPM 流程引擎

带你认识JDK8中超nice的Native Memory Tracking

华为云开发者联盟

开发 华为云

英伟达推出自动驾驶专用超算DGX SuperPOD,全球排名22_AI&大模型_陈思_InfoQ精选文章