NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?

  • 2021-06-23
  • 本文字数:1598 字

    阅读完需:约 5 分钟

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?

特斯拉选择的是纯视觉的自动驾驶方案,这种方案对传感器的依赖较弱,但需要极强的数据处理和 AI 能力,这就使得自研适应性强的超级计算机显得很有必要。


随着自动驾驶的不断成熟,自动驾驶汽车公司对算力的需求正在呈指数级增长。在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上,特斯拉特斯拉人工智能与自动驾驶视觉总监(Director of AI and Autopilot Vision) Andrej Karpathy 公布了自家的第三个超级计算机集群,他声称这是还未发布的超级计算机 Dojo(Dojo 发音源自日语,意为 “道场”)的开发原型版本。


目前,这一开发原型版本的每秒浮点运算能力(FLOPS)已经达到世界第五的水平,而其正式版本,超级计算机 Dojo 将超越目前世界排名第一的日本超级计算机富岳(Fugaku,富士山的别名)。


特斯拉用超级计算机来做什么


其实早在 2019 年的特斯拉自动驾驶开放日 (Autonomy Day) 上,特斯拉 CEO 伊隆·马斯克就介绍过 Dojo 项目。彼时,马斯克提到,“那是一台超级强大的训练电脑,目标是能够接收大量数据并在视频级别进行培训,并使用 Dojo 程序或 Dojo 计算机对大量视频进行无监督的大规模训练 (unsupervised massive training)”。


Dojo 已经是特斯拉第三个自研的超级计算机项目了。那么,作为一家自动驾驶的车企,特斯拉为何要执着于打造超级计算机呢?


超级计算机(Super Computer),通常是体量巨大、造价高昂的设备,拥有数以万计的处理器,其能够执行一般个人电脑无法处理的高速运算,规格与性能比个人计算机强大许多。常用于需要大量运算的工作,譬如数值天气预报、运算化学、分子模型、天体物理模拟、汽车设计模拟、密码分析等。


对于自动驾驶车企而言,典型的自动驾驶解决方案有三种,分别是:1)基于视觉主导,采用 GPS 地图结合 AI 人工智能进行自动驾驶;2)基于激光雷达主导,视觉辅导,采用高精度地图和人工智能进行自动驾驶;3)基于车联网主导,多种传感器融合的人工智能自动驾驶。特斯拉选择的是第一种纯视觉的自动驾驶方案,这种方案对传感器的依赖较弱,但需要极强的数据处理和 AI 能力,这就使得自研适应性强的超级计算机显得很有必要。


在马斯克的介绍中,Dojo 将配合无监督学习算法(unsupervised learning)来减少特斯拉对于人工标注数据的工作量,进而帮助其实现指数级的数据训练效率提升。(注:无监督学习算法即无需人工对训练数据集进行标注,系统可以自行根据样本间的统计规律对样本集进行分析。如不给任何额外提示的情况下,仅依据一定数量“狗”的图片特征,将“狗”的图片区分出来)。


Dojo 的性能如何


在 2019 年特斯拉 AI Day 现场,马斯克说到“Dojo 使用我们自己的芯片和针对神经网络训练而优化的计算机架构,而不是 GPU 集群。如果我没弄错,这将是世界上最好的”。


如今,对于 Dojo 的雏形机,Karpathy 在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上表示,“我们展示的是使用 720 个 80GB 版本的 8x A100 节点构建的集群。这是一台巨大的超级计算机,就每秒浮点(FLOPS)运算次数而言,我认为它可能是全球第五的超级计算机。第五位目前由英伟达公司的 Selene 集群占据,该集群拥有非常相似的架构和类似的 GPU 数量(4480 对我们的 5760,所以少一点)”。


而对于 Dojo 最终发布的期望,特斯拉在 2020 年发布的推文中表示,Dojo 能够实现每秒千万亿次浮点运算(1000 PFLOPS),这将使得 Dojo 成为一款真正的尖端超级计算机。未来,Dojo 的算力将要达到每秒钟 exaFLOP(百亿亿次, 是千万亿次 PFLOPS 的 1000 倍) 的级别,并且运算速度要超过富岳(Fugaku),成为世界第一。


而富岳是目前世界上速度最快的超级计算机,其浮点计算的峰值速度可达到 442PFLOPS(每秒 442 x 1 千万亿次浮点运算),最高性能超过 1000 PFLOPS。




在 2020 年的世界超级计算机大会上(SC20),位列前五的超级计算机分别是,日本的富岳 Fugaku,美国的 Summit ,美国的 Sierra,中国的“神威·太湖之光” 和美国的 Selene。

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-06-23 17:001688
用户头像

发布了 74 篇内容, 共 26.7 次阅读, 收获喜欢 83 次。

关注

评论

发布
暂无评论
发现更多内容

RestCloud AppLink已支持的数据源有哪些?

RestCloud

零代码 APPlink 自动化集成

同济 MBA × 和鲸:聚焦商业数据思维培养,赋能工管人才转型升级

ModelWhale

人才培养 企业数字化转型 数智化 MBA 同济大学

聚势启新,KaiwuDB 生态联盟沙龙首站落地长春

KaiwuDB

Docker 和 Kubernetes:技术相同和不同之处

EquatorCoco

Docker k8s K8s 多集群管理 kubernetes 运维

探索向量数据库 | 重新定义数据存储与分析

-亦世凡华、

数据库 亚马逊云科技 向量数据库

常见光模块的封装类型有哪些?

小魏写代码

特权账号管理之定期改密篇

尚思卓越

网络安全 定期改密

崩溃的阿里云,并非是单纯的坏事?

ToB行业头条

文心一言 VS 讯飞星火 VS chatgpt (134)-- 算法导论11.2 6题

福大大架构师每日一题

福大大架构师每日一题

公司让我开发一个管理系统,有了它,So easy!

互联网工科生

软件开发 低代码 快速开发 JNPF

Kubernetes Operator可以做什么?

高端章鱼哥

kubernetes 运维

在HarmonyOS上实现ArkTS与H5的交互

HarmonyOS开发者

HarmonyOS

为什么 Amazon Bedrock 中的模型只有部分可用?

花花

亚马逊云科技

全域全自主建设,亚信科技AntDB数据库助力广电5G业务上线运行

亚信AntDB数据库

数据库 AntDB AntDB数据库

时序数据库 TDengine + 高级分析软件 Seeq,助力企业挖掘时序数据潜力

TDengine

tdengine 时序数据库

低代码平台如何提高开发效率?

高端章鱼哥

软件开发 低代码 JNPF

重磅!科技感拉满!

天翼云开发者社区

人工智能 云计算

DAZ Studio for Mac(专业三维人物动画制作工具) 4.20.0.17永久激活版

mac

苹果mac Windows软件 DAZ Studio 3D造型渲染软件

VPC终端节点的实现架构和原理

天翼云开发者社区

VPC终端节点

英特尔锐炫GPU助力AI向大众用户市场普及

E科讯

正式开源!网易有道上线“易魔声”语音合成引擎

有道技术团队

人工智能 语音合成 TTS

Util应用框架基础(六)- 日志记录 - File

何镇汐

开源 后端 软件开发

Util应用框架基础(六)- 日志记录 - Seq

何镇汐

开源 后端 软件开发

数据结构与算法 | 记忆化搜索(Memorize Search)

不在线第一只蜗牛

数据结构 算法 数据

Util应用框架基础(六)- 日志记录 - Exceptionless

何镇汐

开源 后端 软件开发

紧密合作三周年,Elastic颁发腾讯云2022年杰出开源贡献奖

腾讯云大数据

ES

云图说|华为云主机安全新版本上线

华为云开发者联盟

华为云 华为云开发者联盟 华为云云图说

Layer 2 真的为以太坊扩容了吗?

Footprint Analytics

以太坊 Layer 2

在AI时代,提升程序员竞争力的关键策略

不在线第一只蜗牛

人工智能 编程 程序员 AI

「我在淘天做技术」假如你五行属商家,如何算好账?

阿里技术

财务 算好账 财务开发

重磅!天翼云发布一站式智算服务平台“慧聚”

天翼云开发者社区

人工智能 云计算 云服务 云平台

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?_AI&大模型_施尧_InfoQ精选文章