【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?

  • 2021-06-23
  • 本文字数:1598 字

    阅读完需:约 5 分钟

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?

特斯拉选择的是纯视觉的自动驾驶方案,这种方案对传感器的依赖较弱,但需要极强的数据处理和 AI 能力,这就使得自研适应性强的超级计算机显得很有必要。


随着自动驾驶的不断成熟,自动驾驶汽车公司对算力的需求正在呈指数级增长。在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上,特斯拉特斯拉人工智能与自动驾驶视觉总监(Director of AI and Autopilot Vision) Andrej Karpathy 公布了自家的第三个超级计算机集群,他声称这是还未发布的超级计算机 Dojo(Dojo 发音源自日语,意为 “道场”)的开发原型版本。


目前,这一开发原型版本的每秒浮点运算能力(FLOPS)已经达到世界第五的水平,而其正式版本,超级计算机 Dojo 将超越目前世界排名第一的日本超级计算机富岳(Fugaku,富士山的别名)。


特斯拉用超级计算机来做什么


其实早在 2019 年的特斯拉自动驾驶开放日 (Autonomy Day) 上,特斯拉 CEO 伊隆·马斯克就介绍过 Dojo 项目。彼时,马斯克提到,“那是一台超级强大的训练电脑,目标是能够接收大量数据并在视频级别进行培训,并使用 Dojo 程序或 Dojo 计算机对大量视频进行无监督的大规模训练 (unsupervised massive training)”。


Dojo 已经是特斯拉第三个自研的超级计算机项目了。那么,作为一家自动驾驶的车企,特斯拉为何要执着于打造超级计算机呢?


超级计算机(Super Computer),通常是体量巨大、造价高昂的设备,拥有数以万计的处理器,其能够执行一般个人电脑无法处理的高速运算,规格与性能比个人计算机强大许多。常用于需要大量运算的工作,譬如数值天气预报、运算化学、分子模型、天体物理模拟、汽车设计模拟、密码分析等。


对于自动驾驶车企而言,典型的自动驾驶解决方案有三种,分别是:1)基于视觉主导,采用 GPS 地图结合 AI 人工智能进行自动驾驶;2)基于激光雷达主导,视觉辅导,采用高精度地图和人工智能进行自动驾驶;3)基于车联网主导,多种传感器融合的人工智能自动驾驶。特斯拉选择的是第一种纯视觉的自动驾驶方案,这种方案对传感器的依赖较弱,但需要极强的数据处理和 AI 能力,这就使得自研适应性强的超级计算机显得很有必要。


在马斯克的介绍中,Dojo 将配合无监督学习算法(unsupervised learning)来减少特斯拉对于人工标注数据的工作量,进而帮助其实现指数级的数据训练效率提升。(注:无监督学习算法即无需人工对训练数据集进行标注,系统可以自行根据样本间的统计规律对样本集进行分析。如不给任何额外提示的情况下,仅依据一定数量“狗”的图片特征,将“狗”的图片区分出来)。


Dojo 的性能如何


在 2019 年特斯拉 AI Day 现场,马斯克说到“Dojo 使用我们自己的芯片和针对神经网络训练而优化的计算机架构,而不是 GPU 集群。如果我没弄错,这将是世界上最好的”。


如今,对于 Dojo 的雏形机,Karpathy 在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上表示,“我们展示的是使用 720 个 80GB 版本的 8x A100 节点构建的集群。这是一台巨大的超级计算机,就每秒浮点(FLOPS)运算次数而言,我认为它可能是全球第五的超级计算机。第五位目前由英伟达公司的 Selene 集群占据,该集群拥有非常相似的架构和类似的 GPU 数量(4480 对我们的 5760,所以少一点)”。


而对于 Dojo 最终发布的期望,特斯拉在 2020 年发布的推文中表示,Dojo 能够实现每秒千万亿次浮点运算(1000 PFLOPS),这将使得 Dojo 成为一款真正的尖端超级计算机。未来,Dojo 的算力将要达到每秒钟 exaFLOP(百亿亿次, 是千万亿次 PFLOPS 的 1000 倍) 的级别,并且运算速度要超过富岳(Fugaku),成为世界第一。


而富岳是目前世界上速度最快的超级计算机,其浮点计算的峰值速度可达到 442PFLOPS(每秒 442 x 1 千万亿次浮点运算),最高性能超过 1000 PFLOPS。




在 2020 年的世界超级计算机大会上(SC20),位列前五的超级计算机分别是,日本的富岳 Fugaku,美国的 Summit ,美国的 Sierra,中国的“神威·太湖之光” 和美国的 Selene。

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2021-06-23 17:001668
用户头像

发布了 74 篇内容, 共 26.5 次阅读, 收获喜欢 83 次。

关注

评论

发布
暂无评论
发现更多内容

融云荣获“2021 数字化服务创新成长企业”奖

融云 RongCloud

Linux中如何设置SSH密钥提升登陆安全性

恒生LIGHT云社区

Linux SSH

实现一个javaagent需要几步?

BUG侦探

Java javaagent IAST

艾瑞发布《2021 年全球互联网通信云行业研究报告》,融云持续领跑市场

融云 RongCloud

大数据埋点如何实现、验证和管理

融云 RongCloud

从了解洞态 IAST 到加入开源社区

火线安全

DevSecOps IAST

前端开发SpringBoot之接口文档的生成

@零度

前端开发 springboot

☕【权限设计系列】「认证授权专题」史上最全的权限认证服务的权限模型大全

洛神灬殇

架构设计 12月日更 权限设计 功能设计

恒源云(GPUSHARE)_有关【图像平滑】的论文小记

恒源云

深度学习 CV 图像处理

风云再起之国产数据库风云榜-2021年12月

墨天轮

数据库 opengauss TiDB 国产数据库

应用落地 智创未来 | 2021新一代人工智能院士高峰论坛昇腾人工智能应用专场成功举办

OpenI启智社区

人工智能 昇腾

Linux之find命令

入门小站

Linux

在线JSON转Mongoose工具

入门小站

工具

Token机制相对于Cookie机制的优势

郑州埃文科技

数据库 IP Token API

有没有好用的低代码平台,支持本地私有化部署的?

优秀

低代码 私有化部署

白帽近距离|TimeLine Sec安全团队威猛先生

火线安全

多因子认证是什么意思?与双因子认证有什么区别?

行云管家

身份认证 双因子认证 账户安全

带你熟悉鸿蒙轻内核Kconfig使用指南

华为云开发者联盟

Python 鸿蒙 LiteOS-M Kconfig kconfiglib

百度APP视频播放中的解码优化

百度开发者中心

视频 解码技术

基于DataX的数据同步(上)-DataX介绍以及安装

恒生LIGHT云社区

MySQL 数据库 数据同步 DataX

遥遥无期

Tiger

28天写作

58 K8S之集群日志系统

穿过生命散发芬芳

k8s 28天写作 12月日更

Orillusion | 第一个WebGPU中文社区

Orillusion

WebGL 渲染 元宇宙 Metaverse webgpu

2022年之前,你不得不了解的一些 DevOps 趋势

SoFlu软件机器人

物联网之智慧农业应用分析&大数据之数据挖掘技术的应用

亚马逊云科技 (Amazon Web Services)

人工智能 云计算 大数据 物联网

模型黑盒|机器学习模型的“可解释性”研究

索信达控股

神经网络 机器学习 神经网络模型

25年,初心未改。

澳鹏Appen

人工智能 机器学习 训练数据 数据训练

深入Java线程池:从设计思想到源码解读

Ayue、

线程池

泉州有几家正规等保测评公司?在哪里?叫什么名字?

行云管家

网络安全 等保 等级保护 等保测评

【架构师训练营】模块三作业

樰巳-堕~Horry

架构实战营 「架构实战营」

直播连麦的人工智能回声消除技术探索

融云 RongCloud

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?_AI&大模型_施尧_InfoQ精选文章