写点什么

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?

  • 2021-06-23
  • 本文字数:1598 字

    阅读完需:约 5 分钟

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?

特斯拉选择的是纯视觉的自动驾驶方案,这种方案对传感器的依赖较弱,但需要极强的数据处理和 AI 能力,这就使得自研适应性强的超级计算机显得很有必要。


随着自动驾驶的不断成熟,自动驾驶汽车公司对算力的需求正在呈指数级增长。在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上,特斯拉特斯拉人工智能与自动驾驶视觉总监(Director of AI and Autopilot Vision) Andrej Karpathy 公布了自家的第三个超级计算机集群,他声称这是还未发布的超级计算机 Dojo(Dojo 发音源自日语,意为 “道场”)的开发原型版本。


目前,这一开发原型版本的每秒浮点运算能力(FLOPS)已经达到世界第五的水平,而其正式版本,超级计算机 Dojo 将超越目前世界排名第一的日本超级计算机富岳(Fugaku,富士山的别名)。


特斯拉用超级计算机来做什么


其实早在 2019 年的特斯拉自动驾驶开放日 (Autonomy Day) 上,特斯拉 CEO 伊隆·马斯克就介绍过 Dojo 项目。彼时,马斯克提到,“那是一台超级强大的训练电脑,目标是能够接收大量数据并在视频级别进行培训,并使用 Dojo 程序或 Dojo 计算机对大量视频进行无监督的大规模训练 (unsupervised massive training)”。


Dojo 已经是特斯拉第三个自研的超级计算机项目了。那么,作为一家自动驾驶的车企,特斯拉为何要执着于打造超级计算机呢?


超级计算机(Super Computer),通常是体量巨大、造价高昂的设备,拥有数以万计的处理器,其能够执行一般个人电脑无法处理的高速运算,规格与性能比个人计算机强大许多。常用于需要大量运算的工作,譬如数值天气预报、运算化学、分子模型、天体物理模拟、汽车设计模拟、密码分析等。


对于自动驾驶车企而言,典型的自动驾驶解决方案有三种,分别是:1)基于视觉主导,采用 GPS 地图结合 AI 人工智能进行自动驾驶;2)基于激光雷达主导,视觉辅导,采用高精度地图和人工智能进行自动驾驶;3)基于车联网主导,多种传感器融合的人工智能自动驾驶。特斯拉选择的是第一种纯视觉的自动驾驶方案,这种方案对传感器的依赖较弱,但需要极强的数据处理和 AI 能力,这就使得自研适应性强的超级计算机显得很有必要。


在马斯克的介绍中,Dojo 将配合无监督学习算法(unsupervised learning)来减少特斯拉对于人工标注数据的工作量,进而帮助其实现指数级的数据训练效率提升。(注:无监督学习算法即无需人工对训练数据集进行标注,系统可以自行根据样本间的统计规律对样本集进行分析。如不给任何额外提示的情况下,仅依据一定数量“狗”的图片特征,将“狗”的图片区分出来)。


Dojo 的性能如何


在 2019 年特斯拉 AI Day 现场,马斯克说到“Dojo 使用我们自己的芯片和针对神经网络训练而优化的计算机架构,而不是 GPU 集群。如果我没弄错,这将是世界上最好的”。


如今,对于 Dojo 的雏形机,Karpathy 在 2021 年计算机视觉和模式识别会议 (CVPR 2021) 上表示,“我们展示的是使用 720 个 80GB 版本的 8x A100 节点构建的集群。这是一台巨大的超级计算机,就每秒浮点(FLOPS)运算次数而言,我认为它可能是全球第五的超级计算机。第五位目前由英伟达公司的 Selene 集群占据,该集群拥有非常相似的架构和类似的 GPU 数量(4480 对我们的 5760,所以少一点)”。


而对于 Dojo 最终发布的期望,特斯拉在 2020 年发布的推文中表示,Dojo 能够实现每秒千万亿次浮点运算(1000 PFLOPS),这将使得 Dojo 成为一款真正的尖端超级计算机。未来,Dojo 的算力将要达到每秒钟 exaFLOP(百亿亿次, 是千万亿次 PFLOPS 的 1000 倍) 的级别,并且运算速度要超过富岳(Fugaku),成为世界第一。


而富岳是目前世界上速度最快的超级计算机,其浮点计算的峰值速度可达到 442PFLOPS(每秒 442 x 1 千万亿次浮点运算),最高性能超过 1000 PFLOPS。




在 2020 年的世界超级计算机大会上(SC20),位列前五的超级计算机分别是,日本的富岳 Fugaku,美国的 Summit ,美国的 Sierra,中国的“神威·太湖之光” 和美国的 Selene。

2021-06-23 17:002857
用户头像

发布了 74 篇内容, 共 32.8 次阅读, 收获喜欢 83 次。

关注

评论

发布
暂无评论
发现更多内容

链游开发:在区块链浪潮中构建虚拟世界

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

华商律所与iCourt达成战略合作,国内首家千人规模强所完成AI本地化部署

科技汇

现代 Web 安全实践:基于 Token 与 Refresh Token 的单点登录 (SSO) 实现

袋鼠云数栈

Web 数字化转型 解决方案 数据管理 单点登录

javascript中IIFE(立即执行函数表达式)到底是咋来的?

电子尖叫食人鱼

JavaScript

数据任务调度解决离不开离线开发BatchWorks

袋鼠云数栈

数据库 数据治理 数据调度 数据资源 batchworks

Sermant指标采集功能:构建指标可观测性实践

华为云开源

开源 微服务架构 sermant

AI Infra 运维实践:DeepSeek 部署运维中的软硬结合

袋鼠云数栈

数据库 大数据 运维 数据治理 数据平台

真正好用的企业AI:生于“原生”,成于“一体”

用友BIP

数智焕新 “数质”先行 用友BIP为企业补上数据这一课

用友BIP

智能指标AIMetrics赋能:构建一体化数据智能决策中枢

袋鼠云数栈

数据 数据治理 大数据平台 数据管理 数据库 大数据

用 AI “一句话生成代码”,用创意兑换灵码潮品:技术人的夏日狂欢季来了

阿里巴巴云原生

通义灵码

用 AI “一句话生成代码”,用创意兑换灵码潮品:技术人的夏日狂欢季来了

阿里云云效

从“工具逻辑”到“体系逻辑”,企业治理为何必须跨越传统BI走向指标驱动?

袋鼠云数栈

数据库 数字化转型 BI 数据可视化 数据管理

【清源SCA社区版】正式上线!|深度解析:从功能架构到技术实践的全维度指南

安势信息

开源 代码检测 情源SCA 清源SCA社区版

三角偶极子天线(上)---MIMO系统, 包络相关系数ECC和分集增益DG

思茂信息

电磁 MIMO CST Studio Suite

公链钱包开发:打造安全便捷的数字资产管家

区块链软件开发推广运营

交易所开发 链游开发 公链开发 代币开发 链游开发公链开发

商品中心—库存分桶调配的技术文档

不在线第一只蜗牛

Java spring

昇腾CANN再进化:开放创新繁荣AI生态

极客天地

AI 应用开发(二):Blender 建模助手

北桥苏

人工智能 大模型 AI智能体 AI工作流 MCP协议

通义灵码2.5来袭!MCP 功能直接让开发效率提升300%(附实战案例)

阿里云云效

阿里云 通义灵码

汇金资损防控体系建设及实践 | 得物技术

得物技术

人工智能

嘉为蓝鲸IT服务管理中心ITSM解决方案:多项殊荣实力彰显,融合创新重塑IT服务管理生态

嘉为蓝鲸

AIOPS ITSM 智能运维 IT服务管理中心

Java原生交易所全套开发

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

用友与柳钢再续合作新篇,共筑废钢产业数智化新标杆

用友BIP

筑牢数据防线!企业级数据安全管控的核心功能全解析

袋鼠云数栈

数据库 大数据 数据治理 企业数据库

亚马逊云科技中国峰会:数新智能CTO原攀峰详解一站式AI原生数智平台DataCyber在Amazon EKS的实践

数新网络官方账号

用友成功中标茅台集团司库数据管理项目

用友BIP

通义灵码2.5来袭!MCP 功能直接让开发效率提升300%(附实战案例)

阿里巴巴云原生

阿里云 通义灵码

DApp 开发:开启去中心化应用新时代

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

Aliyun OSS iOS SDK 使用指南

qife122

ios 阿里云

特斯拉披露自家超算集群雏形,最新版本超算有望登顶世界第一?_AI&大模型_施尧_InfoQ精选文章