写点什么

烧钱六年,Dojo 被判死刑:马斯克自研超算梦是怎么走进死胡同的?

  • 2025-11-30
    北京
  • 本文字数:4229 字

    阅读完需:约 14 分钟

大小:2.14M时长:12:29
烧钱六年,Dojo 被判死刑:马斯克自研超算梦是怎么走进死胡同的?

多年来,埃隆·马斯克一直对 Dojo 项目的前景念念不忘。这台 AI 超级计算机本该成为特斯拉 AI 雄心的基石,也无怪乎马斯克会在 2024 年 7 月表示,在当年 10 月推出自动驾驶出租车之前,该公司 AI 团队将启动 Dojo 投入“倍增”行动。

 

但经过六年炒作,特斯拉最终于上个月决定关闭 Dojo,并于 2025 年 8 月解散了超算项目团队。几周前,马斯克还曾预测 Dojo 2(特斯拉的第二个超级集群,计划采用公司自研的 D2 芯片构建)将在 2026 年实现规模落地,但短短几周后就改变主意,称开发“进入了死胡同”。

 

本文将向大家介绍 Dojo 项目是什么,又如何帮助特斯拉一步步推动全自动驾驶、自主人形机器人、半导体自主等战略目标。这个现已关停的项目,曾经由一众分析师和投资者相信特斯拉不再仅仅是一家汽车制造商,更是一家 AI 公司。

 

Dojo 是特斯拉打造的定制化超级计算机,旨在训练其“全自动驾驶”(FSD)神经网络。

 

Dojo 的发展与特斯拉实现 FSD 并面向市场推出自动驾驶出租车的目标密切相关。作为特斯拉旗下高级驾驶辅助系统,FSD 已经搭载在数十万特斯拉汽车之上,能够执行部分自动驾驶任务,但仍要求驾驶员将注意力集中在路面上。今年 6 月特斯拉在奥斯汀发布的、搭载在 Model Y SUV 上的有限自动驾驶出租车服务,同样以这项技术为基础。

 

说了这么多,特斯拉却并未将自动驾驶的成功归结于这台超级计算机。相反,马斯克和特斯拉在过去一年间几乎不再提起 Dojo。2024 年 8 月,特斯拉开始推广 Cortex,该公司“在奥斯汀总部建设的全新巨型 AI 超级集群,旨在解决现实世界 的 AI 问题。”马斯克曾提到,Cortex 将拥有“可容纳 FSD 和 Optimus 视频训练的海量存储空间”。

 

在特斯拉 2024 年第四季度的股东大会上,该公司分享了 Cortex 的最新动态,但同样未提及 Dojo。目前尚不清楚 Dojo 的关停是否会对 Cortex 造成影响。

 

人们对 Dojo 项目解散的反应则褒贬不一。有人认为这是特斯拉电动汽车销量下滑、自动驾驶出租车推广乏力下的必然结果,也有人认为 Dojo 的解散并不代表项目失败,而是特斯拉正从高风险、自给自足的硬件研发策略转向由合作伙伴提供芯片开发服务的新路径。

Dojo 项目关停回顾

特斯拉于 2025 年 8 月中旬解散了 Dojo 团队,并宣告项目正式终止。此前,已经有约 20 名员工离开公司,并创办了 AI 芯片与基础设施厂商 DensityAI。Dojo 项目负责人 Peter Bannon 也一并离职。

 

分析人士指出,失去关键人才会导致项目迅速崩盘,特别是这种专业化程度极高的内部技术项目。

 

就在几周前,特斯拉与三星签署了一项价值 165 亿美元的协议,将下一代 AI6 芯片的研发任务交给三星。AI6 芯片是特斯拉高度关注的一款产品,其应用范围涵盖驱动 FSD 及 Optimus 人形机器人、乃至数据中心高性能 AI 训练等诸多领域。

 

马斯克在他掌控的社交平台 X 上发帖称,“考虑到所有路径都明确指向 AI6,我只能选择关闭 Dojo 并做出一系列艰难的人事决策。现在 Dojo 2 的开发已经走进了死胡同。Dojo 3 则仍在以另一种形式延续,即以单片板上集成大量 AI6 芯片(片上系统)。”

特斯拉 Dojo 项目的来历

 

马斯克坚称,特斯拉不仅仅是一家汽车制造商或者太阳能电池板/储能系统供应商,更是一家 AI 公司——一家通过模仿人类感知攻克自动驾驶汽车难题的企业。

 

多数其他自动驾驶汽车技术厂商会依靠大量传感器(例如激光雷达、传统雷达和摄像头)来感知世界,并利用高清地图实现车辆定位。但特斯拉认为只靠摄像头捕捉视觉数据,再使用先进的神经网络处理这些数据就足以快速完成车辆行驶决策,最终实现完全自动驾驶。

 

特斯拉曾经扬言,经过 Dojo 训练的 AI 软件最终将通过无线更新方式交付给产品客户。FSD 的庞大普及规模,也意味着特斯拉能够收集数百万英里的视频片段以用于训练 FSD。收集到的数据越多,公司距离真正实现全自动驾驶也就越近。

 

然而,部分行业专家表示,将更多数据输入模型并期望其越来越智能的粗暴方式,可能很快遭遇瓶颈。

 

普渡大学硅谷电气与计算机工程教授 Anand Raghunathan 在采访中表示,“首先是经济条件的限制,毕竟投入的预算不可能无限增长。还有人认为,用于训练模型的有价值数据终会被耗尽。届时更多数据将无法提供更多信息,那么数据能否进一步改善模型、训练过程能否优化性能将画上一个大大的问号。”

 

Raghunathan 还提到,尽管存在诸多疑虑,但至少在短期内,数据增长的趋势将会持续下去。更多数据将对应更强大的算力和数据存储/处理容量,以确保特斯拉能够持续训练自己的 AI 模型。这就是超级计算机 Dojo 的意义所在。

超级计算机是什么?

作为特斯拉的超级计算机系统,Dojo 相当于 AI(特别是 FSD)的训练场。Dojo 这个单词本身,就是在致敬“武道场”的概念。

 

超级计算机由数千个小型计算机节点组成。每个节点都有自己的 CPU 和 GPU,前者负责节点的全面管理,后者则负责执行复杂任务——例如将事务拆分成多个部分并同时处理。

 

GPU 对于机器学习操作至关重要,例如支持 FSD 模拟训练。GPU 还支撑起大语言模型,这就是生成式 AI 热潮能够将英伟达送上全球最有价值公司宝座的原因所在。

 

就连特斯拉也会采购英伟达 GPU 来训练自家 AI。

特斯拉为什么需要自己的超级计算机?

特斯拉选择的纯视觉技术路线,决定其必须拥有超级计算机。FSD 背后的神经网络经过大量驾驶数据训练,能够识别并分类车辆周遭的物体,而后据此做出驾驶决策。就是说当 FSD 启动时,神经网络必须以等同于人类驾驶员速度及识别能力的水平持续收集并处理视觉数据。

 

换句话说,特斯拉就是想为人类视觉皮层和大脑功能打造一套数字副本。

 

为了实现这个目标,特斯拉需要存储并处理从全球车辆上收集到的全部视频数据,并运行数百万次模拟来完成模型训练。

 


特斯拉的 Dojo 训练计算机主要采用英伟达 GPU,并公司并不想把鸡蛋都放进同一个篮子——特别是考虑到英伟达家的 GPU 价格不菲。特斯拉希望开发出更好的产品,在增加带宽的同时降低延迟。因此,该公司 AI 部门决定发布自己的定制硬件项目,希望以更高效的方式训练 AI 模型。

该项目的核心就是 D1 芯片,特斯拉表示这些芯片专门针对 AI 工作负载进行了优化。

关于芯片的更多细节



前 AUTOPILOT 硬件高级总监 GANESH VENKATARAMANAN 在 2021 年特斯拉 AI 日活动上展示 D1 训练模块。

 

跟苹果一样,特斯拉也认为硬件和软件设计应当协同并进。为此,特斯拉才决定摆脱标准 GPU 硬件,通过自研芯片来驱动 Dojo 超算集群。

 

特斯拉在 2021 年的 AI 日活动上公布了 D1 芯片,其尺寸与手掌相当,并表示该芯片将于 2023 年 7 月左右投入生产。

 

这款 7 纳米芯片由台积电负责代工。据特斯拉介绍,D1 拥有 500 亿个晶体管,芯片尺寸高达 645 平方毫米。由此看来,D1 芯片将拥有极其强大的性能表现,能够快速处理复杂任务。

 

然而,D1 芯片的性能却仍不及英伟达 A100。

 

为了弥合差距,特斯拉一直在研发下一代 D2 芯片以解决信息流瓶颈问题。D2 芯片不是简单将各芯片连接起来,而是把整块 Dojo 芯片集成到单一晶片之上。

 

特斯拉从未公布其订购或接收了多少块 D1 芯片,也没有公布 Dojo 超级计算机全面转向 D1 的具体时间表。

Dojo 对特斯拉有何意义?



2024 年 7 月 7 日,参观者在上海世界人工智能大会(WAIC)上见证了特斯拉人形机器人 OPTIMUS II。


特斯拉希望自主掌控芯片生产,有朝一日以低成本快速为 AI 训练项目提供大量算力。

 

如此一来,特斯拉就能摆脱价格日益昂贵、且供应安全缺乏保障的英伟达芯片。如今,特斯拉正努力与英伟达、AMD 和三星同时维持合作伙伴关系,其中三星将负责其下一代 AI6 芯片的制造。

在 2024 年第二季度财报电话会议上,马斯克表示市场对英伟达硬件的需求“如此之高,导致 GPU 获取难度同步提升。”他强调称“我们非常担心能否在必要时获得稳定的 GPU 供应,因此必须在 Dojo 上投入更多精力,确保我们掌握所需的训练能力。”

 

但 Dojo 本身是个风险巨大的赌注,马斯克也多次承认特斯拉未必能在项目上取得成功。

 

从长远来看,特斯拉也考虑过为 AI 部门建立新的商业模式,甚至在 2024 年第二季度财报电话会议上,马斯克提到“也许可以通过 Dojo 跟英伟达直接竞争”。虽然 D1 芯片更适合特斯拉提出的计算机视觉标记与训练用途(主要面向 FSD 和 Optimus 训练),但在其他方面则效果一般。马斯克称,未来的版本必须拥有更好的 AI 训练通用能力。

 

特斯拉还面临另外一个问题,就是几乎所有 AI 软件均针对 GPU 编写。使用 Dojo 芯片训练通用 AI 模型,则意味着软件需要经历重写。

 

就是说,特斯拉有可能出租其算力(类似于 AWS 和 Azure 出租云算力)。摩根士丹利在 2023 年 9 月发布的一份报告中预测,Dojo 可以通过自动驾驶出租车和软件服务的形式创造新的收入来源,将特斯拉的市值额外拉升 5000 亿美元。

 

简而言之,Dojo 芯片将成为这家汽车制造巨头的保险单,甚至可能已经带来了回报。

特斯拉 Dojo 还能走多远?

 

马斯克虽然经常公布进度报告,但他为 Dojo 设定的不少目标始终未能实现。

 

例如,马斯克曾在 2023 年 6 月表示,Dojo 已经上线几个月并开始运行实用任务。大约在同一时间,特斯拉提到,预计 Dojo 将在 2024 年 2 月成为全球五大超级计算机之一,并计划在 2024 年 10 月将算力提升至百亿亿级别。这对应的是约 27.6 万台 D1 计算机,或者约 32.05 万块英伟达 A100 GPU。

 

但特斯拉此后再未透露过任何更新消息,也未公布这些目标是否达成。

 

特斯拉和马斯克也曾为 Dojo 项目做出过诸多承诺,包括提供资金支持。例如,特斯拉曾在 2024 年 1 月承诺斥资 5 亿美元在纽约州布法罗超级工厂制造一台 Dojo 超级计算机。据 2024 年的报告,截至当时的投入已经达到 3.14 亿美元。

 

就在特斯拉 2024 年第二季度财报电话会议结束后,马斯克在 X 上发布了 Dojo 1 的照片,强调到年底其将拥有“相当于约 8000 张 H100 的在线训练容量。不算特别厉害,但也不差。”

 

尽管马斯克在 X 和财报电话会议上极尽努力,但关于 Dojo 的所有消息都在 2024 年 8 月彻底消失,话题开始转向 Cortex。

 

在该公司 2024 年第四季度的财报电话会议上,特斯拉称已经完成了 Cortex 的部署,即“在得克萨斯州超级工厂部署了约 5 万张 H100 的训练集群”,且 Cortex 将协助支持监督式 FSD 的 V13 版本。

 

到 2025 年第二季度,特斯拉表示“在得克萨斯州超级工厂额外部署了 1.6 万张 H200 GPU,旨在扩展 AI 训练算力,Cortex 的总算力此时已等效于 6.7 万张 H100。”在此次财报电话会议上,马斯克提到预计第二套 Dojo 集群将在 2026 年“大规模”运行,同时暗示公司可能对项目进行裁撤。

 

“考虑到 Dojo 3 和 AI6 推理芯片有着高度重合的定位,在直觉上二者应该可以合并起来。”

短短几周后,他宣布解散 Dojo 团队。

 

另据证实,2025 年 8 月底特斯拉仍在继续布法罗耗资 5 亿美元的超级计算机建造计划,只是名头肯定不叫“Dojo”了。

 

参考链接:

https://techcrunch.com/2025/09/02/tesla-dojo-the-rise-and-fall-of-elon-musks-ai-supercomputer/

2025-11-30 00:001

评论

发布
暂无评论

缓存 | Redis 缓存避坑指南

RadonDB

数据库 redis

《MySQL系列》 InnoDB行记录存储结构

Silently9527

MySQL 面试 innodb innodb行记录

基于Serverless架构的社区文章管理小工具

刘宇

Go语言那些事儿之浅谈协程并发竞争资源问题

Regan Yue

Go 语言 8月日更

带你读AI论文丨用于目标检测的高斯检测框与ProbIoU

华为云开发者联盟

算法 数据集 目标检测 高斯检测框 ProbIoU

LeetCode题解:27. 移除元素,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

fil为什么会暴涨?fil暴涨还会持续吗?

区块链 分布式存储 IPFS fil币价行情 fil币会大涨吗?

用手机写代码:基于Serverless的在线编程能力探索

刘宇

李欲晓:加强关键信息基础设施安全保护的法治基石

郑州埃文科技

一文带你了解NB-IoT标准演进与产业发展

华为云开发者联盟

物联网 IoT NB-IoT

前端基础四之JavaScriptDOM与事件

ベ布小禅

8月日更

百度世界2021:百度大脑升级、昆仑芯2量产、智能云加速AI落地爆发

百度大脑

人工智能 百度大脑

fil价格走势分析?fil为什么会大涨?

区块链 分布式存储 IPFS fil价格走势 fil大涨

从源码角度解析线程池中顶层接口和抽象类

华为云开发者联盟

Java 线程 软件开发 高并发 线程池

接口测试的时候如何一键获取cookie,并在其他接口引用

与风逐梦

软件测试 接口测试 Cookie

抖音快手短视频营销软件系统开发案例

抖音快手短视频平台获客系统开发内容

web技术分享| 实现WebRTC多个对等连接

anyRTC开发者

音视频 WebRTC JavaScrip web技术分享

接口文档生成工具 一键生成文档 ApiPost

CodeNongXiaoW

项目管理 大前端 测试 后端 接口管理工具

抖音快手短视频SEO系统开发

Android SDK 启动退出方案演进

神策技术社区

大前端 后端 代码 数据采集

接口管理工具APIPOST的预/后执行脚本里,常见的响应参数变量和常用方法集合——apipost

Proud lion

大前端 后端 Postman 开发工具 接口文档

华为海外女科学家为您揭秘:GaussDB(for MySQL)云栈垂直集成的力量有多大?

华为云开发者联盟

数据库 云数据库 GaussDB(for MySQL) 云栈 事务数据库服务

JNI 提示

Changing Lin

8月日更

测试开发之系统篇-Docker常用操作

禅道项目管理

Docker 容器 测试开发

抖音快手短视频询盘系统开发

Go 语言, 一文彻底搞懂 map 实现原理

微客鸟窝

Go 语言 8月日更

科技平台与社会的和谐相处

CECBC

SpringApplication启动run了啥

Rubble

8月日更

神策数据微信小程序 SDK 架构解析

神策技术社区

大前端 后端 数据 代码 数据采集

抖音快手短视频SEO营销系统软件开发价格

烧钱六年,Dojo 被判死刑:马斯克自研超算梦是怎么走进死胡同的?_芯片&算力_Rebecca Bellan_InfoQ精选文章