写点什么

烧钱六年,Dojo 被判死刑:马斯克自研超算梦是怎么走进死胡同的?

  • 2025-11-30
    北京
  • 本文字数:4229 字

    阅读完需:约 14 分钟

大小:2.14M时长:12:29
烧钱六年,Dojo 被判死刑:马斯克自研超算梦是怎么走进死胡同的?

多年来,埃隆·马斯克一直对 Dojo 项目的前景念念不忘。这台 AI 超级计算机本该成为特斯拉 AI 雄心的基石,也无怪乎马斯克会在 2024 年 7 月表示,在当年 10 月推出自动驾驶出租车之前,该公司 AI 团队将启动 Dojo 投入“倍增”行动。

 

但经过六年炒作,特斯拉最终于上个月决定关闭 Dojo,并于 2025 年 8 月解散了超算项目团队。几周前,马斯克还曾预测 Dojo 2(特斯拉的第二个超级集群,计划采用公司自研的 D2 芯片构建)将在 2026 年实现规模落地,但短短几周后就改变主意,称开发“进入了死胡同”。

 

本文将向大家介绍 Dojo 项目是什么,又如何帮助特斯拉一步步推动全自动驾驶、自主人形机器人、半导体自主等战略目标。这个现已关停的项目,曾经由一众分析师和投资者相信特斯拉不再仅仅是一家汽车制造商,更是一家 AI 公司。

 

Dojo 是特斯拉打造的定制化超级计算机,旨在训练其“全自动驾驶”(FSD)神经网络。

 

Dojo 的发展与特斯拉实现 FSD 并面向市场推出自动驾驶出租车的目标密切相关。作为特斯拉旗下高级驾驶辅助系统,FSD 已经搭载在数十万特斯拉汽车之上,能够执行部分自动驾驶任务,但仍要求驾驶员将注意力集中在路面上。今年 6 月特斯拉在奥斯汀发布的、搭载在 Model Y SUV 上的有限自动驾驶出租车服务,同样以这项技术为基础。

 

说了这么多,特斯拉却并未将自动驾驶的成功归结于这台超级计算机。相反,马斯克和特斯拉在过去一年间几乎不再提起 Dojo。2024 年 8 月,特斯拉开始推广 Cortex,该公司“在奥斯汀总部建设的全新巨型 AI 超级集群,旨在解决现实世界 的 AI 问题。”马斯克曾提到,Cortex 将拥有“可容纳 FSD 和 Optimus 视频训练的海量存储空间”。

 

在特斯拉 2024 年第四季度的股东大会上,该公司分享了 Cortex 的最新动态,但同样未提及 Dojo。目前尚不清楚 Dojo 的关停是否会对 Cortex 造成影响。

 

人们对 Dojo 项目解散的反应则褒贬不一。有人认为这是特斯拉电动汽车销量下滑、自动驾驶出租车推广乏力下的必然结果,也有人认为 Dojo 的解散并不代表项目失败,而是特斯拉正从高风险、自给自足的硬件研发策略转向由合作伙伴提供芯片开发服务的新路径。

Dojo 项目关停回顾

特斯拉于 2025 年 8 月中旬解散了 Dojo 团队,并宣告项目正式终止。此前,已经有约 20 名员工离开公司,并创办了 AI 芯片与基础设施厂商 DensityAI。Dojo 项目负责人 Peter Bannon 也一并离职。

 

分析人士指出,失去关键人才会导致项目迅速崩盘,特别是这种专业化程度极高的内部技术项目。

 

就在几周前,特斯拉与三星签署了一项价值 165 亿美元的协议,将下一代 AI6 芯片的研发任务交给三星。AI6 芯片是特斯拉高度关注的一款产品,其应用范围涵盖驱动 FSD 及 Optimus 人形机器人、乃至数据中心高性能 AI 训练等诸多领域。

 

马斯克在他掌控的社交平台 X 上发帖称,“考虑到所有路径都明确指向 AI6,我只能选择关闭 Dojo 并做出一系列艰难的人事决策。现在 Dojo 2 的开发已经走进了死胡同。Dojo 3 则仍在以另一种形式延续,即以单片板上集成大量 AI6 芯片(片上系统)。”

特斯拉 Dojo 项目的来历

 

马斯克坚称,特斯拉不仅仅是一家汽车制造商或者太阳能电池板/储能系统供应商,更是一家 AI 公司——一家通过模仿人类感知攻克自动驾驶汽车难题的企业。

 

多数其他自动驾驶汽车技术厂商会依靠大量传感器(例如激光雷达、传统雷达和摄像头)来感知世界,并利用高清地图实现车辆定位。但特斯拉认为只靠摄像头捕捉视觉数据,再使用先进的神经网络处理这些数据就足以快速完成车辆行驶决策,最终实现完全自动驾驶。

 

特斯拉曾经扬言,经过 Dojo 训练的 AI 软件最终将通过无线更新方式交付给产品客户。FSD 的庞大普及规模,也意味着特斯拉能够收集数百万英里的视频片段以用于训练 FSD。收集到的数据越多,公司距离真正实现全自动驾驶也就越近。

 

然而,部分行业专家表示,将更多数据输入模型并期望其越来越智能的粗暴方式,可能很快遭遇瓶颈。

 

普渡大学硅谷电气与计算机工程教授 Anand Raghunathan 在采访中表示,“首先是经济条件的限制,毕竟投入的预算不可能无限增长。还有人认为,用于训练模型的有价值数据终会被耗尽。届时更多数据将无法提供更多信息,那么数据能否进一步改善模型、训练过程能否优化性能将画上一个大大的问号。”

 

Raghunathan 还提到,尽管存在诸多疑虑,但至少在短期内,数据增长的趋势将会持续下去。更多数据将对应更强大的算力和数据存储/处理容量,以确保特斯拉能够持续训练自己的 AI 模型。这就是超级计算机 Dojo 的意义所在。

超级计算机是什么?

作为特斯拉的超级计算机系统,Dojo 相当于 AI(特别是 FSD)的训练场。Dojo 这个单词本身,就是在致敬“武道场”的概念。

 

超级计算机由数千个小型计算机节点组成。每个节点都有自己的 CPU 和 GPU,前者负责节点的全面管理,后者则负责执行复杂任务——例如将事务拆分成多个部分并同时处理。

 

GPU 对于机器学习操作至关重要,例如支持 FSD 模拟训练。GPU 还支撑起大语言模型,这就是生成式 AI 热潮能够将英伟达送上全球最有价值公司宝座的原因所在。

 

就连特斯拉也会采购英伟达 GPU 来训练自家 AI。

特斯拉为什么需要自己的超级计算机?

特斯拉选择的纯视觉技术路线,决定其必须拥有超级计算机。FSD 背后的神经网络经过大量驾驶数据训练,能够识别并分类车辆周遭的物体,而后据此做出驾驶决策。就是说当 FSD 启动时,神经网络必须以等同于人类驾驶员速度及识别能力的水平持续收集并处理视觉数据。

 

换句话说,特斯拉就是想为人类视觉皮层和大脑功能打造一套数字副本。

 

为了实现这个目标,特斯拉需要存储并处理从全球车辆上收集到的全部视频数据,并运行数百万次模拟来完成模型训练。

 


特斯拉的 Dojo 训练计算机主要采用英伟达 GPU,并公司并不想把鸡蛋都放进同一个篮子——特别是考虑到英伟达家的 GPU 价格不菲。特斯拉希望开发出更好的产品,在增加带宽的同时降低延迟。因此,该公司 AI 部门决定发布自己的定制硬件项目,希望以更高效的方式训练 AI 模型。

该项目的核心就是 D1 芯片,特斯拉表示这些芯片专门针对 AI 工作负载进行了优化。

关于芯片的更多细节



前 AUTOPILOT 硬件高级总监 GANESH VENKATARAMANAN 在 2021 年特斯拉 AI 日活动上展示 D1 训练模块。

 

跟苹果一样,特斯拉也认为硬件和软件设计应当协同并进。为此,特斯拉才决定摆脱标准 GPU 硬件,通过自研芯片来驱动 Dojo 超算集群。

 

特斯拉在 2021 年的 AI 日活动上公布了 D1 芯片,其尺寸与手掌相当,并表示该芯片将于 2023 年 7 月左右投入生产。

 

这款 7 纳米芯片由台积电负责代工。据特斯拉介绍,D1 拥有 500 亿个晶体管,芯片尺寸高达 645 平方毫米。由此看来,D1 芯片将拥有极其强大的性能表现,能够快速处理复杂任务。

 

然而,D1 芯片的性能却仍不及英伟达 A100。

 

为了弥合差距,特斯拉一直在研发下一代 D2 芯片以解决信息流瓶颈问题。D2 芯片不是简单将各芯片连接起来,而是把整块 Dojo 芯片集成到单一晶片之上。

 

特斯拉从未公布其订购或接收了多少块 D1 芯片,也没有公布 Dojo 超级计算机全面转向 D1 的具体时间表。

Dojo 对特斯拉有何意义?



2024 年 7 月 7 日,参观者在上海世界人工智能大会(WAIC)上见证了特斯拉人形机器人 OPTIMUS II。


特斯拉希望自主掌控芯片生产,有朝一日以低成本快速为 AI 训练项目提供大量算力。

 

如此一来,特斯拉就能摆脱价格日益昂贵、且供应安全缺乏保障的英伟达芯片。如今,特斯拉正努力与英伟达、AMD 和三星同时维持合作伙伴关系,其中三星将负责其下一代 AI6 芯片的制造。

在 2024 年第二季度财报电话会议上,马斯克表示市场对英伟达硬件的需求“如此之高,导致 GPU 获取难度同步提升。”他强调称“我们非常担心能否在必要时获得稳定的 GPU 供应,因此必须在 Dojo 上投入更多精力,确保我们掌握所需的训练能力。”

 

但 Dojo 本身是个风险巨大的赌注,马斯克也多次承认特斯拉未必能在项目上取得成功。

 

从长远来看,特斯拉也考虑过为 AI 部门建立新的商业模式,甚至在 2024 年第二季度财报电话会议上,马斯克提到“也许可以通过 Dojo 跟英伟达直接竞争”。虽然 D1 芯片更适合特斯拉提出的计算机视觉标记与训练用途(主要面向 FSD 和 Optimus 训练),但在其他方面则效果一般。马斯克称,未来的版本必须拥有更好的 AI 训练通用能力。

 

特斯拉还面临另外一个问题,就是几乎所有 AI 软件均针对 GPU 编写。使用 Dojo 芯片训练通用 AI 模型,则意味着软件需要经历重写。

 

就是说,特斯拉有可能出租其算力(类似于 AWS 和 Azure 出租云算力)。摩根士丹利在 2023 年 9 月发布的一份报告中预测,Dojo 可以通过自动驾驶出租车和软件服务的形式创造新的收入来源,将特斯拉的市值额外拉升 5000 亿美元。

 

简而言之,Dojo 芯片将成为这家汽车制造巨头的保险单,甚至可能已经带来了回报。

特斯拉 Dojo 还能走多远?

 

马斯克虽然经常公布进度报告,但他为 Dojo 设定的不少目标始终未能实现。

 

例如,马斯克曾在 2023 年 6 月表示,Dojo 已经上线几个月并开始运行实用任务。大约在同一时间,特斯拉提到,预计 Dojo 将在 2024 年 2 月成为全球五大超级计算机之一,并计划在 2024 年 10 月将算力提升至百亿亿级别。这对应的是约 27.6 万台 D1 计算机,或者约 32.05 万块英伟达 A100 GPU。

 

但特斯拉此后再未透露过任何更新消息,也未公布这些目标是否达成。

 

特斯拉和马斯克也曾为 Dojo 项目做出过诸多承诺,包括提供资金支持。例如,特斯拉曾在 2024 年 1 月承诺斥资 5 亿美元在纽约州布法罗超级工厂制造一台 Dojo 超级计算机。据 2024 年的报告,截至当时的投入已经达到 3.14 亿美元。

 

就在特斯拉 2024 年第二季度财报电话会议结束后,马斯克在 X 上发布了 Dojo 1 的照片,强调到年底其将拥有“相当于约 8000 张 H100 的在线训练容量。不算特别厉害,但也不差。”

 

尽管马斯克在 X 和财报电话会议上极尽努力,但关于 Dojo 的所有消息都在 2024 年 8 月彻底消失,话题开始转向 Cortex。

 

在该公司 2024 年第四季度的财报电话会议上,特斯拉称已经完成了 Cortex 的部署,即“在得克萨斯州超级工厂部署了约 5 万张 H100 的训练集群”,且 Cortex 将协助支持监督式 FSD 的 V13 版本。

 

到 2025 年第二季度,特斯拉表示“在得克萨斯州超级工厂额外部署了 1.6 万张 H200 GPU,旨在扩展 AI 训练算力,Cortex 的总算力此时已等效于 6.7 万张 H100。”在此次财报电话会议上,马斯克提到预计第二套 Dojo 集群将在 2026 年“大规模”运行,同时暗示公司可能对项目进行裁撤。

 

“考虑到 Dojo 3 和 AI6 推理芯片有着高度重合的定位,在直觉上二者应该可以合并起来。”

短短几周后,他宣布解散 Dojo 团队。

 

另据证实,2025 年 8 月底特斯拉仍在继续布法罗耗资 5 亿美元的超级计算机建造计划,只是名头肯定不叫“Dojo”了。

 

参考链接:

https://techcrunch.com/2025/09/02/tesla-dojo-the-rise-and-fall-of-elon-musks-ai-supercomputer/

2025-11-30 00:004717

评论

发布
暂无评论

软件测试/测试开发 | app自动化测试(Android)--元素定位方式与隐式等待

测试人

软件测试 自动化测试 测试开发 appium

太狠了,Spring全家桶笔记,一站式通关全攻略,已入职某厂涨薪18K

程序知音

Java spring ssm java架构 后端技术

2022年12月视频行业用户洞察:世界杯后半程看球热度不减,优质IP创新与开发助力用户留存

易观分析

音视频 视频

带你熟悉3种AQS的线程并发工具的用法

华为云开发者联盟

后端 开发 华为云 企业号 1 月 PK 榜 华为云开发者联盟

Github霸榜!竟是阿里技术官的微服务分布式项目实战笔记总结

程序知音

Java 分布式 微服务 java架构 后端技术

各大互联网公司面经分享:Java全栈知识+1500道大厂面试真题

程序知音

Java java面试 java架构 大厂面试题 八股文

软件测试/测试开发 | app自动化测试(Android)--高级定位技巧

测试人

软件测试 自动化测试 测试开发 appium

运维百家讲坛第 1 期:井源 - 运维几何

巴辉特

由浅入深,聊聊 LeackCanary 的那些事

Petterp

android 内存泄漏 LeakCanary

一种前端无源码定制化开发能力专利解读

元年技术洞察

低代码 数字化转型 无源码 元年方舟

混合式APP开发框架

力软低代码开发平台

在人间vpn搭建

阿呆

vpn

国家先进计算产业创新(宜昌)中心来了!

SENSORO

人工智能 大数据

年度技术盘点:水稻、韦伯、脑机接口、AI预测及创作、快速充电

B Impact

从零到一,臻于至善|网易邮箱基于StarRocks 开发大数据平台的实践

StarRocks

数据库

行云洞见|为什么说云端IDE代表未来趋势?

行云创新

程序员 云原生 CloudIDE 集成开发环境 云端IDE

软件测试/测试开发 | app自动化测试(Android)--App 控件定位

测试人

软件测试 自动化测试 测试开发 appium

如何集中式管理多个客户端节点传输任务-镭速

镭速

阿里、腾讯、蚂蚁金服Java技术面试及经验总结(文末分享答案)

程序知音

Java java面试 后端技术 春招 八股文

移动开发平台真的能提升App开发效率吗?

Onegun

移动应用开发 移动端开发

模块五计算架构模式

程序员小张

「架构实战营」

推荐几款实用的移动开发平台

FinFish

移动开发 开发平台 移动开发平台 移动端开发 小程序技术

C4D和3dmax有什么区别?

Finovy Cloud

3DMAX C4D

尚硅谷Spring6发布视频教程

小谷哥

网易游戏实时 HTAP 计费风控平台建设

Apache Flink

大数据 flink 实时计算

2022年中国跨境支付行业年度专题分析

易观分析

金融 跨境支付 市场

MixMIM 创建混合图像,提出新型掩码方案

Zilliz

计算机视觉

架构实战 5 -微博评论高性能高可用计算架构

架构实战营 「架构实战营」

烧钱六年,Dojo 被判死刑:马斯克自研超算梦是怎么走进死胡同的?_芯片&算力_Rebecca Bellan_InfoQ精选文章