写点什么

机器人技术永远不会出现“ChatGPT 时刻”

  • 2025-01-13
    北京
  • 本文字数:2217 字

    阅读完需:约 7 分钟

大小:1.09M时长:06:19
机器人技术永远不会出现“ChatGPT时刻”

今年可能是通用机器人技术有史以来最激动人心的一年。我在年初的一篇文章中,大致预测了该领域的发展,以及我认为成立哪类初创公司会有意义。2024 年有一些令人惊叹的进展,在这个背景下重读那篇文章,感觉非常有趣。在这篇文章中,我想再预测一下明年会发生什么。

硬件趋同


预测:到 2025 年底,人型机器人将实现商用。


我的意思是,大多数人型机器人将由大致相同的组件构成,而且任何组织都可以自由地生产这些组件。规模经济将促使现有的企业放弃自己的专有组件,转而生产商用组件。


以下是原因:


  • 基于 RL 的闭环控制(使用通过仿真训练出的策略)已成为实现实时控制的最佳方法 1。

  • 使用 RL 策略控制机器人,意味着你无需关心执行器的大量特性,而这是机器人公司历来关心或试图使自己与众不同的组件。

  • 一旦弄清了如何利用它,大多数仍在观望的公司也将转向开源的 MIT Cheetah 执行器。

  • 规模经济和制造成本意味着其他执行器设计不再具备竞争力。


说明:


  • 虽然硬件组件将趋于一致,但不同机器人的设计仍会存在一些差异。

  • 在机器人设计决策的合理性方面仍然存在一些未决的问题,比如如何安排臀部的自由度,是否在颈部或躯干中加入自由度,以及使用哪种夹持器。

  • 我认为,根据不同的应用场景,不同的机器人仍有充分的理由做出不同的设计决策。


这会有什么影响?


  • 优秀的通用机器人硬件将成为商品。特斯拉、Figure 或 1X 等现有机器人公司都不会获得任何实质性优势。

  • 到 2025 年底,一个好的全尺寸人型机器人的市场价将低于 8000 美元,一个好的家用机器人的市场价将低于 4000 美元。


不会有 ChatGPT 时刻


预测:机器人技术永远不会出现“ChatGPT 时刻”。


我将此定义为,某家公司在一段时间内一直在单独开发一种模型,然后将其发布到某个商用机器人平台上,非常神奇地,使该机器人能够完成通用任务,而且有很高的可靠性。


以下是原因:


  • 训练一个通用机器人模型所需的各种数据的规模远远超过人们目前的认知。

  • 仅仅让一个非常好的语言模型或多模态模型来控制机器人是不够的。要想实现 “ChatGPT 级别”的通用智能,唯一的办法就是收集大量(数百万小时的数量级)的特定智能体数据。

  • 这就需要反复改进。

  • 试图为一个特定的领域构建一个机器人,然后以这些数据为基础来达成通用性。这个策略也是行不通的,因为:π0 模型 证明了我们距离拥有一个优秀的通才智能体 AI 模型还有多远。


说明:


  • 即使没有“ChatGPT 时刻”,2025 年也会出现更好的机器人,而且我们很可能会迈过这样一个门槛,即机器人的成本低于它为大部分人提供的价值,这意味着它们将成为可行的产品。

  • 我们可以迅速接近 ChatGPT 的性能水平,但这会是个渐进的过程,而不是一次性的突破。


这会有什么影响?


  • 一些规模最大、资金最雄厚的企业需要转向,致力于将真正的产品推向市场,或与已经在这样做的企业合作。


消费市场增长


预测:到 2025 年底,美国销售的人型机器人中将有一半以上是面向消费者的。


我所说的“消费者 ”是指购买机器人主要用于个人用途的人,人们会自己尝试使用机器人,但也会有很多与商业用途重叠的情况。


以下是原因:


  • 与前几代机器人相比,通用机器人的效用将截然不同。

  • 起初,通用机器人的“杀手级应用”将是语音和视觉。

  • 早期用户将更关注“仿人”方面,而不是“机器人”方面。

  • 任何固守传统机器人企业客户 SLA(服务水平协议)的组织,最终都会落入过去曾让许多机器人公司深陷其中的陷阱。他们将被迫放弃构建良好的通用模型,转而在自由度超高的平台上重新实现经典控制。


说明:


  • 我认为,除了消费者会采用外,企业也会采用,但大多数真正的企业采用看起来更像是专业消费者,而不是企业,这与传统的机器人采用方式存在明显的不同。

  • 将一类新的消费电子产品推向市场很难。很多人都会为了找到一种办法而浪费大量的资金。


这会有什么影响?


  • 机器人公司需要开始关注品牌、对消费者的广泛吸引力、消费者市场细分以及其他传统上不需要关注的问题。

  • 服务水平协议(SLA)将变得不再重要。机器人公司将开始变得更像硅谷的科技公司,转而关心用户参与度和留存率等问题。


作者简介:

Ben 是 K-Scale Labs 这家公司的创始人兼首席执行官。该公司正在致力于开发通用机器人(GPR),旨在将具身智能引入现实世界。公司将这项技术开源,免费供任何人审核、构建和优化,以适应他们各自的用例。


Ben 曾在特斯拉、Meta、谷歌和亚马逊担任 AI 研究员和工程师。在特斯拉,Ben 负责训练并部署了首个用于输出汽车航点的自回归变压器,这一过程中还涉及重写特斯拉 HW3 ASIC 的神经网络编译器。此外,Ben 还编写了 CUDA 内核,用于生成训练体素占用网络所需的真实数据,该网络后来被改编并应用于 Optimus 机器人。在 Meta,Ben 训练并部署了首个用于内容审核的变压器模型,随后转向了 AI 研究领域。Ben 还共同开发了首批大规模语音基础模型之一(按照 2021 年的标准,拥有十亿个参数已算是相当大的规模),该模型后来被开源社区广泛应用于离线语音克隆和语音生成等众多场景。Ben 也曾短暂涉足机器人语义映射的研究工作。


Ben 在埃默里大学取得了数学和计算机科学的学位,在校期间还在 NIH 资助的培训补助金支持下,深入研究了计算神经科学。该补助金的大部分资金用于在佐治亚理工学院的 Hasler 实验室开展研究,主要探索利用模拟电路进行神经形态计算,也正是在那里,Ben 首次对深度学习产生了浓厚的兴趣。毕业后,Ben 在中国居住了三个月,期间努力练习语言技能,之后便开始了我的职业生涯。


原文链接:


https://ben.bolte.cc/posts/2024-12-23-predictions


声明:本文为 InfoQ 翻译,未经许可禁止转载。


2025-01-13 15:305674

评论 2 条评论

发布
用户头像
会跟缝纫机一样。
2025-01-14 13:52 · 江苏
回复
用户头像
翻译纠错:他

2025-01-13 16:45 · 北京
回复
没有更多了

Go语言创造者回顾:是什么让GoLang如此受欢迎?

三石

go语言

OKALEIDO的NFT聚合交易,打造面向艺术家的Web3商业生态

股市老人

KusionStack 开源有感|历时两年,打破“隔行如隔山”困境

SOFAStack

开源 编程语言 语言 #Github 运维‘

昇腾AI的蝴蝶效应,从智能制造开始

脑极体

Flink ML API,为实时机器学习设计的算法接口与迭代引擎

Apache Flink

大数据 flink 编程 流计算 实时计算

SoFlu 软件机器人:辅助企业落地 DevOps 的自动化工具

飞算JavaAI开发助手

做多线程并发扩展,这两点你需要关注

华为云开发者联盟

spring 多线程 高并发 开发 华为云

天翼云践行“双碳”目标 “东数西算”绘画绿色发展新蓝图

天翼云开发者社区

Yarn的RM功能介绍

五分钟学大数据

6月月更

见微知著,细节上雕花:SVG生成矢量格式网站图标(Favicon)探究

刘悦的技术博客

前端 favicon SVG svg图 Icon Font

四川21市州国家反诈中心APP覆盖情况,筑牢全民反诈“防护墙”

易观分析

反诈APP

Streaming Data Warehouse 存储:需求与架构

Apache Flink

大数据 flink 编程 流计算 实时计算

千万级高并发下看天翼云如何为“健康码”突破技术瓶颈

天翼云开发者社区

一文读懂天翼云自研TeleDB 数据库五大关键特性

天翼云开发者社区

MASA Auth - 从用户的角度看整体设计

MASA技术团队

为什么我们总是说不清「需求是什么」

LigaAI

产品经理 需求 需求分析 产品设计与思考

知识图谱看高考,高考加油!高考学子金榜题名

清林情报分析师

数据分析 数据可视化 高考 知识图谱

极客星球 | 开发者服务合规检测护航企业数字生态建设

MobTech袤博科技

信息安全 开发者服务 安全合规检测 SDK检测 数据健康

社区动态|SelectDB 联合传智教育推出免费 Apache Doris 中文视频教程

SelectDB

Doris 开源社区 Apaache Doris 开源治理

架构实战营 - 第 6 期 模块八课后作业

乐邦

「架构实战营」

MySql函数

工程师日月

6月月更

TICS端到端实践:企业积分查询作业开发

华为云开发者联盟

云计算 华为云 安全计算

中国企业数字化转型的十大趋势

小炮

手把手教你实战开发黑白棋实时对战游戏

华为云开发者联盟

云计算 软件开发 游戏开发 华为云

详解大集群通信建模理论公式

华为云开发者联盟

数据库 华为云 查询

Web3生态龙头AQUANEE,即将登录Gate等平台

股市老人

淘宝Native研发模式的演进与思考 | DX研发模式

阿里巴巴终端技术

ide 技术选型 native 客户端 动态化

天翼云对象存储ZOS高可用的关键技术揭秘

天翼云开发者社区

Flutter 开发一个通用的购物车数量编辑组件

岛上码农

flutter 安卓开发 ios 开发 跨平台应用 6月月更

机器人技术永远不会出现“ChatGPT时刻”_AI&大模型_Ben_InfoQ精选文章