写点什么

创业一年,把机器人送进头部车企“打工”|对话光象科技 CEO 张涛

  • 2026-06-18
    北京
  • 本文字数:4725 字

    阅读完需:约 16 分钟

作者 | 华卫

 

去年刚成立的光象科技,近日发布了首个工业级自进化具身智能机器人 Phi-Bot X1。作为专为工业场景设计的自进化具身智能机器人,X1 在本体架构上深度契合一线工厂对高精度、高灵活性、高稳定性和高安全性的严苛要求,具备极致精度、敏捷效率、柔性灵活与协同安全等综合能力。

 

并且,他们的机器人已经拿到头部车企的订单,要进真实的汽车产线上“打工”了。

 

“今天行业里很多具身机器人其实并没有去干具身机器人该干的事情。“光象科技创始人张涛表示。2024 年中,他离开阿里体系内的高德,拉上清华师兄李升波,组了个团队,扎进了具身智能赛道。

 

连续 3 天、累计约 21.5 小时干活还不出错,这是 Phi-Bot X1 在 2026 ATC 蔚来汽车焊接上下料全流程作业场景交出的成绩单。

 

零失误、零中断,基于自研物理原生智能模型的自主感知动作闭环,X1 在动态环境下实现连续工作 100%成功率,并能够与产线节拍实时协同,展示了具身智能机器人在汽车制造真实场景中的稳定性、精度与连续作业能力。

 

据张涛透露,他们跟至少十几家汽车企业都有交流,深度合作的车厂都是行业的头部车厂,且有明确的商业化合同和订单在推进。目前为止,真正在这些车厂面向商业化落地的具身智能公司,只有光象科技一家。

下线一个月,直接能在产线工位干活

Phi-Bot X1 的真机亮相时,我们注意到它并非时下最吸睛的“双足人形”,而是一台拥有四舵轮全向底盘、升降腰结构的双臂协作机器人。

 

“过去几年,很多双足人形机器人在汽车制造厂里搬箱子。为什么都去搬箱子?因为干不了别的。”张涛表示,X1 在今年 4 月真正完成集成之后,只用一个月时间就直接能够在真实汽车制造工位中完成所有的工艺流程。“我们从一开始就考虑清楚机器人要去干什么,并且以此为所有的设计原点。”

 

 

这种实用主义渗透在 X1 的每一个设计细节里。面向高精度、多工位、高节拍的工业场景,X1 采用工业级本体设计,搭载自研物理原生智能模型,并构建 Phi-Arch 物理智能开发平台实现规模化部署,具备“一机多能、快速上岗、自我学习”三大核心能力,能够在真实产线中自主感知、决策、操作并持续进化。

 

在感知与定位能力上,X1 搭载由 3D 激光雷达、RGBD 深度相机、双目相机及超声波雷达构成的多维环境感知系统,具备 10mm 定位精度和 0.05mm 末端重复定位能力。仅依靠本体感知能力,X1 可在动态复杂的工业环境中完成高精度定位与稳定作业。这意味着在实际工业环境中,无需进行大规模集成改造即可完成机器人的快速部署与稳定运行,显著降低了工厂智能化升级的门槛。

 

在运动能力上,X1 采用四舵轮全向底盘,支持主动转向、横向“蟹行”、斜向移动、原地回转,可灵活适配产线中的狭窄通道、复杂工位和边移动边操作的动态作业需求。四舵轮结构还具备更好的移动与驻停稳定性,可在作业状态下自主锁定,为高精度操作提供稳定支撑。在作业范围上,X1 采用工业级升降腰结构,在保持机身稳定的同时可拓展垂直方向和远端作业,最大可覆盖 0~2.5 米工作区间。针对双排上料台等深距、高负荷取放件任务,X1 具备抗倾覆和全身协同能力,可保障全流程作业的精准与连续。

 

 

同时,X1 拥有 27 个自由度,全关节力控双臂,支持高精度协同操作。基于全关节 1kHz 的协同控制,以及从关节到末端的实时力感知与力反馈,X1 展现出极佳的柔顺抗阻表现,保障机器人在真实产线中与人员、设备协同作业的安全性与可靠性。

 

此外,X1 配备双电池,支持 1 分钟快速换电,确保工业生产全天候连续性。张涛表示,“X1 支持人工换电,也可以机器人自主换电。我们专门设计了机器人的手臂可以把自己的电池拿起来、放到换电的卡槽里面、再从电池仓里面拿一个新的电池装上去。1 分钟的换电效率目前是针对人工的,对机器人的话现在还是稍微慢了一点,但未来也会逐渐提升,达到对应的换电效率。”

 

通过可替换的末端执行器,X1 可以轻松胜任质检、上料、分拣、拧紧、粘贴、插接、卡接等多种复杂工位作业,实现“一机多能”。同时,依托泛化技能库与高效真机后训练能力,X1 从场景导入到验收上线的周期可显著压缩,实现“快速上岗”。相较于传统工业自动化长达 6 个月以上的方案设计、硬件定制、软件开发、软硬件集成、现场施工、集成调试等冗长流程,X1 的部署周期可缩短至周级甚至天级,帮助工厂更快完成具身智能能力导入。

押注强化学习,“仿真数据比真实数据多用很多”

核心技术路径上,光象科技再次选择了“少数人的路”:以强化学习为最核心的技术能力做具身智能。“过去我们看到绝大部分 VLA 模型都采用模仿学习,采大量数据。我们去年就在讨论这种方式是不是终局,能不能走到最后,我们的结论是不太可能。”

 

张涛进一步拆解了其中的量级逻辑:对标自动驾驶,特斯拉训练端到端模型需要几千万条有效数据,这是从几十亿条数据里筛出来的。而今天具身智能开源模型的数据量级基本在几十万到几百万条,而且非常分散。聚焦到某一个具体场景或任务,可能只有几万或者十几万条。

 

“自动驾驶只解决一个任务,但具身要解决的是几百个、几千个任务。在这种情况下,需要的数据量级是十亿、百亿级别。通过数据量级分析,就知道用监督学习这种方式绝对不可能走到最后。但强化学习能够突破这一点。强化学习是在探索和试错的过程中,通过奖励信号让模型自己学到什么策略最优,能够不断迭代、提升性能。”

 

因此,在算法层面,光象科技构建了覆盖仿真强化学习、真机强化学习和世界模型强化学习的技术体系。依托自研值分布强化学习算法 DSAC、多模态强化学习算法 DACER、均值速度场 MVP、安全强化学习算法 RACS 等算法矩阵,X1 能够在复杂工业任务中实现更高精度、更高成功率和更平滑的动作控制。

 

在数据层面,光象科技以真实工业场景为基础,构建高效率、低成本的数据飞轮。通过 3D 空间物理资产高精度建模、高保真仿真场景生成和大模型生成式扩展,光象科技持续积累工业场景中的高价值数据资产,加速机器人泛化能力从单场景验证走向多场景迁移。

 

"在数据量级规模上,仿真数据是唯一有可能实现指数级扩增的方案:通过堆显卡、并行方式,让数据量级指数级倍增。我们的仿真数据用得比真实数据多,而且是多很多。"张涛表示,数据方案一直在更新迭代,到今天数据方案并没有完全收敛。他们不排斥任何一种数据方案,有更好更低成本的真实数据也会用起来。但他强调,仿真数据是可以被规模化的,所以他们会在仿真数据上投入更大的精力。

 

"如果数据问题解决了,具身智能的长期 AGI 问题就不远了,两者是相关的。自从特斯拉端到端之后,大的技术范式没有太大区别,核心是由数据驱动的端到端范式。怎样利用数据、获取数据的规模与品质,并结合模型结构和训练方法,得到最优最泛化的模型,这些是耦合在一起的。没有单独的数据问题或模型问题,它们是耦合的。"

 

在平台层面,光象科技自研物理智能开发平台 Phi-Arch,覆盖训练数据生成,具身智能模型构建、训练、调优以及集成部署全流程。依托 Phi-Arch 平台,机器人能够实现从对象建模、环境建模、任务转化,到网络构建、优化求解、参数调教、代码部署和控制器集成的完整闭环,显著提升具身智能模型开发、部署与迭代效率。

 

 

基于算法、数据与平台的系统能力,X1 具备从开发部署到真实作业中持续学习和自我进化的能力。机器人可在执行任务过程中持续与真实场景交互,依托自研强化学习算法矩阵在试错和迭代过程中不断优化动作策略,进一步提升操作精度、任务成功率、动作平滑性与场景鲁棒性。这使得 X1 能够持续提升性能上限,形成面向跨工位、跨场景迁移与规模化落地的长期能力。

一年拿下头部车企,靠的是什么?

2025 年创业做机器人,光象科技面临的市场环境并不宽松。头部的具身智能公司已经融资数轮,工厂里也出现了各种机器人的身影。一家新公司,凭什么让车企掏钱?

 

“创立之初,我们就在思考:光象科技到底要做成一家什么样的公司?”这个问题的核心是场景选择。张涛认为,最好的方式是在一个点上做突破,而不是多点开花。在一个点上突破,意味着如果希望重点突破复杂的操作能力,就先不去接触最难的复杂环境,所以工业是典型场景。

 

在他看来,对标过去自动驾驶的发展历程,今天的具身智能从 L2 走向 L4,可能是一个更合理的路径。“如果直接进入家庭场景,意味着既要做非常复杂的任务、非常复杂的操作,又要认知和理解各种各样不同的环境,所有因素交织在一起后,事情会变得极难。”

 

为什么选汽车场景?张涛给出的判断是:"首先,汽车是目前最大规模、复杂程度最高的规模化工业品之一,除汽车之外可能找不到第二个规模如此大、复杂度如此高、还能做到如此成熟标准化的场景。其次,整个汽车制造过程过去做了大量的生产优化,带来了产线极高的一致性和标准化。在一个工位 3 到 5 米的空间里完成相对集中的任务,具身智能机器人既可以实现规模化部署,又能以比较高的效率快速实现工位价值。"

 

事实证明,这个判断是对的。Phi-Bot X1 在焊接上料场景中,面向汽车制造中重复、枯燥且存在灼伤风险的上料工位,可完成抓取、移动、翻转、精准对孔、放置等长程复杂任务。在双孔同时对准高精度作业中,X1 仅依靠本体感知即可实现超高对孔精度,动态位置精度达到毫米级,并将角度精准控制在 0.3°以内。

 

在移动质检场景中,X1 可实现“边走边检”和底盘、腰、臂全身协同控制,完成覆盖式车身表面检测。依托自研物理原生智能模型,X1 能够在移动过程中动态调整姿态与检测路径,兼顾工业级精准度、平滑性与节拍要求,实现车身表面检测覆盖 100%,相比非协同方式效率提升 51%,较人工工位节拍节省 25%~45%。

 

关于一个典型工位的部署周期,张涛透露,"从预训练模型到真实上产线,整个部署过程大概是一周。通过模型能力升级和平台能力升级,预期未来能够把部署周期缩短到以天为量级。"

 

“车厂品控要求高、时间节拍要求高、效率要求高。对机器人落地而言,这是非常好的练兵场。当机器人能够符合完整的产线节拍、性能、品质要求时,意味着机器人有了非常强大的基础能力了。这个时候再把泛化应用到其他类似的场景,会是非常顺理成章的过程。”张涛表示。

先进工厂,最后到家庭

关于未来的场景规划,光象科技的路径很清晰:从工业到商业,再到家庭服务。“工业方面先从汽车切入,但我们面向的不是某一个具体工位,而是某一类任务、某一类技能,比如拧紧、上料、粘贴,这些技能本质上非常通用和泛化。”

 

张涛透露,他们已经与大型工程机械制造企业、汽车零部件制造企业、轨道车辆、轮船制造等多个领域的工业企业展开沟通。"核心能力是通用的。接下来在落地汽车的同时,我们会不断拓展其他工业场景,包括 3C 电子等。"

 

他也坦言,今天我们看到的绝大部分机器人,可靠性都还没有达到工业级的标准,这也是其接下来真正进入产线之后需要面对的重要挑战。“我们会从产品设计选型到整体品控的各个维度把关,也在建立一套质量体系,从零部件的选型测试,整机测试方案,到面向客户交付,各个维度都会考虑可靠性。但产业链的成熟需要时间需要周期。”

 

当前,Phi-Bot X1 是轮式双臂结构,更符合工业场景需求。在这个结构之下,如果后面扩展其他场景,可能需要用到双足或者轮足形态,光象科技会做对应的升级。

 

对于“人形机器人进家庭”的乐观预期,张涛有自己的判断:“前几周看到这个观点时,我恍惚回到了 15 年前的自动驾驶时代,那时大家也说两三年 L4 就能跑街了,15 年后的今天还没有实现。基于客观技术发展的规律,我觉得没有这么快。”

 

至于人形机器人会以什么形态进入家庭,张涛认为没有标准答案。“如果只是铺床叠被、整理东西、擦桌子,确实不需要双足。但如果提供的价值不在功能层面,而是情感价值,那确实需要人形,而且是拟人度非常高的形态。”

 

“所以这两种形态都可能出现,关键取决于我们想让机器人提供什么样的价值。”

 

从汽车产线出发,先让机器人“打上工”,这是光象科技当下拿出的行业入场券。