写点什么

智元联合北大、智源实现人形机器人自主打乒乓

  • 2026-04-15
    北京
  • 本文字数:1599 字

    阅读完需:约 5 分钟

继 4 月 10 日亮相中美“乒乓外交” 55 周年纪念大会展区后,搭载北大-智源 SpikePingpong 算法的智元灵犀 X2 人形机器人于 4 月 13 日登陆纪念“乒乓外交”55 周年友谊赛,在上海体育大学纪念友谊赛现场完成无遥控、全自主乒乓球对打,与中美运动员切磋交流,以京沪双城联动的科技展演,让“小球转动大球”的外交佳话在具身智能时代焕发全新活力。

此次系列成果核心来自 SpikePingpong 算法,这是全球首个将高频脉冲视觉与模仿学习结合的人形机器人乒乓运动控制算法,实现高速动态场景下的精准感知与全身协调控制,完成从机械臂到人形机器人的“一脑多形”关键跨越,在高速动态对抗中展现毫米级轨迹预测与精准击球能力,标志着中国人形机器人具身智能技术迈入新阶段。

脉冲视觉+模仿学习:破解人形乒乓三大技术难题

乒乓球作为高动态、高对抗性运动,对机器人感知、决策与运动控制提出三重极限挑战:球速超 5m/s 需亚秒级反应、轨迹受空气阻力等物理干扰、全身协调需兼顾击球精度与姿态平衡。SpikePingpong 算法创新性融合 20kHz 高频脉冲视觉与模仿学习策略,构建端到端运动控制快慢系统,攻克上述核心难点。

1. SONIC 脉冲感知模块:基于北京大学黄铁军教授原创的脉冲视觉技术(Spike CV),通过高频脉冲相机捕捉乒乓球高速运动轨迹,实时补偿物理干扰,实现球-拍接触点的毫米级精准预测,较传统视觉方案响应速度提升 10 倍,为精准击球奠定感知基础。

2. IMPACT 策略规划模块:采用模仿学习框架,从人类顶尖运动员动作数据中提取击球策略,输出最优全身协调动作,实现对 30cm 目标区域 91%命中率、20cm 高精度区域 71%命中率的卓越表现,较前代 SOTA 方案提升 37%-38%。

3. 感控融合技术:深度适配灵犀 X2 的 29 个自由度本体与 Xyber-Edge 小脑控制器,实现从视觉感知到关节执行的亚毫秒级指令传输,让机器人在动态对抗中保持平衡的同时完成精准击球,展现类人化运动灵活性。

10 天速成乒乓高手:硬件-算法协同创新落地京沪

此次技术突破得益于智元“本体+ AI”全栈技术布局与北大-智源算法创新的深度融合。联合团队仅用 10 天完成从算法适配到系统联调的全流程开发,基于 SpikePingpong 算法、灵犀 X2 开放的 SDK 生态与模型积累,快速实现技术落地验证,并顺利完成北京、上海两场高规格展演。

灵犀 X2 作为中国自主研发的双足人形机器人代表,全栈自研硬件为算法提供坚实支撑:自主研发的 Powerflow 关节模组峰值 120N・m 扭矩输出,Xyber-DCU 域控制器保障多模态数据实时处理,抗摔柔性材料与全身 29 自由度设计确保运动稳定性与安全性,支撑机器人在京沪两地连续完成高强度对打演示。

从北京到上海:科技致敬乒乓外交精神

4. 月 10 日北京会场,灵犀 X2 与邓亚萍、郑敏之等乒乓名将互动对打,流畅完成连续接球、攻防转换、多回合对抗;4 月 13 日上海站友谊赛现场,机器人再度以全自主姿态登场,作为“科技友谊使者”与美国乒乓球运动员切磋球技,实现乒乓外交精神从体育交流到科技交流的延伸。

图:曾任基辛格博士助教的沃特金斯先生与智元机器人乒乓对打

北京大学计算机学院研究员、智源具身大模型负责人仉尚航教授表示:“55 年前,乒乓球以民间交流叩开中美友好大门;55 年后,我们用 SpikePingpong 算法为灵犀 X2 注入乒乓智慧,京沪双城展演既是对历史的致敬,也是中国具身智能实力的集中展示。这项技术将推动高速操控、精密交互等领域的广泛应用,拓展‘本体+ AI’生态边界。”

技术引领未来:人形机器人迈向通用运动智能

SpikePingpong 算法的成功应用,标志着中国人形机器人在高速动态场景具身智能技术上实现三大突破:首次将脉冲视觉用于人形机器人乒乓控制、实现物理干扰下的精准轨迹预测、达成全身协调的类人化运动表现。

未来,智元机器人将持续联合北京大学、北京智源人工智能研究院深化具身智能技术研发,以“本体+ AI”双轮驱动,推动人形机器人在更多国际舞台展现中国创新力量,让“小球转动大球”的精神在科技赋能下拥有跨越代际、连接世界的全新表达。

论文地址:https://arxiv.org/abs/2506.06690