2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

“Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运

  • 2024-08-10
    北京
  • 本文字数:2490 字

    阅读完需:约 8 分钟

大小:1.20M时长:07:00
“Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运

整理 | 华卫、核子可乐


乒乓球的影响力早已不必多言,每一代国人都有着自己的国乒记忆。这个夏天,在 2024 巴黎奥运会人们又见证更多国乒名场面。最新赛绩是,中国乒乓男团和女团均晋级巴黎奥运会决赛。


8 月 9 日,DeepMind 的研究人员公布了首款能够与人类业余水平对抗的 AI 机器人乒乓球手,该系统将 ABB IRB 1100 工业机械手臂与 DeepMind 的定制 AI 软件结合起来。虽然人类专业运动员仍然更胜一筹,但该系统仍展示出机器在处理复杂物理任务时的瞬间决策与强大适应能力。

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    而自十年前以来,乒乓球就在对机器人手臂进行基准测试方面发挥了关键作用,因为这项运动需要速度、反应能力和策略等。


    研究人员在 arXiv 上发表的预印本论文中写道,“这是第一款能够与人类水平相比肩的运动机器人智能体,代表着机器人学习与控制领域的又一个里程碑。”

    预印本论文链接:https://arxiv.org/abs/2408.03906


    据了解,这款尚未正式定名的乒乓球机器人智能体(我们建议称之为“AlphaPong”)由包括 David B. D'Ambrosio、Saminda Abeyruwan 和 Laura Graesser 在内的研究团队开发而成,并且在与不同技能水平的人类选手开展一系列对抗中表现出色。在一项涉及 29 名参与者的研究当中,这款 AI 机器人成功拿下 45%的胜率,展现出扎实的业务级别球技。


    更值得注意的是,它在与初学者的比赛中取得了 100%的胜率,在与中级选手的比赛中胜率同样达到 55%。然而,它还没有准备好与专业人士抗衡,在与高级选手对抗时每次都会输。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      谷歌 DeepMind 视频显示了 AI 智能体与人类乒乓球运动员的对决画面。


      有网友这样评价谷歌的乒乓球机器人,“四年后,它应该代表美国参加奥运会。”也有网友质疑其能力,表示“作为一名拥有 30 多年乒乓球 经 验 的 终 身 运 动 员 , 我 怀 疑 目 前 这 款 机 器 人 能 否 从 我 这 里 拿 下 一 分 。 ”

      能与各级选手对打,自适应输出乒乓球战术

      乒乓球是一项对体力要求很高的运动,需要人类运动员经过多年的训练才能达到高水平的熟练程度。


      据介绍,AlphaPong 的物理配置包括之前提到的 IRB 1100,这是一台 6 自由度机械臂,安装在两条线性轨道之上,使其可以在 2D 平面上自由移动。另有高速摄像机用于跟踪球的位置,而动作捕捉系统则负责观察人类对手的球拍动作。


      为了建立起能够驱动机械臂的主脑,DeepMind 研究人员开发出一种两级方法,使得机器人能够执行特定的乒乓球战术,同时根据每位对手的打法实时调整其策略。换句话说,它具有足够的适应性,可以与任何业余级别的乒乓球选手比赛,而无需针对不同球员的情况接受特定训练。


      该系统的架构将底层技能控制器(经过训练以执行特定乒乓球技术,例如正手击球、反手回球或者接发抢攻)与高级战略决策器(一种更为复杂的 AI 系统,能够分析比赛状态、适应对手风格,并针对每个来球选择激活相应的底层技能策略)结合起来。


      研究人员表示,AlphaPong 的关键创新点之一在于 AI 模型的具体训练方法。据介绍,他们选择了一种混合方法,在模拟物理环境中使用强化学习,同时将现实世界的实例作为训练数据来源。这种技术使得机器人能够从约 1.75 万种真实存在的乒乓球飞行轨迹中学习——对于一项复杂的任务来说,这样的数据集确实相当袖珍了。


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        谷歌 DeepMind 视频展示了 AI 智能体如何分析人类选手。


        研究人员还使用迭代过程以完善机器人的技能,从小批量人机对战数据集起步,之后再让 AI 与真实对手较量。并且,每场比赛都会生成关于小球飞行轨迹与人类策略的新数据,团队将这些数据反馈到模拟当中以开展进一步训练。


        据介绍,该机器人在模拟环境中进行训练时,可以准确地模拟乒乓球比赛的物理特性。一旦部署到现实世界中,它就会收集有关其与人类相比的性能数据,以在模拟中改进其技能,并创建一个连续的反馈循环。

        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          整个过程重复了七个周期,使得机器人能够不断适应越来越熟练的对手和更加多样化的比赛风格。到最后一轮,AI 已经从超过 1.4 万个对拉球与 3000 次发球中学习,积累下大量乒乓球知识,帮助其弥合了模拟与真实场景之间的差距。


          有趣的是,英伟达也一直在试验类似的模拟物理系统。以 Eureka 为例,这套系统允许 AI 模型快速在模拟空间、而非现实世界当中学习控制机械臂。在模拟当中加速物理效应,甚至能够同时开展数千次试验,这种方法有望大大减少未来机器人训练中复杂交互所耗费的大量时间和资源。


          被人类选手所喜爱,但因局限性不敌高水平球员

          除了对战技术成就之外,谷歌的这项研究还探索了人类与 AI 选手之间的对抗体验。令人惊讶的是,哪怕是输给了乒乓球机器人智能体,人类选手仍然表示非常享受这种比赛体验。


          研究人员指出,“在所有技能组和胜率情况下,人类选手都表示与机器人对战既‘有趣又引人入胜’。”这种积极的反响,表明 AI 在体育训练和娱乐方面或有着广阔的潜在应用空间。


          当然,这套系统也有自己的局限性,其在处理速度极快的球及高球方面表现不佳,且难以发现剧烈的球体旋转,在反手比赛中表现较弱。谷歌 DeepMind 还分享了一段演示视频,其中显示 AI 智能体由于很难对快速回球做出反应而被高水平球员成功拿下一分。


          不过,谷歌 DeepMind 研究团队也正在优化解决这些不足之处。以下是其计划解决快球问题的方法:“为了解决阻碍机器人对快球反应时间的延迟限制,我们建议研究先进的控制算法和硬件优化,可能包括探索预测模型来预测球的轨迹,或者在机器人的传感器和执行器之间实现更快的通信协议。”


          谷歌 DeepMind 研究团队强调,随着成果的进一步完善,他们相信该系统未来有望与高水平乒乓球运动员一较高下。在开发能够击败人类选手的 AI 模型方面,DeepMind 可谓是经验丰富,包括之前围棋界的大魔王 AlphaZero 与 AlphaGo。国际象棋与智能问答的桂冠已经落入了人工智能手中,也许乒乓球就是下一个目标。


          研究人员还表示,这位机器人乒乓球“神童”的影响绝不仅限于乒乓球领域,其潜在应用范围很大。为该项目开发出的技术,完全可以应用于各种需要快速反应并适应人类不可预测行为的机器人任务,包括制造业和医疗保健。


          参考链接:

          https://arstechnica.com/information-technology/2024/08/man-vs-machine-deepminds-new-robot-serves-up-a-table-tennis-triumph/

          https://techcrunch.com/2024/08/08/google-deepmind-develops-a-solidly-amateur-table-tennis-robot/?guccounter=1

          2024-08-10 00:005182

          评论

          发布
          暂无评论
          发现更多内容

          微信业务架构图&学生管理系统架构设计

          张逃逃

          「架构实战营」

          开发人员的编程心理学

          码语者

          编程 心理学 开发

          Flutter 中使用Chip 小部件【Flutter专题66】

          坚果

          flutter 1月月更

          HUAWEI DevEco Studio使用技巧【鸿蒙开发 06】

          坚果

          1月月更

          大厂面试:一个四年多经验程序员的BAT面经(字节、阿里、腾讯)

          鄙人薛某

          字节跳动 java面试 大厂面试 社招 面经分享

          10倍!BoostKit鲲鹏全局缓存3大创新技术助力Ceph性能提升

          华为云开发者联盟

          Ceph 鲲鹏 BoostKit鲲鹏全局缓存技术 BoostKit 全局缓存

          基于Javaweb,SSM火车订票系统

          叫练

          龙蜥社区理事长展望操作系统 2022:加速驶向快车道,云、XPU和开源成“催化剂”

          OpenAnolis小助手

          Linux 开源 操作系统 国产化 龙蜥

          带薪撸猫是一种什么样的体验?

          万事ONES

          kafka 原理深度剖析系列|调优策略

          云智慧AIOps社区

          Java kafka 架构 消息队列 消息中间件

          微信业务架构 & 学生管理系统架构设计

          王大胖

          再获认可 | 优麒麟荣获“最佳技术社区运营”奖

          优麒麟

          Linux InfoQ 2022 优麒麟

          Spark性能调优-RDD算子调优

          五分钟学大数据

          spark 1月月更

          Hive窗口函数/分析函数详解

          五分钟学大数据

          hive 1月月更

          极简实现 TiDB 冷热数据分层存储 | He3 团队访谈

          PingCAP

          顶级好用的 5 款 Vue table 表格组件测评与推荐

          蒋川

          Vue vue table

          vivo数据库与存储平台的建设和探索

          vivo互联网技术

          数据库 存储技术 平台架构

          kafka 原理深度剖析系列|分区分配策略

          云智慧AIOps社区

          Java kafka 架构 中间件 消息队列

          Java自定义DNS解析器三种实践

          FunTester

          Java 性能测试 DNS FunTester 自定义DNS

          2022最受Flutter 开发者喜爱的库

          坚果

          flutter 1月月更

          kafka原理深度剖析系列|基本原理与架构

          云智慧AIOps社区

          Java kafka 架构 消息队列 消息中间件

          我为InfoQ编辑器提意见

          坚果

          1月月更

          使用CodeMirror打造数据科学家使用的IDE(一)

          Baihai IDP

          人工智能 ide 数据科学 CodeMirror

          基于Javaweb,Mysql生物信息数据管理系统

          叫练

          模块六作业

          whoami

          「架构实战营」

          如何用建木CI创建SSL证书并部署到nginx

          Jianmu

          持续集成 SSL证书 自动化运维

          模块一第2课随堂练习

          苍狼

          模块一

          914. 卡牌分组——欧几里得算法

          CRMEB

          模块一第1课随堂测验

          苍狼

          模块一

          2022 年前端工程师进阶必知必会

          开源之巅

          Serverless

          Linux之grep命令

          入门小站

          Linux

          “Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运_生成式 AI_华卫_InfoQ精选文章