如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

“Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运

  • 2024-08-10
    北京
  • 本文字数:2490 字

    阅读完需:约 8 分钟

大小:1.20M时长:07:00
“Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运

整理 | 华卫、核子可乐


乒乓球的影响力早已不必多言,每一代国人都有着自己的国乒记忆。这个夏天,在 2024 巴黎奥运会人们又见证更多国乒名场面。最新赛绩是,中国乒乓男团和女团均晋级巴黎奥运会决赛。


8 月 9 日,DeepMind 的研究人员公布了首款能够与人类业余水平对抗的 AI 机器人乒乓球手,该系统将 ABB IRB 1100 工业机械手臂与 DeepMind 的定制 AI 软件结合起来。虽然人类专业运动员仍然更胜一筹,但该系统仍展示出机器在处理复杂物理任务时的瞬间决策与强大适应能力。

00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    而自十年前以来,乒乓球就在对机器人手臂进行基准测试方面发挥了关键作用,因为这项运动需要速度、反应能力和策略等。


    研究人员在 arXiv 上发表的预印本论文中写道,“这是第一款能够与人类水平相比肩的运动机器人智能体,代表着机器人学习与控制领域的又一个里程碑。”

    预印本论文链接:https://arxiv.org/abs/2408.03906


    据了解,这款尚未正式定名的乒乓球机器人智能体(我们建议称之为“AlphaPong”)由包括 David B. D'Ambrosio、Saminda Abeyruwan 和 Laura Graesser 在内的研究团队开发而成,并且在与不同技能水平的人类选手开展一系列对抗中表现出色。在一项涉及 29 名参与者的研究当中,这款 AI 机器人成功拿下 45%的胜率,展现出扎实的业务级别球技。


    更值得注意的是,它在与初学者的比赛中取得了 100%的胜率,在与中级选手的比赛中胜率同样达到 55%。然而,它还没有准备好与专业人士抗衡,在与高级选手对抗时每次都会输。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00


      谷歌 DeepMind 视频显示了 AI 智能体与人类乒乓球运动员的对决画面。


      有网友这样评价谷歌的乒乓球机器人,“四年后,它应该代表美国参加奥运会。”也有网友质疑其能力,表示“作为一名拥有 30 多年乒乓球 经 验 的 终 身 运 动 员 , 我 怀 疑 目 前 这 款 机 器 人 能 否 从 我 这 里 拿 下 一 分 。 ”

      能与各级选手对打,自适应输出乒乓球战术

      乒乓球是一项对体力要求很高的运动,需要人类运动员经过多年的训练才能达到高水平的熟练程度。


      据介绍,AlphaPong 的物理配置包括之前提到的 IRB 1100,这是一台 6 自由度机械臂,安装在两条线性轨道之上,使其可以在 2D 平面上自由移动。另有高速摄像机用于跟踪球的位置,而动作捕捉系统则负责观察人类对手的球拍动作。


      为了建立起能够驱动机械臂的主脑,DeepMind 研究人员开发出一种两级方法,使得机器人能够执行特定的乒乓球战术,同时根据每位对手的打法实时调整其策略。换句话说,它具有足够的适应性,可以与任何业余级别的乒乓球选手比赛,而无需针对不同球员的情况接受特定训练。


      该系统的架构将底层技能控制器(经过训练以执行特定乒乓球技术,例如正手击球、反手回球或者接发抢攻)与高级战略决策器(一种更为复杂的 AI 系统,能够分析比赛状态、适应对手风格,并针对每个来球选择激活相应的底层技能策略)结合起来。


      研究人员表示,AlphaPong 的关键创新点之一在于 AI 模型的具体训练方法。据介绍,他们选择了一种混合方法,在模拟物理环境中使用强化学习,同时将现实世界的实例作为训练数据来源。这种技术使得机器人能够从约 1.75 万种真实存在的乒乓球飞行轨迹中学习——对于一项复杂的任务来说,这样的数据集确实相当袖珍了。


      00:00 / 00:00
        1.0x
        • 3.0x
        • 2.5x
        • 2.0x
        • 1.5x
        • 1.25x
        • 1.0x
        • 0.75x
        • 0.5x
        网页全屏
        全屏
        00:00


        谷歌 DeepMind 视频展示了 AI 智能体如何分析人类选手。


        研究人员还使用迭代过程以完善机器人的技能,从小批量人机对战数据集起步,之后再让 AI 与真实对手较量。并且,每场比赛都会生成关于小球飞行轨迹与人类策略的新数据,团队将这些数据反馈到模拟当中以开展进一步训练。


        据介绍,该机器人在模拟环境中进行训练时,可以准确地模拟乒乓球比赛的物理特性。一旦部署到现实世界中,它就会收集有关其与人类相比的性能数据,以在模拟中改进其技能,并创建一个连续的反馈循环。

        00:00 / 00:00
          1.0x
          • 3.0x
          • 2.5x
          • 2.0x
          • 1.5x
          • 1.25x
          • 1.0x
          • 0.75x
          • 0.5x
          网页全屏
          全屏
          00:00


          整个过程重复了七个周期,使得机器人能够不断适应越来越熟练的对手和更加多样化的比赛风格。到最后一轮,AI 已经从超过 1.4 万个对拉球与 3000 次发球中学习,积累下大量乒乓球知识,帮助其弥合了模拟与真实场景之间的差距。


          有趣的是,英伟达也一直在试验类似的模拟物理系统。以 Eureka 为例,这套系统允许 AI 模型快速在模拟空间、而非现实世界当中学习控制机械臂。在模拟当中加速物理效应,甚至能够同时开展数千次试验,这种方法有望大大减少未来机器人训练中复杂交互所耗费的大量时间和资源。


          被人类选手所喜爱,但因局限性不敌高水平球员

          除了对战技术成就之外,谷歌的这项研究还探索了人类与 AI 选手之间的对抗体验。令人惊讶的是,哪怕是输给了乒乓球机器人智能体,人类选手仍然表示非常享受这种比赛体验。


          研究人员指出,“在所有技能组和胜率情况下,人类选手都表示与机器人对战既‘有趣又引人入胜’。”这种积极的反响,表明 AI 在体育训练和娱乐方面或有着广阔的潜在应用空间。


          当然,这套系统也有自己的局限性,其在处理速度极快的球及高球方面表现不佳,且难以发现剧烈的球体旋转,在反手比赛中表现较弱。谷歌 DeepMind 还分享了一段演示视频,其中显示 AI 智能体由于很难对快速回球做出反应而被高水平球员成功拿下一分。


          不过,谷歌 DeepMind 研究团队也正在优化解决这些不足之处。以下是其计划解决快球问题的方法:“为了解决阻碍机器人对快球反应时间的延迟限制,我们建议研究先进的控制算法和硬件优化,可能包括探索预测模型来预测球的轨迹,或者在机器人的传感器和执行器之间实现更快的通信协议。”


          谷歌 DeepMind 研究团队强调,随着成果的进一步完善,他们相信该系统未来有望与高水平乒乓球运动员一较高下。在开发能够击败人类选手的 AI 模型方面,DeepMind 可谓是经验丰富,包括之前围棋界的大魔王 AlphaZero 与 AlphaGo。国际象棋与智能问答的桂冠已经落入了人工智能手中,也许乒乓球就是下一个目标。


          研究人员还表示,这位机器人乒乓球“神童”的影响绝不仅限于乒乓球领域,其潜在应用范围很大。为该项目开发出的技术,完全可以应用于各种需要快速反应并适应人类不可预测行为的机器人任务,包括制造业和医疗保健。


          参考链接:

          https://arstechnica.com/information-technology/2024/08/man-vs-machine-deepminds-new-robot-serves-up-a-table-tennis-triumph/

          https://techcrunch.com/2024/08/08/google-deepmind-develops-a-solidly-amateur-table-tennis-robot/?guccounter=1

          2024-08-10 00:005145

          评论

          发布
          暂无评论
          发现更多内容

          英伟达黄仁勋GTC演讲,算力和数据等基础设施驱动AI蓬勃发展

          PowerVerse

          算力 AGI DePIN GTC2025

          【HarmonyOS】鸿蒙原生分享之“碰一碰”分享(APP内实现)

          走向菜鸟的菜鸟

          鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT 实践分享

          海信洗衣机闪耀AWE:三筒品类开创者亮剑,大咖嘉宾连连盛赞

          新消费日报

          探秘能源行业AI密码:云鼎科技用大模型实现了″四个转变″

          Alter

          混合APP开发的特点

          北京木奇移动技术有限公司

          APP开发 软件外包公司 APP外包公司

          今日最新消息!黑龙江网络安全等级保护备案新规定,速看!

          黑龙江陆陆信息测评部

          源于代码而不止于代码

          FunTester

          4 大开源产品帮你避免闭源低代码平台的隐藏成本

          NocoBase

          开源 低代码 零代码 开发工具 隐藏成本

          SPC统计过程管理系统(源码+文档+讲解+演示)

          深圳亥时科技

          5步教你创建大模型自定义插件

          阿里技术

          大模型 自定义插件 LLM

          深入探究小红书笔记详情页面数据采集接口​

          tbapi

          小红书笔记详情接口 小红书API

          Intel 18A双引擎:RibbonFET搭配PowerVia如何提升芯片性能

          E科讯

          原生APP开发的优势

          北京木奇移动技术有限公司

          APP开发 软件外包公司 APP开发公司

          如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介

          阿里云大数据AI技术

          人工智能 大模型 LLM PAI 模型评测

          产品溯源管理系统(源码+文档+讲解+演示)

          深圳亥时科技

          GreatSQL 为何选择全表扫描而不选索引

          GreatSQL

          【HarmonyOS】关于鸿蒙原生项目多环境的配置和管理

          走向菜鸟的菜鸟

          鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT 实践分享

          华大北斗芯耀纽伦堡嵌入式展EW2025

          江湖老铁

          狄耐克脑电波交互事业部参访厦门大学实验室,共探脑科学前沿应用

          新消费日报

          鸿蒙相机开发实战:从设备适配到性能调优 —— 我的 ArkTS 录像功能落地手记(API 15)

          李游Leo

          HarmonyOS

          使用DataWorks Notebook实现智能图片标注,给你的图片加个“注释”

          阿里云大数据AI技术

          大数据 数据分析 ETL 多模态 Dataworks

          BOE(京东方)携手京东发起百吋电视品牌联盟发布会 引领家庭视听正式迈入大屏时代

          科技热闻

          APP的开发方式及特点

          北京木奇移动技术有限公司

          APP开发 软件外包公司 APP开发公司

          计算机就业看过来,16家宝藏外企分享

          王中阳Go

          计算机 就业 外企

          这些搜索技巧你不会?

          Immerse

          人效评估管理系统(源码+文档+讲解+演示)

          深圳亥时科技

          “全球金牌课程”5月17-18日·上海线下·CSM认证【提前报名特惠】CST导师亲授

          ShineScrum

          敏捷 CSM认证 CSM认证培训

          “团队敏捷教练进阶课程” 6月28-29日 · A-CSM认证周末班

          ShineScrum

          基于 pyflink 的算法工作流设计和改造

          Apache Flink

          大数据 flink 实时计算

          「DeepSeek-V3 技术解析」:DeepSeekMoE

          Baihai IDP

          程序员 AI LLMs MoE DeepSeek-V3

          电子签高利贷实况解读:央视3·15乌龙曝光,电子签行业替高利贷买单

          易成研发中心

          “Alpha 乒乓”来了!学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手!网友:4 年后代表美国打奥运_生成式 AI_华卫_InfoQ精选文章