写点什么

世界模型全球第一被中国拿下!极佳视界 GigaWorld-1 得分碾压谷歌、英伟达,开源半月狂揽 16K 下载

  • 2026-03-31
    北京
  • 本文字数:1454 字

    阅读完需:约 5 分钟

近日,极佳视界的 GigaWorld 系列具身世界模型再次迎来升级,其最新力作 GigaWorld-1 在世界模型领域的顶级权威评测基准 WorldArena 中,一举击败谷歌、英伟达、阿里等国际顶尖科技巨头与学术机构的模型,荣登全球榜首,并成为榜单中唯一一个综合得分突破 60 分大关的具身世界模型。

在三大核心维度上,GigaWorld-1 展现出了断层式的领先优势:Physics Adherence(物理遵循)相比第二名大幅提升 16%;3D Accuracy(3D 准确度)更是取得了逼近满分的惊人成绩;Visual Quality(视觉质量)同样遥遥领先。这标志着 GigaWorld-1 已经真正蜕变为一个 “视觉真实、几何精准、物理准确”的全能型具身世界模型。

据了解,WorldArena 吸引了全球几乎所有头部世界模型团队同台竞技,首批参评名单涵盖了谷歌、英伟达、阿里等科技巨头。作为世界模型领域公认的“试金石”,WorldArena 评测基准由清华大学联合普林斯顿大学、新加坡国立大学、北京大学、香港大学、中国科学院、上海交通大学以及中国科学技术大学等 8 所国内外顶尖高校及科研机构的权威专家共同打造。

 

该基准摒弃了单一维度的片面测试,构建了包含 16 项细分核心指标和 3 大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的“压力测试”。

硬核技术解密

从技术路线上看,GigaWorld-1 是一款专为具身场景打造的 AC-WM(Action-Conditioned World Model,动作控制世界模型)。相较于传统的世界模型,GigaWorld-1 深度继承并发展了极佳视界在 2025 年 7 月发布的 EmbodieDreamer 核心架构。

 

该方案不仅引入了显式的动作建模机制,从根本上保证了视频生成过程中的几何一致性;更创新性地融入了可微分物理引擎,从而获取精准的机械臂物理参数,以实现对复杂物理交互过程的真实模拟与严格遵循。在此前沿架构的基础上,极佳视界进一步引入了团队长期积累的上万小时高质量真实机器人操作视频数据进行训练,极大地增强了模型在开放场景下的泛化能力与高精度的动作遵循表现。

 

目前,GigaWorld-1 的核心代码与部分数据集已开源,并作为官方 Baseline 强力支持即将于 3 个月后在美国举行的 GigaBrain Challenge @ CVPR 2026 国际挑战赛,积极赋能全球开发者,推动具身智能生态的繁荣发展。在开源后的短短半个月内,在 Huggingface 平台的下载量便火速突破 16000 次,足见学术界与工业界对其技术实力的高度认可,以及在开发者社区中的巨大影响力。

比赛官网:https://gigaai-research.github.io/GigaBrain-Challenge-2026/

开源代码:https://github.com/open-gigaai/CVPR-2026-Workshop-WM-Track

开源模型、数据:https://huggingface.co/collections/open-gigaai/cvpr-2026-worldmodel-track

 

作为全球领先的世界模型团队,极佳视界一直深耕并引领具身世界模型技术的演进。纵观其 GigaWorld 系列的发展历程,每一次迭代都代表着行业的重大突破:GigaWorld-0:全球首个验证“世界模型生成数据能够有效提升真实物理机器人(VLA)性能”的里程碑式工作,其 GitHub 开源代码斩获 1.5k+ Star,奠定了技术验证的基础。

 

  • GigaWorld-1:当前全球最领先的 AC-WM。在世界模型领域权威评测 WorldArena 榜单中登顶全球第一,全面超越国际顶尖巨头,成为唯一综合得分 60+的具身世界模型。

  • GigaWorld-Policy:速度最快、性能最强、效率最高的世界动作模型(WAM)。实现了对主流 WAM 推理效率和性能的全面碾压:实测数据显示,GigaWorld-Policy 实现了 10 倍推理速度与 10 倍训练效率的跨越式提升,同时任务成功率大幅上涨 30%,标志着具身智能正式迈入由世界模型驱动的新纪元。