写点什么

地瓜机器人算法副总裁隋伟博士确认出席 QCon 上海,分享具身智能中的 VLA 技术及其应用

  • 2025-09-03
    北京
  • 本文字数:1800 字

    阅读完需:约 6 分钟

大小:971.52K时长:05:31
地瓜机器人算法副总裁隋伟博士确认出席 QCon 上海,分享具身智能中的 VLA 技术及其应用

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


地瓜机器人算法副总裁隋伟博士已确认出席并发表题为具身智能中的 VLA 技术及其应用的主题分享。传统的具身智能操作方法将视觉感知、语言理解和动作规划分割为独立模块,导致系统复杂、误差易累积且泛化能力不足;视觉语言动作模型(VLA)则实现了从多模态感知到动作生成的端到端学习,构建了 “所见即所动” 的智能决策闭环,极大地推动了具身智能发展。


然而视觉语言动作模型本身也存在诸多挑战,例如训练数据难以获取、模型结构缺少长时序和物理逻辑推理的能力。这意味着 VLA 虽然能实现一些操作功能但是对不同场景、不同任务的泛化性仍然存在挑战,无法满足实际的需求。


本次演讲主要分享 VLA 技术的基本原理和机制,以及在落地过程中涉及到的数据、评测等问题, 从而提升 VLA 的性能和易用性。



隋伟博士,现任地瓜机器人算法技术副总裁。2011 年,他于北京航空航天大学探测制导与控制技术专业毕业,之后进入中科院自动化研究所深造,并取得博士学位,其研究方向为模式识别与智能系统。


2016 年 7 月博士毕业后,担任模式识别国家重点实验室助理研究员,负责 3D 视觉感知方向的研发工作。2019 年 1 月隋伟博士加入地平线,任高级算法工程师,主要负责机器人和自动驾驶场景下,基于旭日和征程系列芯片的 2.5D 及 3D 视觉算法研发。2020 年 12 月- 2023 年 12 月,任研发总监,带领团队(30 人)成功开发了地平线高阶自动驾驶 BEV 感知方案,并且搭建了国内首套最为完备且先进的 4D Label 标注系统。目前旭日系列芯片出货量已达数百万片,BEV 感知方案也已在多个车型上定点量产,为自动驾驶领域的发展做出了重要贡献。隋伟博士在 ICRA、IROS、CVPR、TIP、TVCG 等国内外知名期刊和会议上先后发表学术论文 20 余篇,拥有专利 40 多项。此外,他长期担任 ICRA、IROS 等机器人会议的审稿人,同时担任《智能驾驶和机器视觉》《智能驾驶与多维重建》等自动驾驶相关著作的主编。


2023 年 11 月至今任地瓜机器人(地平线全资子公司)算法 & 技术 VP ,负责面向消费机器人和具身智能的软件算法方案研发。他在本次会议的详细演讲内容如下:


演讲提纲

1. 具身智能 VLA 的现状及挑战

  • VLA 是什么,用来解决什么问题及 VLA 的业界发展现状

  • 分层式 VLA 和端到端 VLA 的路线

  • VLA 的挑战:模型场景泛化性、任务泛化性和本体泛化性弱,VLA 模型数据获取困难,对算力要求大

2. 分层式 VLA 架构

  • 模型架构

  • 分模块功能及原理

3. VLA 的数据方案

  • 仿真数据的获取方式

  • 遥操采集及数据预处理

4. VLA 的量化部署

  • 模型优化

  • 模型量化


您认为,这样的技术在实践过程中有哪些痛点?

  • 如何设计合理的、符合需求的 VLA 模型,让模型具备一定的泛化和迁移能力

  • 如何获取高质量的 VLA 数据

  • VLA 在边缘侧的高效运行


演讲亮点

  • 从实用的角度,详细介绍 VLA 的技术原理,和影响性能的关键因素

  • 对 VLA 中常用的仿真和真机采集两条数据路线进行详细的分析

  • 详细介绍 VLA 对端侧算力的需求以及部署的工程实践


听众收益

  • 系统了解具身智能领域中 VLA 技术的现状、挑战和发展趋势

  • 理解 VLA 的模型技术架构,各个模块的作用

  • 理解仿真数据和真机数据的区别和作用

  • 获得开发 VLA 的实践思路和工程经验,包括模型设计、数据获取和量化部署


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,,详情可联系票务经理 18514549229 咨询。


2025-09-03 16:301

评论

发布
暂无评论
地瓜机器人算法副总裁隋伟博士确认出席 QCon 上海,分享具身智能中的 VLA 技术及其应用_AI&大模型_QCon全球软件开发大会_InfoQ精选文章