2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

上海交通大学 AI 学院副教授赵波将在 AICon 上海分享大模型在长视频理解中的前沿进展

  • 2025-04-21
    北京
  • 本文字数:1075 字

    阅读完需:约 4 分钟

大小:586.45K时长:03:20
上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


上海交通大学人工智能学院副教授赵波已确认出席 AICon 上海并将在多模态大模型创新实践专题发表题为《大模型在长视频理解中的前沿进展》的主题演讲。近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力。其中基于大模型的长视频理解任务受到了越来越多的关注,其在教育、影视、安防等领域具有广泛的应用前景。然后由于大语言模型的有效上下文长度有限,难以用有限的 GPU 计算资源实现长视频理解。


针对这一研究问题,课题组首先推出了面向长视频理解大模型的测评基准:MLVU,提供了丰富的评测任务,揭示了主流大模型在长视频理解任务上的能力缺陷。针对长视频数据 Token 数量过多的问题,课题组提出利用可学习 Token 来自适应地压缩视频 Token,从而实现单张卡处理 1 小时以上视频的能力。


在本次分享中,赵波教授将系统解析长视频理解大模型的技术挑战与创新突破,结合课题组提出的测评基准与压缩技术,探讨解决 GPU 资源受限下长视频处理难题的实践路径。


赵波是国家级青年人才,曾担任智源研究院数据智能研究中心负责人。博士毕业于英国爱丁堡大学。主要研究方向包括多模态大模型,具身智能,数据智能等。曾提出系列有影响力的数据蒸馏与合成算法。推出的多模态大模型 Bunny 已被下载数十万次。发表包括 ICLR Oral, NeurIPS Spotlight, CVPR Highlight 等数十篇顶会顶刊论文。曾获得 ICML 2022 杰出论文奖。担任 NeurIPS’24、BMVC’24 领域主席。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 基于大模型的长视频理解任务与挑战

  2. 主流的视频理解模型与能力测评

  3. 基于可学习 Token 的视频 Token 压缩技术

    可学习的压缩 Token

    自适应切片算法

    训练数据扩增方法

  4. 应用实例分析

  5. 总结与展望


听众收益:

  • 了解最新的长视频理解大模型性能和局限性

  • 了解最新的长视频理解大模型 Token 压缩技术



除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-21 17:006282

评论

发布
暂无评论

Gtags解决UnicodeEncodeError问题

Geek_pwdeic

开源大数据集成框架ChunJun在数据还原上的探索和实践

袋鼠云数栈

袋鼠云平台代码规范化编译部署的提效性改进实践

袋鼠云数栈

SpringMVC之文件上传

Andy

深入浅出Python——Python高级语法之面向对象

何极光

Python 面向对象 10月月更

SpringBoot之基础知识

Andy

SpringBoot之开发深入

Andy

激活数据价值,探究DataOps下的数据架构及其实践丨DTVision开发治理篇

袋鼠云数栈

赴一场开源盛会丨10月29日 COSCon'22 开源年会杭州分会场,这里只差一个「你」!

袋鼠云数栈

SpringMVC 基础

Andy

Java | 继承

陌上

Java 编程 10月月更

安全架构师的运营一二事

I

运营 安全架构 企业安全 安全运营

企业业务沟通新选择,华为云会议支持全场景智能协作

秃头也爱科技

MyBatis程序基础实现

Andy

华为云连接CC,解决企业跨地区发展的网络难题

路过的憨憨

华为

EMQ助力构建工业生产数字孪生基础架构|智慧工厂系列专题03

EMQ映云科技

物联网 IoT 工业互联网 数字孪生 10月月更

开源直播课丨大数据集成框架ChunJun类加载器隔离方案探索及实践

袋鼠云数栈

MyBatis面试题(部分)

Andy

MySQL向表中添加列

okokabcd

MySQL

深耕稳定安全会议服务,华为云会议具备会议全球接入能力

秃头也爱科技

投资成本低且无需专人维护!华为云会议让沟通更高效

秃头也爱科技

SpringBoot之错误处理

Andy

标签评分:海量标签如何进行系统治理?

袋鼠云数栈

Java | 数组工具类Arrays、数学工具类Math

陌上

编程 Java、 10月月更

强烈推荐!商业洞察就用这个工具

产品海豚湾

产品经理 产品设计 产品运营 商业化 10月月更

华为云桌面——云端上“最卷的云”

秃头也爱科技

一文读懂:开源大数据调度系统Taier1.2版本新增的「工作流」到底是什么?

袋鼠云数栈

Java | 面向对象(二)

陌上

编程 Java、 10月月更

SpringMVC之拦截器

Andy

MyBatis初步理解

Andy

MyBatis之缓存机制和动态SQL

Andy

上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章