AICon 上海站|日程100%上线,解锁Al未来! 了解详情
写点什么

上海交通大学 AI 学院副教授赵波将在 AICon 上海分享大模型在长视频理解中的前沿进展

  • 2025-04-21
    北京
  • 本文字数:1075 字

    阅读完需:约 4 分钟

大小:586.45K时长:03:20
上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


上海交通大学人工智能学院副教授赵波已确认出席 AICon 上海并将在多模态大模型创新实践专题发表题为《大模型在长视频理解中的前沿进展》的主题演讲。近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力。其中基于大模型的长视频理解任务受到了越来越多的关注,其在教育、影视、安防等领域具有广泛的应用前景。然后由于大语言模型的有效上下文长度有限,难以用有限的 GPU 计算资源实现长视频理解。


针对这一研究问题,课题组首先推出了面向长视频理解大模型的测评基准:MLVU,提供了丰富的评测任务,揭示了主流大模型在长视频理解任务上的能力缺陷。针对长视频数据 Token 数量过多的问题,课题组提出利用可学习 Token 来自适应地压缩视频 Token,从而实现单张卡处理 1 小时以上视频的能力。


在本次分享中,赵波教授将系统解析长视频理解大模型的技术挑战与创新突破,结合课题组提出的测评基准与压缩技术,探讨解决 GPU 资源受限下长视频处理难题的实践路径。


赵波是国家级青年人才,曾担任智源研究院数据智能研究中心负责人。博士毕业于英国爱丁堡大学。主要研究方向包括多模态大模型,具身智能,数据智能等。曾提出系列有影响力的数据蒸馏与合成算法。推出的多模态大模型 Bunny 已被下载数十万次。发表包括 ICLR Oral, NeurIPS Spotlight, CVPR Highlight 等数十篇顶会顶刊论文。曾获得 ICML 2022 杰出论文奖。担任 NeurIPS’24、BMVC’24 领域主席。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 基于大模型的长视频理解任务与挑战

  2. 主流的视频理解模型与能力测评

  3. 基于可学习 Token 的视频 Token 压缩技术

    可学习的压缩 Token

    自适应切片算法

    训练数据扩增方法

  4. 应用实例分析

  5. 总结与展望


听众收益:

  • 了解最新的长视频理解大模型性能和局限性

  • 了解最新的长视频理解大模型 Token 压缩技术



除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-21 17:005202

评论

发布
暂无评论

【牛客刷题-算法】NC9 二叉树中和为某一值的路径(一)

清风莫追

算法 二叉树 10月月更

数据产品经理实战-项目管理

第519区

项目管理 数据产品经理

JWT 和 JJWT 还傻傻的分不清吗

HoneyMoose

细说react源码中的合成事件

flyzz177

React

一个dubbo和springboot的兼容性问题

xiaoxi666

Redis--SpringBoot整合Redis(包含工具类)

Java学术趴

10月月更

Vue响应式依赖收集原理分析-vue高级必备

yyds2026

Vue

读懂React原理之调和与Fiber

xiaofeng

React

Redis开篇--非关系型数据库

Java学术趴

10月月更

Vue3入门指北(七)事件处理

Augus

Vue3 10月月更

js进阶手写常见函数

hellocoder2029

Vue

【一Go到底】第三天---变量的使用

指剑

Go golang 10月月更

MFC|双缓存绘图机制

中国好公民st

c++ qt 10月月更

【牛客刷题-算法】NC11 将升序数组转化为平衡二叉搜索树

清风莫追

数据结构 算法 二叉树 10月月更

React生命周期深度完全解读

夏天的味道123

React

Vue实战必会的几个技巧

yyds2026

Vue

webpack配置完全指南

Geek_02d948

webpack

Node.js实现大文件断点续传

coder2028

node.js

React源码解读之任务调度

flyzz177

React

Redis中的数据类型以及常用方法

Java学术趴

10月月更

Python应用之阿姆斯特朗数

芯动大师

Python语法 10月月更 阿姆斯特朗数

js函数式编程讲解

hellocoder2029

JavaScript

【牛客刷题-算法】NC7 买卖股票的最好时机(一)

清风莫追

算法 动态规划 10月月更

你要的react+ts最佳实践指南

xiaofeng

React

React组件复用的发展史

夏天的味道123

React

架构师的十八般武艺:业务架构

agnostic

业务架构

深入理解Node.js的进程与子进程

coder2028

node.js

变量使用范围

理想何止三旬

变量

webpack配置优化,让你的构建速度飞起

Geek_02d948

webpack

环形链表 II

掘金安东尼

算法 10月月更

存储优化--查询分离

喵叔

10月月更

上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章