2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

上海交通大学 AI 学院副教授赵波将在 AICon 上海分享大模型在长视频理解中的前沿进展

  • 2025-04-21
    北京
  • 本文字数:1075 字

    阅读完需:约 4 分钟

大小:586.45K时长:03:20
上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


上海交通大学人工智能学院副教授赵波已确认出席 AICon 上海并将在多模态大模型创新实践专题发表题为《大模型在长视频理解中的前沿进展》的主题演讲。近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力。其中基于大模型的长视频理解任务受到了越来越多的关注,其在教育、影视、安防等领域具有广泛的应用前景。然后由于大语言模型的有效上下文长度有限,难以用有限的 GPU 计算资源实现长视频理解。


针对这一研究问题,课题组首先推出了面向长视频理解大模型的测评基准:MLVU,提供了丰富的评测任务,揭示了主流大模型在长视频理解任务上的能力缺陷。针对长视频数据 Token 数量过多的问题,课题组提出利用可学习 Token 来自适应地压缩视频 Token,从而实现单张卡处理 1 小时以上视频的能力。


在本次分享中,赵波教授将系统解析长视频理解大模型的技术挑战与创新突破,结合课题组提出的测评基准与压缩技术,探讨解决 GPU 资源受限下长视频处理难题的实践路径。


赵波是国家级青年人才,曾担任智源研究院数据智能研究中心负责人。博士毕业于英国爱丁堡大学。主要研究方向包括多模态大模型,具身智能,数据智能等。曾提出系列有影响力的数据蒸馏与合成算法。推出的多模态大模型 Bunny 已被下载数十万次。发表包括 ICLR Oral, NeurIPS Spotlight, CVPR Highlight 等数十篇顶会顶刊论文。曾获得 ICML 2022 杰出论文奖。担任 NeurIPS’24、BMVC’24 领域主席。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 基于大模型的长视频理解任务与挑战

  2. 主流的视频理解模型与能力测评

  3. 基于可学习 Token 的视频 Token 压缩技术

    可学习的压缩 Token

    自适应切片算法

    训练数据扩增方法

  4. 应用实例分析

  5. 总结与展望


听众收益:

  • 了解最新的长视频理解大模型性能和局限性

  • 了解最新的长视频理解大模型 Token 压缩技术



除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-21 17:006242

评论

发布
暂无评论

文心一言 VS 讯飞星火 VS chatgpt (161)-- 算法导论13.1 1题

福大大架构师每日一题

福大大架构师每日一题

降人工简流程,人工智能助力企业打赢人力成本战

用友BIP

降本增效

蓝戟英特尔锐炫A770评测:多款热门游戏性能提升,XeSS取得丰硕成果

E科讯

lazada商品列表数据接口方法(lazada.item_search)

tbapi

lazada商品详情数据接口 lazada商品数据接口 lazada商品API接口 lazada API接口

【终极教程】cocos2dx-js 分批次混淆压缩js文件

Geek_66e2f3

软件测试/测试开发丨深入了解软件测试:原则、对象、作用与缺陷

测试人

Python 人工智能 软件测试 测试开发

致敬中国数据库的黄金时代-记录阿里云数据库从落选到登顶魔力象限的全过程

小猿姐

数据库 阿里云 Gartner 魔力象限

研发提效必备技能:手把手教你基于Docker搭建Maven私服仓库

冰河

程序员 DevOps 研发效能 系统架构 架构师

云技术分享 | EC2 之 Windows 忘记密码(一)

亚马逊云科技 (Amazon Web Services)

ssm Amazon EC2 launch

11项指标!企业应用软件国产替代的选型标准与创新之路

用友BIP

国产替代

倒计时1天|2023开放原子开发者大会,明天见!

开放原子开源基金会

开源

从身份治理出发,助力教育行业回归教育本质

Authing

低代码 教育 Authing 身份管理平台 身份管理

用友BIP资产云,盘活数据,助力国有资产保值增值

用友BIP

资产管理

直播预告|国产化软硬件升级替换之路:可观测性建设之路

博睿数据

广告精准投放人群的实现:千万用户过滤指定人群

xfgg

Java

商业&技术双轮驱动,企业数智化运营新力量

用友BIP

数智营销

Solidity之旅(十三)函数及其可见性和状态可变性

BSN研习社

玩转Spring状态机

不在线第一只蜗牛

spring 状态机

融云数智办公获 IT168「2023 年度信创卓越贡献奖」

融云 RongCloud

产品 IT 信创 信息技术 数智办公

PAM:完善的第三方应用

尚思卓越

网络安全

软件测试/测试开发丨分层测试体系、单元、UI 、接口、白盒测试

测试人

软件测试 测试开发

开放原子开发者大会——操作系统大会2023成功举办

开放原子开源基金会

开源

上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章