即刻成为鸿蒙应用开发者,解锁职业发展新机遇!点击了解~ 了解详情
写点什么

上海交通大学 AI 学院副教授赵波将在 AICon 上海分享大模型在长视频理解中的前沿进展

  • 2025-04-21
    北京
  • 本文字数:1075 字

    阅读完需:约 4 分钟

大小:586.45K时长:03:20
上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


上海交通大学人工智能学院副教授赵波已确认出席 AICon 上海并将在多模态大模型创新实践专题发表题为《大模型在长视频理解中的前沿进展》的主题演讲。近年来,多模态大模型技术发展迅速,展现出强大的视觉理解能力。其中基于大模型的长视频理解任务受到了越来越多的关注,其在教育、影视、安防等领域具有广泛的应用前景。然后由于大语言模型的有效上下文长度有限,难以用有限的 GPU 计算资源实现长视频理解。


针对这一研究问题,课题组首先推出了面向长视频理解大模型的测评基准:MLVU,提供了丰富的评测任务,揭示了主流大模型在长视频理解任务上的能力缺陷。针对长视频数据 Token 数量过多的问题,课题组提出利用可学习 Token 来自适应地压缩视频 Token,从而实现单张卡处理 1 小时以上视频的能力。


在本次分享中,赵波教授将系统解析长视频理解大模型的技术挑战与创新突破,结合课题组提出的测评基准与压缩技术,探讨解决 GPU 资源受限下长视频处理难题的实践路径。


赵波是国家级青年人才,曾担任智源研究院数据智能研究中心负责人。博士毕业于英国爱丁堡大学。主要研究方向包括多模态大模型,具身智能,数据智能等。曾提出系列有影响力的数据蒸馏与合成算法。推出的多模态大模型 Bunny 已被下载数十万次。发表包括 ICLR Oral, NeurIPS Spotlight, CVPR Highlight 等数十篇顶会顶刊论文。曾获得 ICML 2022 杰出论文奖。担任 NeurIPS’24、BMVC’24 领域主席。他在本次会议的详细演讲内容如下:

演讲提纲:

  1. 基于大模型的长视频理解任务与挑战

  2. 主流的视频理解模型与能力测评

  3. 基于可学习 Token 的视频 Token 压缩技术

    可学习的压缩 Token

    自适应切片算法

    训练数据扩增方法

  4. 应用实例分析

  5. 总结与展望


听众收益:

  • 了解最新的长视频理解大模型性能和局限性

  • 了解最新的长视频理解大模型 Token 压缩技术



除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-21 17:005636

评论

发布
暂无评论

2023城博会|上海国际智慧工地展览会

AIOTE智博会

城博会 上海城博会

语音聊天源码平台开发小知识

山东布谷网络科技

一文预览 | 8 月 16 日 NVIDIA 在 WAVE SUMMIT深度学习开发者大会 2023精彩亮点抢先看!

飞桨PaddlePaddle

人工智能 百度飞桨 WAVE SUMMIT

DTCC 2023即将启幕 明天见!

酷克数据HashData

Programming abstractions in C阅读笔记p111-p113: boilerplate

codists

19. 第三方库的管理和虚拟环境

茶桁

Python pip conda

洛阳等级保护测评机构有哪些?在哪里?咨询电话多少?

行云管家

等保 等级保护 等保测评 洛阳

aspera替代方案:探索这些安全且可靠的文件传输工具

镭速

aspera替代方案 文件传输工具

小灯塔系列-中小企业数字化转型系列研究——知识管理测评报告

向量智库

面试涨薪神奇操作,直接多给3k的JVM垃圾优化笔记

小小怪下士

Java 程序员 JVM 调优

断点续传的未来发展趋势与前景展望

镭速

断点续传 文件传输软件

突破大模型 | Alluxio助力AI大模型训练-成功案例(一)

Alluxio

机器学习 gpu 模型训练 大模型 AIGC

【资料包】HDC.Together 2023精选Codelabs指南现已上线(内有活动)

HarmonyOS开发者

HarmonyOS

GeaFlow图计算快速上手之K-hop算法

TuGraphAnalytics

大数据 流计算 图计算 图论

百度百舸平台的大模型训练最佳实践

Baidu AICLOUD

容错机制 大模型训练 异构计算 CheckPoint

因为私域流量运营,App重新受重视?

FinFish

小程序生态 私域运营 小程序容器 私域流量运营 流量运营

企业文件外发系统必备八大要素

镭速

文件外发系统

极狐GitLab 上新:跳过无需备份项目,节约数 10 至 1000 倍时间与磁盘空间

极狐GitLab

DevOps gitlab 磁盘空间 数据备份恢复 备份时间

极狐GitLab 企业级 CI/CD 规模化落地实践指南(一)

极狐GitLab

DevOps cicd runner template Component

本地工具是什么意思?本地工具与远程工具一样吗?

行云管家

IT运维 远程工具 本地工具

规划性和可扩展性,助力企业全面预算管理的推进

智达方通

全面预算管理系统 智达方通EPM系统 财务规划与分析 多维模型

揭穿DevOps的5个谣言!

互联网工科生

DevOps 运维 自动化运维

上海交通大学AI学院副教授赵波将在AICon上海分享大模型在长视频理解中的前沿进展_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章