50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

清华大学博士生余天予确认出席 AICon 北京站,分享如何突破多模态大模型的效率瓶颈

  • 2025-11-07
    北京
  • 本文字数:1225 字

    阅读完需:约 4 分钟

大小:676.31K时长:03:50
清华大学博士生余天予确认出席AICon北京站,分享如何突破多模态大模型的效率瓶颈

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


清华大学博士生余天予已确认出席并将在「多模态从技术突破到创新应用落地」专题发表题为突破多模态大模型的效率瓶颈:结构、数据与训练优化的主题分享。多模态大模型作为人工智能的最前沿领域之一正在快速发展。然而,多模态大模型的训练与推理效率已成为影响其普及性与可扩展性的核心瓶颈。为应对这一挑战,余天予及其团队推出 MiniCPM-V 4.5 训练方案,兼具训练推理的高效性和强大的性能。他们在模型结构、数据策略与训练方法三个方面进行了关键改进:使用了统一的 3D-Resampler 模型架构,实现对图像与视频的高压缩率紧凑编码;构建了统一的文档知识与文本识别学习范式,无需繁重的数据工程;并设计了混合强化学习策略,使模型在短推理与长推理两种模式下均具备卓越能力。


MiniCPM-V 4.5 在 OpenCompass 评测中超越了广泛使用的闭源模型(如 GPT-4o-latest)以及显著更大的开源模型(如 Qwen2.5-VL 72B)。MiniCPM-V 4.5 在保持强大性能的同时也展现出极高的效率。例如,在广泛采用的 VideoMME 基准测试中,MiniCPM-V 4.5 在 30B 规模以下的模型中取得了最优秀的性能,甚至仅用 46.7% 的 GPU 显存成本和 8.7% 的推理时间(相较于 Qwen2.5-VL 7B)。


余天予是清华大学自然语言处理实验室博士生,MiniCPM-V 系列多模态大模型核心作者,发表 CVPR 等人工智能顶会论文多篇,主要研究方向为多模态大模型。他在本次会议的详细演讲内容如下:

  1. 多模态大模型的效率瓶颈

  2. 结构:通过 3D-Resampler 提高压缩率

  3. 数据:通过统一文档 &OCR 学习简化数据工程

  4. 训练:混合强化学习提高训练效率


这样的技术在实践过程中有哪些痛点?

  1. 3D-Resampler 在高压缩率的同时对于空间特征的编码有所取舍;

  2. 统一训练的噪声参数有一定敏感性;

  3. 混合训练的比例参数具有一定敏感性。


演讲有哪些前沿亮点?

通过 3D-Resampler 提高压缩率、通过统一文档 &OCR 学习简化数据工程、混合强化学习提高训练效率。


听众收益

  1. 多模态大模型效率瓶颈分析;

  2. 多模态大模型的结构、数据、训练高效率构建方案。


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 8 折优惠,单张门票立省 1160 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-11-07 13:3214

评论

发布
暂无评论

兼容Trino Connector,扩展Apache Doris数据源接入能力|Lakehouse 使用手册(四)

SelectDB

数据湖 Doris LakeHouse trino 湖仓一体

基于STM32设计的酒精检测仪

DS小龙哥

9月月更

Peet's Coffee与观测云跨界合作,为伙伴们呈现双重喜悦

观测云

中秋节

DataOps 对企业数据管理有何意义?该如何落地 DataOps?

Aloudata

Data DataOps 数据管理 主动元数据

Flink Forward Asia 2024 议题征集令|探索实时计算新边界

Apache Flink

Apache 大数据 flink 实时计算 FFA

828如何选云服务器?华为云Flexus X实例引领中小企业上云潮流

YG科技

828云服务器如何选?企业云上管理认准华为云Flexus X实例

YG科技

住宅代理和数据中心代理如何选择?

IPIDEA全球HTTP

新一代柔性云服务!华为云Flexus X实例亮相828企业节

轶天下事

【YashanDB知识库】主备延迟故障分析方法

YashanDB

yashandb 崖山数据库

TiDB系统参数对比工具

TiDB 社区干货传送门

@各位天命人,近期还有这件大事值得关注!

YG科技

828多重技术创新,华为云Flexus X实例加速企业上云管理之旅

YG科技

828优选华为云Flexus X实例,找准中小企业上云“切入口”

YG科技

华为云Flexus X实例云上管理痛点,828首选上云产品之一

轶天下事

破解企业上云难题,828优选华为云Flexus X实例加速云上管理

轶天下事

在线机房迁移之“玩转TiDB迁移”

TiDB 社区干货传送门

迁移 管理与运维

GAP!你对AI大模型到底了解多少?

YG科技

望繁信科技与中原银行达成合作:谱写银企合作新篇章!

望繁信科技

数字化转型 中原银行 流程挖掘 流程资产 流程智能

828企业节首选云服务器!华为云Flexus X实例助力企业云管理更轻松

YG科技

华为云Flexus X实例亮相828,企业数字化专场优选云服务器

轶天下事

Java Streams 的潜力

FunTester

加速企业上云管理黑科技,华为云Flexus X实例首次亮相828企业节

轶天下事

中小企业上云好管家!828企业节亮相的华为云Flexus X实例让上云更便捷

轶天下事

助力828,华为云Flexus X实例加速企业云上管理

轶天下事

万界星空科技MES系统生产过程控制功能详解

万界星空科技

工业互联网 制造业 mes 万界星空科技 生产管理MES系统

828企业上云“硬核”之选!华为云Flexus X实例系统管理更实惠

YG科技

华为云Flexus X实例3大优势,828企业上云优选产品

YG科技

网站必须做IPv6改造吗?不做IPv6改造有什么影响?

防火墙后吃泡面

清华大学博士生余天予确认出席AICon北京站,分享如何突破多模态大模型的效率瓶颈_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章