大咖直播-鸿蒙原生开发与智能提效实战!>>> 了解详情
写点什么

腾讯混元多模态大模型技术实践与思考|AICon 北京

  • 2025-05-27
    北京
  • 本文字数:1311 字

    阅读完需:约 4 分钟

大小:714.38K时长:04:03
腾讯混元多模态大模型技术实践与思考|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


腾讯多模态算法中心 Tech Lead DUANGE 已确认出席并发表题为腾讯混元多模态大模型技术实践与思考的主题分享,本次分享将基于混元多模态基础大模型,深入探讨腾讯在多模态技术领域的最新研发进展。混元多模态大模型技术覆盖文本、图像、视频和音频理解与生成多种技术。特别值得一提的是,图像到文本模型包含三个关键组件:视觉变换器(ViT)用于视觉编码、视觉-语言适配器,以及采用专家混合(MoE)架构的大型语言模型。团队高度重视数据质量和多样性,开发了一套高效的自动化数据处理管道。选择 MoE 架构得益于其在性能和可扩展性方面的卓越表现。通过分阶段训练和推理优化技术,模型的能力得到了进一步加强。为确保模型满足用户需求,团队在强化学习中对偏好进行了对齐,并采用真实用户的 A/B 测试。目前,该模型已在司内多个业务场景中部署应用。展望未来,计划扩展模型能力,覆盖更多模态,并进一步提升智能性和可靠性。



DUANGE 现任腾讯混元多模态算法中心 Tech Lead ,目前专注于多模态基础模型研发。曾任微软亚洲研究院主管研究员,在人工智能领域国际期刊和会议如 TPAMI、CVPR、NeurIPS 等发表学术论文 30 余篇,Google Scholar 他引 10,000 余次。研究成果多次作为核心技术应用于业界知名产品与业务中,曾多次获得国际算法竞赛奖项,包括物体跟踪竞赛 VOT 冠军,HACS Temporal Action Localization 竞赛冠军等。担任模式识别领域国际知名期刊 Pattern Recognition 副主编,多媒体领域学术会议 ACM Multimedia 领域主席。他在本次会议的详细演讲内容如下:


演讲提纲

1. 混元多模态模型发展概况

  • 模型架构:视觉变换器(ViT)、视觉-语言适配器、专家混合(MoE)架构

  • 支持的模态:文本、图像、视频、音频

  • 关键技术特点与创新点

2. 混元多模态模型技术实践与挑战

  • 数据处理:高效的自动化数据处理管道

  • 训练优化:分阶段训练与推理优化技术

  • 用户反馈机制:强化学习对偏好对齐、A/B 测试

  • 面临的技术挑战与解决方案

3. 混元多模态模型应用探索

  • 图像与文本理解提升推荐系统准确性

  • 多模态内容的自动生成与审核

  • 其他业务场景中的应用实例

4. 未来展望

  • 模型能力的扩展方向

  • 提升智能性与可靠性的策略


您认为,这样的技术在实践过程中有哪些痛点?

  • 模型输出暂未达到绝对的准确,例如存在幻觉等问题。


您的演讲有哪些前沿亮点?

  • 介绍大模型实践的经验与思考。


听众收益

  • 了解多模态大模型的实验经验

  • 了解在实际业务中的应用场景


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-27 15:003492

评论

发布
暂无评论

Linux RedHat7.4更换阿里云yum源

Albert Edison

7月月更

鱼和熊掌可以兼得!天翼云弹性裸金属一招鲜!

天翼云开发者社区

服务器 弹性扩容

systemd-resolved 开启 debug 日志

程序员与厨子

ubuntu 运维 DNS systemd-resolved

微服务链路风险分析

阿泽🧸

7月月更 链路风险分析

刷个算法,结果第一题就蚌埠住了~~

为自己带盐

算法 力扣 7月月更

7000+字图文并茂解带你深入理解java锁升级的每个细节

华为云开发者联盟

Java 开发 华为云

中文版Postman?功能真心强大!

Liam

Java 开发者工具 Postman 后端开发 程序员进阶

集合处理的利器

技术小生

java8 7月月更

Spring你牛个啥,我承认刚才说话我声音有点大

zxhtom

7月月更

MMAP

北洋

Andriod 7月月更

如何开发引入小程序插件

Geek_99967b

小程序插件

Java方向~~0基础小白如何快速脱离0offer的苦海!

KEY.L

7月月更

企业数字化转型之路,从这里开始

天翼云开发者社区

数字化转型 云存储

AI金榜题名时,MLPerf榜单的份量究竟有多重?

脑极体

使用 RepositoryProvider简化父子组件的传值

岛上码农

flutter ios 安卓 移动端开发 7月月更

牛客java选择题每日打卡Day7

京与旧铺

7月月更

从 1.5 开始搭建一个微服务框架——调用链追踪 traceId

悟空聊架构

日志 链路追踪 traceId 悟空聊架构 7月月更

国内低代码开发平台靠谱的都有哪些?

AIRIOT

低代码 物联网 低代码,项目开发

让开发效率飞速提升的跨端方案

Geek_99967b

小程序 跨端 小程序容器

分布式算法入门之 Paxos 算法

宇宙之一粟

Basic paxos 7月月更

如何组织一场实战攻防演练

穿过生命散发芬芳

攻防演练 7月月更

一朵云开启智慧交通新未来

天翼云开发者社区

区块链 大数据 物联网

不要再手动批量替换了,使用python AST模块批量替换

阿呆

Python AST 批量替换

Ubuntu 20.04 安装 Chisel

贾献华

7月月更

【愚公系列】2022年7月 Go教学课程 004-Go代码注释

愚公搬代码

7月月更

一文读懂简单查询代价估算

华为云开发者联盟

数据库 后端 查询引擎

XaaS 陷阱:万物皆服务(可能)并不是IT真正需要的东西

雨果

云服务 xaas DaaS 本地服务

【刷题记录】1. 两数之和

WangNing

7月月更

场景化面试:关于分布式锁的十问十答

面试官问

分布式锁

华为云ModelArts文本分类–外卖评论

逝缘~

深度学习 华为云 7月月更

腾讯混元多模态大模型技术实践与思考|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章