AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

腾讯混元多模态大模型技术实践与思考|AICon 北京

  • 2025-05-27
    北京
  • 本文字数:1311 字

    阅读完需:约 4 分钟

大小:714.38K时长:04:03
腾讯混元多模态大模型技术实践与思考|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


腾讯多模态算法中心 Tech Lead DUANGE 已确认出席并发表题为腾讯混元多模态大模型技术实践与思考的主题分享,本次分享将基于混元多模态基础大模型,深入探讨腾讯在多模态技术领域的最新研发进展。混元多模态大模型技术覆盖文本、图像、视频和音频理解与生成多种技术。特别值得一提的是,图像到文本模型包含三个关键组件:视觉变换器(ViT)用于视觉编码、视觉-语言适配器,以及采用专家混合(MoE)架构的大型语言模型。团队高度重视数据质量和多样性,开发了一套高效的自动化数据处理管道。选择 MoE 架构得益于其在性能和可扩展性方面的卓越表现。通过分阶段训练和推理优化技术,模型的能力得到了进一步加强。为确保模型满足用户需求,团队在强化学习中对偏好进行了对齐,并采用真实用户的 A/B 测试。目前,该模型已在司内多个业务场景中部署应用。展望未来,计划扩展模型能力,覆盖更多模态,并进一步提升智能性和可靠性。



DUANGE 现任腾讯混元多模态算法中心 Tech Lead ,目前专注于多模态基础模型研发。曾任微软亚洲研究院主管研究员,在人工智能领域国际期刊和会议如 TPAMI、CVPR、NeurIPS 等发表学术论文 30 余篇,Google Scholar 他引 10,000 余次。研究成果多次作为核心技术应用于业界知名产品与业务中,曾多次获得国际算法竞赛奖项,包括物体跟踪竞赛 VOT 冠军,HACS Temporal Action Localization 竞赛冠军等。担任模式识别领域国际知名期刊 Pattern Recognition 副主编,多媒体领域学术会议 ACM Multimedia 领域主席。他在本次会议的详细演讲内容如下:


演讲提纲

1. 混元多模态模型发展概况

  • 模型架构:视觉变换器(ViT)、视觉-语言适配器、专家混合(MoE)架构

  • 支持的模态:文本、图像、视频、音频

  • 关键技术特点与创新点

2. 混元多模态模型技术实践与挑战

  • 数据处理:高效的自动化数据处理管道

  • 训练优化:分阶段训练与推理优化技术

  • 用户反馈机制:强化学习对偏好对齐、A/B 测试

  • 面临的技术挑战与解决方案

3. 混元多模态模型应用探索

  • 图像与文本理解提升推荐系统准确性

  • 多模态内容的自动生成与审核

  • 其他业务场景中的应用实例

4. 未来展望

  • 模型能力的扩展方向

  • 提升智能性与可靠性的策略


您认为,这样的技术在实践过程中有哪些痛点?

  • 模型输出暂未达到绝对的准确,例如存在幻觉等问题。


您的演讲有哪些前沿亮点?

  • 介绍大模型实践的经验与思考。


听众收益

  • 了解多模态大模型的实验经验

  • 了解在实际业务中的应用场景


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-27 15:002480

评论

发布
暂无评论

用ChatGPT搞定K8s!

互联网工科生

k8s kubernetes 运维 ChatGPT

火山引擎 DataLeap 构建Data Catalog系统的实践(一):背景与调研思路

字节跳动数据平台

揭秘元宇宙背后的最炫科技风

云计算 华为云 元宇宙

POCO库的安装与基础知识说明

芯动大师

组合框架:融合创新技术,实现一次编码多平台运行

FinFish

flutter 跨端开发 小程序容器 跨端框架 跨端应用开发

软件DevOps云化发展的趋势 【课程限时免费】

云计算 DevOps 云原生 华为云 华为开发者大会2023

时序数据库 TDengine 与 DBeaver 达成合作,生态系统再壮大

爱倒腾的程序员

涛思数据 tdengine 时序数据库

数据挖掘18大算法实现以及其他相关经典DM算法:决策分类,聚类,链接挖掘,关联挖掘,模式挖掘。图算法,搜索算法等

汀丶人工智能

人工智能 数据挖掘 机器学习 深度学习 决策树

追击策略?微软云服务器业务2022年规模少于亚马逊AWS一半

B Impact

SQL 优化(四):如何使用 join

hungxy

如何自动化测试你的接口?—— Rest Assured

不在线第一只蜗牛

自动化 自动化测试 API

和鲸科技 ModelWhale 入选北京市人工智能行业赋能典型案例(2023)丨2023全球数字经济大会人工智能高峰论坛

ModelWhale

人工智能 AI 数字化 大模型 论坛

2023-07-03:讲一讲Redis缓存的数据一致性问题和处理方案。

福大大架构师每日一题

redis 底层原理 福大大架构师每日一题

合作、参与、让开源更易用 | 亚马逊的开源文化

亚马逊云科技 (Amazon Web Services)

云计算

扫光动效在移动端应用实践

百度Geek说

动效 移动端 企业号 7 月 PK 榜

Flink-Learning 实战营在升级!更多精美好礼等你来!

Apache Flink

大数据 flink 实时计算

2023 MWC上海:移动云勇担新基建国家队 引领算网新趋势

极客天地

算法复杂度介绍

宁静知行者

算法

一篇文章带你上手性能测试框架K6

QE_LAB

自动化测试框架 测试自动化 #性能测试

第九届“互联网+”大赛产业赛道百度命题正式公布!57道命题,等你揭榜!

飞桨PaddlePaddle

人工智能 百度

营销SaaS SemRush 2.9 亿美元年收入的五个经营数据分析

B Impact

华为开发者大会2023(Cloud):华为云邀您共话开源

华为云开源

开源 云原生 HDC.Cloud

多项目管理难在哪,多项目同时进行该如何做好进度管理?

优秀

项目管理 项目进度管理

代码随想录训练营 Day06 - 哈希表(上)

jjn0703

谁是家居智能化时代“头号玩家”? 小度全屋智能将登陆中国建博会

新消费日报

大模型加速学科升级,飞桨赋能北邮“X+大模型”特色小学期

飞桨PaddlePaddle

人工智能 百度 paddle 百度飞桨

浪潮信息直播高能预告!令人感兴趣的高性能架构、CXL技术、数据库等硬件相关技术分享来了 | 第 83-85 期

OpenAnolis小助手

开源 高性能架构 龙蜥大讲堂 RDMA 浪潮信息

inBuilder今日分享丨系统集成系列之异构接入

inBuilder低代码平台

集成

高性能存储SIG月度动态:io_uring支持nvme直通,DSMS完成开发测试

OpenAnolis小助手

开源 io_uring 高性能存储 anck 龙蜥sig

腾讯混元多模态大模型技术实践与思考|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章