免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

多模态内容生成:从技术突破到创新应用落地|AICon 北京

  • 2025-05-28
    北京
  • 本文字数:1112 字

    阅读完需:约 4 分钟

大小:600.90K时长:03:25
多模态内容生成:从技术突破到创新应用落地|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


智象未来算法科学家潘滢炜已确认出席并发表题为《多模态内容生成:从技术突破到创新应用落地》的主题分享,探讨国际上最近几年多模态内容生成的核心技术突破,包含扩散模型 UNet 结构到 Diffusion Transformer(DiT)架构的演进,智象未来自主研发的智象多模态大模型在图像和视频生成能力上的技术升级,以及如何突破用户最后一公里。同时,还将分享多模态生成技术在设计、营销、影视、文旅等领域的创新应用案例,揭示多模态内容生成如何赋能相关产业,推动内容创作的智能化和创意的个性化发展。



潘滢炜博士是生成式人工智能初创公司智象未来算法科学家,研发了智象视觉多模态基础模型、十亿级商品图像搜索引擎(京东拍照购)、体育赛事智能导播系统、智能机械臂等多项产品和服务。相关研究领域得到国际学术界的广泛认可,曾获评微软学者奖学金、ACM SIGMM China 最佳博士论文奖和新星奖、ACM Multimedia 最佳开源项目奖和北京市科技新星计划创新新星,先后 6 次获得国际学术竞赛冠军。在 CCF A 类刊物上发表学术论文 60 余篇,谷歌学术引用一万余次。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 大模型发展和竞争态势

  2. 多模态 AIGC 市场空间

  3. 多模态生成模型技术演进:扩散模型 UNet 结构、Diffusion Transformer(DiT)架构、智象多模态大模型的扩散自回归模型(DiT+AR)

  4. 多模态生成技术在相关领域的创新应用

  5. 展望和未来


技术实践痛点不需要等到多模态基础模型达到 100 分才去做应用。在现有的基础模型能力之上,如果能找到真正解决用户痛点的场景,并在应用上做得很深,真正做到端到端的 95 分以上,用户就会买单。这就需要我们去对多模态基础模型做很多场景驱动的优化,特别关注基础模型在上层应用中的表现,去解决用户「最后一公里」的问题。


听众收益

  • 最新的多模态内容生成技术前沿动态

  • 智象未来自主研发的智象多模态大模型技术升级

  • 多模态内容生成技术如何赋能相关产业


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-28 10:002273

评论

发布
暂无评论

【回顾】上汽零束SOA开发者大会,开发者提问汇总!

SOA开发者平台

开发者 SOA 软件定义汽车

科创人|华傲数据CEO贾西贝:梦想驱动的九个人生抉择

科创人

2021Java最新大厂面试真题总结,入职阿里啦

Java 面试 后端

Jenkins: 重置管理员密码

吴脑的键客

jenkins

2021Java高级进阶学习资料,StringBoot编程式事务与声明式事务

Java 面试 后端

2021Java大厂面试真题,Java这些高端技术只有你还不知道

Java 面试 后端

2021Java开发现状分析,Java中级笔试题百度文库

Java 面试 后端

【回顾】上汽零束SOA开发者大会,开发者提问汇总!

SOA开发者

软件 SOA 汽车 软件定义汽车 OTA

阿里淘技术带佬新作:设计模式的完美演绎,共计1290页

Java 程序员 架构 面试 计算机

个推0代码数据可视化实操:基于Tableau的中国奥运数据探索

个推

Linux用户权限切换

在即

9月日更

2021Java春招面试经历,含泪狂刷Java基础面试118题

Java 面试 后端

2021Java精选面试实战总结整理,Java程序员面试算法宝典

Java 面试 后端

个推融合实人认证服务和视觉智能技术,推出青少年网络游戏防沉迷解决方案

个推

AI 人脸识别

2021Java网络编程总结篇,三年老Java经验面经

Java 面试 后端

2021Java进阶者的新篇章,做了5年Java

Java 面试 后端

2021Java面试心得,淘汰机制、缓存雪崩

Java 后端

2020-2021阿里巴巴Java面试真题解析,Java程序员必备书籍

Java 面试 后端

2021Java不死我不倒,Java架构师之路

Java 面试 后端

百亿级日志流分析实践 | 剖析个推SDK后效分析功能实现原理

个推

消息推送 sdk

如何用人工智能技术优化 WebRTC 产品(内附具体方案)

融云 RongCloud

2021Java者未来的出路在哪里,怒斩获了30家互联网公司offer

Java 面试 后端

2021Java不死我不倒,细数Java开发者的艰辛历程

Java 面试 后端

个推Spark性能调优实战分享:性能提升60%↑ 成本降低50%↓

个推

大数据 spark Spark调优

2021Java最新大厂面试真题,37岁程序员被裁

Java 面试 后端

2021Java大厂面试题来袭,Java工程师进阶书籍

Java 面试 后端

2021Java开发学习路线,阿里Java校招面试

Java 面试 后端

科创人|华映资本章高男:好奇心顽童,趋势焦虑者,反套路投资人

科创人

2021Java最新大厂面试真题,Java面试宝典pdf

Java 面试 后端

M-SQL:超强的多任务表示学习方法

华为云开发者联盟

sql 自然语言 M-SQL SQL语句 多任务

2021Java面试心得,Spring的XML解析原理

Java 面试 后端

多模态内容生成:从技术突破到创新应用落地|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章