多模态内容生成：从技术突破到创新应用落地｜AICon北京

6 月 27 日-6 月 28 日，AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践，邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家，深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。

智象未来算法科学家潘滢炜已确认出席并发表题为《多模态内容生成：从技术突破到创新应用落地》的主题分享，探讨国际上最近几年多模态内容生成的核心技术突破，包含扩散模型 UNet 结构到 Diffusion Transformer（DiT）架构的演进，智象未来自主研发的智象多模态大模型在图像和视频生成能力上的技术升级，以及如何突破用户最后一公里。同时，还将分享多模态生成技术在设计、营销、影视、文旅等领域的创新应用案例，揭示多模态内容生成如何赋能相关产业，推动内容创作的智能化和创意的个性化发展。

潘滢炜博士是生成式人工智能初创公司智象未来算法科学家，研发了智象视觉多模态基础模型、十亿级商品图像搜索引擎(京东拍照购)、体育赛事智能导播系统、智能机械臂等多项产品和服务。相关研究领域得到国际学术界的广泛认可，曾获评微软学者奖学金、ACM SIGMM China 最佳博士论文奖和新星奖、ACM Multimedia 最佳开源项目奖和北京市科技新星计划创新新星，先后 6 次获得国际学术竞赛冠军。在 CCF A 类刊物上发表学术论文 60 余篇，谷歌学术引用一万余次。他在本次会议的详细演讲内容如下：

演讲提纲
大模型发展和竞争态势
多模态 AIGC 市场空间
多模态生成模型技术演进：扩散模型 UNet 结构、Diffusion Transformer（DiT）架构、智象多模态大模型的扩散自回归模型（DiT+AR）
多模态生成技术在相关领域的创新应用
展望和未来
技术实践痛点不需要等到多模态基础模型达到 100 分才去做应用。在现有的基础模型能力之上，如果能找到真正解决用户痛点的场景，并在应用上做得很深，真正做到端到端的 95 分以上，用户就会买单。这就需要我们去对多模态基础模型做很多场景驱动的优化，特别关注基础模型在上层应用中的表现，去解决用户「最后一公里」的问题。
听众收益
最新的多模态内容生成技术前沿动态
智象未来自主研发的智象多模态大模型技术升级
多模态内容生成技术如何赋能相关产业

除此之外，本次大会还策划了AI Agent 构建与多场景实践、多模态实践与应用、大模型助力研发的实战经验、AI 在业务运营中的深度落地、大模型时代的数据处理与分析、AI 变革下的工程师等 10 多个专题论坛，届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠，单张门票立省 580 元，详情可扫码或联系票务经理 13269078023 咨询。

创作场景

多模态内容生成：从技术突破到创新应用落地｜AICon 北京