AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

多模态内容生成:从技术突破到创新应用落地|AICon 北京

  • 2025-05-28
    北京
  • 本文字数:1112 字

    阅读完需:约 4 分钟

大小:600.90K时长:03:25
多模态内容生成:从技术突破到创新应用落地|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


智象未来算法科学家潘滢炜已确认出席并发表题为《多模态内容生成:从技术突破到创新应用落地》的主题分享,探讨国际上最近几年多模态内容生成的核心技术突破,包含扩散模型 UNet 结构到 Diffusion Transformer(DiT)架构的演进,智象未来自主研发的智象多模态大模型在图像和视频生成能力上的技术升级,以及如何突破用户最后一公里。同时,还将分享多模态生成技术在设计、营销、影视、文旅等领域的创新应用案例,揭示多模态内容生成如何赋能相关产业,推动内容创作的智能化和创意的个性化发展。



潘滢炜博士是生成式人工智能初创公司智象未来算法科学家,研发了智象视觉多模态基础模型、十亿级商品图像搜索引擎(京东拍照购)、体育赛事智能导播系统、智能机械臂等多项产品和服务。相关研究领域得到国际学术界的广泛认可,曾获评微软学者奖学金、ACM SIGMM China 最佳博士论文奖和新星奖、ACM Multimedia 最佳开源项目奖和北京市科技新星计划创新新星,先后 6 次获得国际学术竞赛冠军。在 CCF A 类刊物上发表学术论文 60 余篇,谷歌学术引用一万余次。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 大模型发展和竞争态势

  2. 多模态 AIGC 市场空间

  3. 多模态生成模型技术演进:扩散模型 UNet 结构、Diffusion Transformer(DiT)架构、智象多模态大模型的扩散自回归模型(DiT+AR)

  4. 多模态生成技术在相关领域的创新应用

  5. 展望和未来


技术实践痛点不需要等到多模态基础模型达到 100 分才去做应用。在现有的基础模型能力之上,如果能找到真正解决用户痛点的场景,并在应用上做得很深,真正做到端到端的 95 分以上,用户就会买单。这就需要我们去对多模态基础模型做很多场景驱动的优化,特别关注基础模型在上层应用中的表现,去解决用户「最后一公里」的问题。


听众收益

  • 最新的多模态内容生成技术前沿动态

  • 智象未来自主研发的智象多模态大模型技术升级

  • 多模态内容生成技术如何赋能相关产业


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-28 10:002540

评论

发布
暂无评论

华秋干货铺 | PCB板为什么要做树脂塞孔?

华秋电子

【Python实战】Python采集图片数据

BROKEN

三周年连更

Netty服务端开发及性能优化 | 京东云技术团队

京东科技开发者

Netty 高性能 netty内存管理 企业号 5 月 PK 榜

演讲回顾 | 释放Atlassian工具的力量

龙智—DevSecOps解决方案

Atlassian Jira Atlassian 云版

涨薪60%,从小厂逆袭,坐上美团技术专家(面经+心得)

程序知音

Java 后端 java面试 java架构 Java进阶

五月到了,再来看看ChatGPT给我们带来了什么吧!

加入高科技仿生人

AI AIGC ChatGPT

一文带你了解EPM系统的发展史

智达方通

EPM 业财融合 智达方通 企业绩效管理 海波龙

iOS MachineLearning 系列(10)—— 自然语言分析之文本拆解

珲少

从入门到放弃再到成功—我的 Jira 插件探索之路

跟YY哥学Jira

Scrum cli Jira插件 Forge 团队速度

中国信通院召开政企信息技术应用创新(信创)促进中心启动会

信通院IOMM数字化转型团队

信创 信创产业 信创生态

简洁好用的思维导图软件:simplemind 中文版

真大的脸盆

Mac 思维导图 Mac 软件 思维导图软件

使用TPC-H 进行GreatSQL并行查询测试

GreatSQL

MySQL 并行查询 greatsql greatsql社区

Python文件和操作系统基础

timerring

Python

AIGC产业研究报告 2023——图像生成篇

易观分析

产业 智能

大咖观点| AIGC与因果推断的双向赋能

九章云极DataCanvas

Python函数基础回顾

timerring

Python

重塑数据活力 | 焱融科技与DaoCloud 道客完成云原生兼容性认证

焱融科技

#云原生 #高性能 #分布式文件存储 #文件存储 #分布式存储

标签系列:标签的价值、生产与评价

小鲸数据

标签 CDP 用户画像 标签体系 精准营销

八股MQ003——聊聊Consumer

Codyida

后端

分布式编译系统的搭建

GreatSQL

MySQL greatsql社区 分布式编译

自动化测试 | 如何在API开发中践行“设计优先”方法?SwaggerHub助您一臂之力

龙智—DevSecOps解决方案

API SmartBear

得物直播低延迟探索 | 得物技术

得物技术

直播技术 直播推流 直播优化

MySQL 8.0中InnoDB buffer pool size进度更透明

GreatSQL

MySQL InnoDB greatsql社区

巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践

Apache Flink

大数据 flink 实时计算

京东物流常态化压测实践 | 京东云技术团队

京东科技开发者

测试 压测 常态化压测 企业号 5 月 PK 榜

膜拜,国内算法大佬亲撰:数据结构与算法全解笔记

程序知音

Java 算法 数据结构与算法 后端技术

推动变革,打造全新的全面预算管理解决方案

智达方通

智能多维数据库 多维数据库 业财融合 全面预算管理

AIGC遇上低代码的碰撞与融合

力软低代码开发平台

153个!PCB板上的字母符号都代表啥?一图带你搞懂!

华秋PCB

物理 电路 元器件 PCB PCB设计

版本控制 | 如何使用虚幻引擎的多用户编辑(MUE)功能

龙智—DevSecOps解决方案

版本控制 虚幻引擎 虚拟制作 虚幻多用户编辑

使用篇丨链路追踪(Tracing)很简单:链路拓扑

阿里巴巴云原生

阿里云 云原生 链路追踪 Tracing

多模态内容生成:从技术突破到创新应用落地|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章