50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

多模态内容生成:从技术突破到创新应用落地|AICon 北京

  • 2025-05-28
    北京
  • 本文字数:1112 字

    阅读完需:约 4 分钟

大小:600.90K时长:03:25
多模态内容生成:从技术突破到创新应用落地|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


智象未来算法科学家潘滢炜已确认出席并发表题为《多模态内容生成:从技术突破到创新应用落地》的主题分享,探讨国际上最近几年多模态内容生成的核心技术突破,包含扩散模型 UNet 结构到 Diffusion Transformer(DiT)架构的演进,智象未来自主研发的智象多模态大模型在图像和视频生成能力上的技术升级,以及如何突破用户最后一公里。同时,还将分享多模态生成技术在设计、营销、影视、文旅等领域的创新应用案例,揭示多模态内容生成如何赋能相关产业,推动内容创作的智能化和创意的个性化发展。



潘滢炜博士是生成式人工智能初创公司智象未来算法科学家,研发了智象视觉多模态基础模型、十亿级商品图像搜索引擎(京东拍照购)、体育赛事智能导播系统、智能机械臂等多项产品和服务。相关研究领域得到国际学术界的广泛认可,曾获评微软学者奖学金、ACM SIGMM China 最佳博士论文奖和新星奖、ACM Multimedia 最佳开源项目奖和北京市科技新星计划创新新星,先后 6 次获得国际学术竞赛冠军。在 CCF A 类刊物上发表学术论文 60 余篇,谷歌学术引用一万余次。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 大模型发展和竞争态势

  2. 多模态 AIGC 市场空间

  3. 多模态生成模型技术演进:扩散模型 UNet 结构、Diffusion Transformer(DiT)架构、智象多模态大模型的扩散自回归模型(DiT+AR)

  4. 多模态生成技术在相关领域的创新应用

  5. 展望和未来


技术实践痛点不需要等到多模态基础模型达到 100 分才去做应用。在现有的基础模型能力之上,如果能找到真正解决用户痛点的场景,并在应用上做得很深,真正做到端到端的 95 分以上,用户就会买单。这就需要我们去对多模态基础模型做很多场景驱动的优化,特别关注基础模型在上层应用中的表现,去解决用户「最后一公里」的问题。


听众收益

  • 最新的多模态内容生成技术前沿动态

  • 智象未来自主研发的智象多模态大模型技术升级

  • 多模态内容生成技术如何赋能相关产业


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-28 10:002734

评论

发布
暂无评论

从0到1:理发店预约剪发小程序开发笔记(上)

CC同学

极盾故事|某农商行数据安全制度和数据分类分级建设

极盾科技

数据安全 数据分类分级

win11基础 查看组件服务

万里无云万里天

win11 dcom

AI 应用实战营 - 作业 八 - Coze制作Bot

德拉古蒂洛维奇

win11基础 telnet 检查rabbitmq server是否开启了1883端口

万里无云万里天

RabbitMQ win11 Telnet

参加可观测性Observability Foundation认证培训,您有哪些收益?

雅菲奥朗

可观测性 可观测性认证

即时战略游戏:帝国时代2 for Mac 3.3.1769 中文移植版

你的猪会飞吗

mac软件下载 mac单机游戏

数字样机:飞行器状态控制系统仿真

DevOps和数字孪生

数字样机

win11基础 开启telnet功能

万里无云万里天

win11 Telnet

AI 应用实战营 - 作业 八 - Coze 制作 Bot - 2

德拉古蒂洛维奇

PHP 与淘宝详情 API 的融合:构建智能电商应用

api开发

ETL数据集成丨将PostgreSQL数据库数据实时同步至PostgreSQL

谷云科技RestCloud

postgresql 数据同步 ETL 数据集成平台 数据库同步

LED租赁屏市场

Dylan

LED LED display LED显示屏 市场 舞台表演

技术路线速通!用飞桨让京剧人物照片动起来

百度Geek说

百度飞桨 企业号2024年7月PK榜

崖山异构数据库迁移利器YMP初体验-Oracle迁移YashanDB

YashanDB

yashandb 崖山数据库 崖山DB

win11基础 家庭版升级为专业版的步骤

万里无云万里天

win11

极限科技闪耀 2024 可信数据库发展大会,多款自研产品引领搜索技术新纪元

极限实验室

信通院 极限科技 数据库发展大会

开发者必备:淘宝商品列表接口集成全攻略

tbapi

淘宝API接口 淘宝商品列表数据接口 淘宝商品列表数据采集

解读阿里云搜索开发工作台如何快速搭建AI语义搜索及RAG链路

阿里云大数据AI技术

人工智能 自然语言处理 大模型 rag

得物App弱网诊断探索之路

得物技术

ios android 企业号2024年7月PK榜

华为云Serverless可观测性解决方案打造高效、可靠的云原生应用

华为云开发者联盟

云原生 可观测 华为云开发者联盟 企业号2024年7月PK榜

win11基础 组件服务 启动分布式com

万里无云万里天

win11 dcom

报名SRE培训,选择哪家培训机构?

雅菲奥朗

SRE SRE培训 SRE认证

深度解读GaussDB(for MySQL)与MySQL的COUNT查询并行优化策略

华为云开发者联盟

MySQL 数据库 华为云开发者联盟 企业号2024年7月PK榜

获取闲鱼商品详情api

api开发

文献解读-临床试验-第二十二期|《新抗原负荷作为中国非小细胞肺癌II/III患者的预后和预测标志物》

INSVAST

基因测序 基因数据分析 临床试验

多模态内容生成:从技术突破到创新应用落地|AICon北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章