写点什么

阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席 AICon 北京并分享多模态生成模型的推理加速探索

  • 2025-05-27
    北京
  • 本文字数:1044 字

    阅读完需:约 3 分钟

大小:521.27K时长:02:57
阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席AICon北京并分享多模态生成模型的推理加速探索

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声已确认出席并发表题为实现多模态生成“极致”加速的算法与系统挑战的主题分享,探讨以扩散模型为代表的多模态模型在近两年成为生成领域的基础模型,也使得文生图、文生视频等真正走入 C 端用户,推动澎湃的 AIGC 社区形成。但是随着模型的 Scale 越来越大,模型推理时间过长、显存占用过高仍旧是难以忍受的问题,以 Flux 和 Wan2.1 为例。但是过去在模型架构上的剪枝等手段不够适配扩散模型的特性,在此背景下,达摩院从算法设计与系统优化等不同的角度构建了多维度的扩散模型加速的方法,包括动态计算的 DyDiT、引入强化学习的联合动态范式 RAPID、FP8 与稀疏化的联合感知优化的 FPSAttention。



唐家声在阿里巴巴达摩院长期从事机器学习与计算机视觉领域的研究与应用,在视觉表征学习、目标跟踪与系统、分布式训练与高效推理等方向有丰富的项目与科研经历。多次获得 CVPR/ICCV/ECCV 上的多目标跟踪顶级竞赛冠军和 MOTChallenge 排行榜第一名。目前负责达摩院视觉技术实验室的 EfficientAIGC 方向,专注于视觉生成模型的高效分布式训练、高效微调与推理的算法系统联合优化等问题。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 问题背景

  • 扩散模型的演进与多模态生成的效率挑战

  • 解构效率问题——算法设计与系统优化

2. 算法设计

  • 动态化思想加速 DiT——DyDiT

  • 多维度动态计算联合「强化」——RAPID3

3. 系统优化

  • FP8 & 稀疏化的联合感知训练——FPS Attention

4. 总结与展望


听众收益

  • 了解生成效率问题的技术挑战

  • 了解达摩院在这一方向的思考与 best practice


演讲亮点:基于团队 ICLR-2025 的最新工作 DyDiT 及其演进工作,讲述扩散模型推理加速的一个重要方向。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-27 18:004886

评论

发布
暂无评论

软件测试类文档,测试文档合集,软件全套资料集(原件)

金陵老街

软件文档 测试文档

伟创力收购JetCool以扩大数据中心和电源产品组合

财见

微创软件海外拓展新动向:日本Cosmo Design公司被纳入版图

财见

ACCA联合发布《2024年中国共享服务领域调研报告》,揭示行业数智化转型新趋势

财见

鸿蒙原生开发手记:02-服务卡片开发

少湖说

鸿蒙 HarmonyOS

鸿蒙原生开发手记:03-元服务开发全流程(开发元服务,只需要看这一篇文章)

少湖说

鸿蒙 HarmonyOS

如何在 Go 项目中隐藏敏感信息,比如避免暴露用户密码?

左诗右码

鸿蒙Flutter实战:13-鸿蒙应用打包上架流程

少湖说

鸿蒙 HarmonyOS

数聚存储,智慧未来:浪潮信息分布式存储在人工智能时代的创新与应用

财见

Spring高手之路25——深入解析事务管理的切面本质

砖业洋__

spring 事务管理

使用 DFU 模式修复或恢复 Mac 固件

sysin

Mac DFU

需求管理和产品规划有什么异同点

易成研发中心

需求管理 需求管理工具

产品经理如何做好需求管理和分析

易成研发中心

需求管理 需求分析

Python哪个框架合适开发速卖通商品详情api?

科普小能手

API Python框架 Python开发 API 接口 速卖通API接口

魔改 Typora 主题,造就 CodeVeil!

沉默的老李

Typora 定制化 开源、

鸿蒙原生开发手记:01-元服务开发

少湖说

鸿蒙 HarmonyOS

Python创建虚拟环境报错:Error: Command......

codists

Python

LED显示屏的亮度真的是越高越好吗?

Dylan

屏幕亮度 LED显示屏 全彩LED显示屏 led显示屏厂家

体验免费开箱即用的AI工具:Blackbox.AI

袁袁袁袁满

人工智能 ChatGPT 免费AI工具 GPT-4o 大模型工具

Windows - 内存优化

沉默的老李

内存 windows 11

IaaS、PaaS和SaaS的区别

兮动人

IaaS、PaaS和SaaS

亿珑能源控股有限公司与TMT Acquisition Corp完成合并

财见

阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席AICon北京并分享多模态生成模型的推理加速探索_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章