50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席 AICon 北京并分享多模态生成模型的推理加速探索

  • 2025-05-27
    北京
  • 本文字数:1044 字

    阅读完需:约 3 分钟

大小:521.27K时长:02:57
阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席AICon北京并分享多模态生成模型的推理加速探索

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声已确认出席并发表题为实现多模态生成“极致”加速的算法与系统挑战的主题分享,探讨以扩散模型为代表的多模态模型在近两年成为生成领域的基础模型,也使得文生图、文生视频等真正走入 C 端用户,推动澎湃的 AIGC 社区形成。但是随着模型的 Scale 越来越大,模型推理时间过长、显存占用过高仍旧是难以忍受的问题,以 Flux 和 Wan2.1 为例。但是过去在模型架构上的剪枝等手段不够适配扩散模型的特性,在此背景下,达摩院从算法设计与系统优化等不同的角度构建了多维度的扩散模型加速的方法,包括动态计算的 DyDiT、引入强化学习的联合动态范式 RAPID、FP8 与稀疏化的联合感知优化的 FPSAttention。



唐家声在阿里巴巴达摩院长期从事机器学习与计算机视觉领域的研究与应用,在视觉表征学习、目标跟踪与系统、分布式训练与高效推理等方向有丰富的项目与科研经历。多次获得 CVPR/ICCV/ECCV 上的多目标跟踪顶级竞赛冠军和 MOTChallenge 排行榜第一名。目前负责达摩院视觉技术实验室的 EfficientAIGC 方向,专注于视觉生成模型的高效分布式训练、高效微调与推理的算法系统联合优化等问题。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 问题背景

  • 扩散模型的演进与多模态生成的效率挑战

  • 解构效率问题——算法设计与系统优化

2. 算法设计

  • 动态化思想加速 DiT——DyDiT

  • 多维度动态计算联合「强化」——RAPID3

3. 系统优化

  • FP8 & 稀疏化的联合感知训练——FPS Attention

4. 总结与展望


听众收益

  • 了解生成效率问题的技术挑战

  • 了解达摩院在这一方向的思考与 best practice


演讲亮点:基于团队 ICLR-2025 的最新工作 DyDiT 及其演进工作,讲述扩散模型推理加速的一个重要方向。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-27 18:005055

评论

发布
暂无评论

如何让TiDB在云上智能运维 (TiDB Hackathon 赛题)

如果迎着风就飞

云原生 operator TiDB Operator 存储上云

为什么很难得出结论

将军-技术演讲力教练

c语言学习笔记2021/12

姬翔

盘点2021(一)

圣迪

复盘 盘点 2021

性能分析之Linux系统平均负载案例分析

zuozewei

Linux 性能分析 12月日更

百度智能云 AI 公有云服务市场,连续五次第一!

百度大脑

人工智能

性能即天元:vivo S12的落子与棋局

脑极体

滴滴数据通道服务演进之路

Kafka中文社区

启梦行动再扬帆 | 2021启智社区优秀项目&优秀开发者评选结果重磅揭晓

OpenI启智社区

启智社区 优秀开发者 优秀开源项目

Go 语言快速入门指南:第七篇 方法

宇宙之一粟

12月日更

完蛋,我的事务怎么不生效?

秦怀杂货店

MySQL 数据库 事务 事务失效

Go+ 结构体方法定义教程

liuzhen007

28天写作 12月日更

绘制监控页面的一些最佳实践

耳东@Erdong

最佳实践 监控 28天写作 12月日更

记录与 Electron 的第一次亲密接触

何佩弦

跨平台 Electron

Dubbo 框架学习笔记十五

风翱

dubbo 12月日更

2021年全国人工智能大赛正式启动,396万奖金等你报名!

OpenI启智社区

人工智能大赛

软件设计之非功能性

xcbeyond

软件设计 28天写作 12月日更 非功能性

react源码解析18事件系统

buchila11

React

Dubbo 框架学习笔记十四

风翱

dubbo 12月日更

过冬

搬砖的周狮傅

随笔杂谈

.NET中的Husky工具

喵叔

28天写作 12月日更

26《重学JAVA》--网络编程之Socket类

杨鹏Geek

Java25周年 28天写作 12月日更

基于流程管理,提高工作质量和效率

流程管理

低代码实现探索(十一)流程中的动作执行器

零道云-混合式低代码平台

黑客是怎么盗取你的密码的?

喀拉峻

黑客 网络安全

低代码实现探索(十)流程执行器

零道云-混合式低代码平台

一文了解 Redis 内存监控和内存消耗

程序员历小冰

redis 28天写作 12月日更

慢跑的正确打开方式

wood

跑步 28天写作

从AI前沿到科技自立:百度大脑的风向标意义

脑极体

HarmonyOS(鸿蒙)——滑动事件之上下左右滑动

李子捌

28天写作 21天挑战 鸿蒙开发 12月日更

为什么?为什么要先问目的?(27/28)

赵新龙

28天写作

阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席AICon北京并分享多模态生成模型的推理加速探索_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章