免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席 AICon 北京并分享多模态生成模型的推理加速探索

  • 2025-05-27
    北京
  • 本文字数:1044 字

    阅读完需:约 3 分钟

大小:521.27K时长:02:57
阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席AICon北京并分享多模态生成模型的推理加速探索

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声已确认出席并发表题为实现多模态生成“极致”加速的算法与系统挑战的主题分享,探讨以扩散模型为代表的多模态模型在近两年成为生成领域的基础模型,也使得文生图、文生视频等真正走入 C 端用户,推动澎湃的 AIGC 社区形成。但是随着模型的 Scale 越来越大,模型推理时间过长、显存占用过高仍旧是难以忍受的问题,以 Flux 和 Wan2.1 为例。但是过去在模型架构上的剪枝等手段不够适配扩散模型的特性,在此背景下,达摩院从算法设计与系统优化等不同的角度构建了多维度的扩散模型加速的方法,包括动态计算的 DyDiT、引入强化学习的联合动态范式 RAPID、FP8 与稀疏化的联合感知优化的 FPSAttention。



唐家声在阿里巴巴达摩院长期从事机器学习与计算机视觉领域的研究与应用,在视觉表征学习、目标跟踪与系统、分布式训练与高效推理等方向有丰富的项目与科研经历。多次获得 CVPR/ICCV/ECCV 上的多目标跟踪顶级竞赛冠军和 MOTChallenge 排行榜第一名。目前负责达摩院视觉技术实验室的 EfficientAIGC 方向,专注于视觉生成模型的高效分布式训练、高效微调与推理的算法系统联合优化等问题。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 问题背景

  • 扩散模型的演进与多模态生成的效率挑战

  • 解构效率问题——算法设计与系统优化

2. 算法设计

  • 动态化思想加速 DiT——DyDiT

  • 多维度动态计算联合「强化」——RAPID3

3. 系统优化

  • FP8 & 稀疏化的联合感知训练——FPS Attention

4. 总结与展望


听众收益

  • 了解生成效率问题的技术挑战

  • 了解达摩院在这一方向的思考与 best practice


演讲亮点:基于团队 ICLR-2025 的最新工作 DyDiT 及其演进工作,讲述扩散模型推理加速的一个重要方向。


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-05-27 18:004744

评论

发布
暂无评论

淘宝买家订单列表、订单详情、订单物流 API 接口全攻略

tbapi

淘宝API接口 淘宝店铺订单接口 淘宝订单数据接口 淘宝买家订单接口

火山引擎云上实战:一键部署 DeepSeek 大模型(蒸馏版)

火山引擎开发者社区

豆包大模型 1.5 正式发布,全面上线火山方舟

火山引擎开发者社区

基于 Megatron 的多模态大模型训练加速技术解析

阿里云大数据AI技术

人工智能 开源 多模态 大模型 Qwen

AI与.NET技术实操系列:ML.NET篇

秃头小帅oi

机械工厂数字化试金石:智能制造跃迁之路

积木链小链

数字化转型 智能制造 机械制造

CloudStudio 公开课-DeepSeek R1 模型训练与优化实战

CloudStudio

cloudstudio DeepSeek DeepSeek-R1

Vue3 路由配置与导航全攻略:从零到精通

伤感汤姆布利柏

货币金融服务使用堡垒机的原因分析

行云管家

网络安全 数据安全 堡垒机

手把手基于 MINI 数据集带你做一次板端精度评估

地平线开发者

自动驾驶; 地平线征程6 算法工具栏

智元机器人发布灵犀X2,集齐运动、交互、作业三智能

科技热闻

拼多多二面:高并发场景扣减商品库存如何防止超卖?

Geek_e3e86e

Java 编程

人工智能丨Web自动化智能体核心元素解析

测试人

人工智能 软件测试 测试开发 测试平台

黑龙江哪些单位需要做等保测评?

黑龙江陆陆信息测评部

云上一键部署通义千问 QwQ-32B 模型,阿里云 PAI 最佳实践

阿里云大数据AI技术

人工智能 多模态 Qwen PAI QwQ

新品速递丨Altair 推出轻量版仿真管理平台,助力企业轻松实现仿真数字化

Altair RapidMiner

制造业 仿真 CAE hyperworks

低空经济“蓄势腾飞”,数字样机保驾护航

DevOps和数字孪生

异构算力管理与调度:高效利用计算资源

鲸品堂

算力 企业号 2025年3月PK榜

CloudStudio 公开课 —— 大模型基础

CloudStudio

Cloud Studio DeepSeek

《Quick Start Kubernetes》读后感

codists

编程人

一箭15星丨数字样机:商业航天创新发展的关键引擎

DevOps和数字孪生

有道大模型翻译技术再突破,小参数垂类模型实现翻译质量全球第一

科技热闻

DeepSeek过时了?全网刷屏的Manus到底是什么?这样写申请秒过审核

卷福同学

软著申请 ChatGPT Manus

2025全球人形机器人领域深度报告:具身智能技术、人形机器人、大模型、产业链和行业前瞻

机器人头条

机器人 大模型 人形机器人 具身智能

如何解决在容器中执行 nvidia-smi 的系列问题

Infra研习社

#GPU

阿里巴巴达摩院视觉技术实验室 EfficientAIGC 负责人唐家声将出席AICon北京并分享多模态生成模型的推理加速探索_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章