写点什么

超越算力瓶颈,大模型推理的跨层优化前沿实践|AICon 上海

  • 2025-04-27
    北京
  • 本文字数:1039 字

    阅读完需:约 3 分钟

大小:582.02K时长:03:18
超越算力瓶颈,大模型推理的跨层优化前沿实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


阿里云技术专家李元龙已确认出席 AICon 上海并将在大模型推理性能优化策略专题发表题为《超越算力瓶颈,大模型推理的跨层优化前沿实践》的主题分享。本次演讲将逐层解析大模型推理的核心技术,从模型代码讲解 Transformer 前向传播的核心流程与关键模块设计;框架层解读主流推理引擎(如 vLLM/TensorRT)的加速原理与适用场景;深度学习框架揭示 PyTorch 动态图编译、算子优化等底层支持技术;硬件加速剖析 CUDA 并行计算与内存优化策略;最后结合 GPU 特性分析不同硬件对推理性能的影响规律,提供从代码优化到硬件选型的全链路实践指南,帮助开发者快速构建高效推理方案。


李元龙是中山大学博士,大模型技术专家,就职于阿里云。负责大模型在 B 端客户的算法应用场景方案设计实现,落地及优化。具有丰富的 AI,机器学习 &优化算法技术研究 &生产落地经验,目前专注于各类模型的训练推理技术,结合底层算力技术的研究和优化。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 大模型推理技术全景

  • 技术演进脉络

  • 分层技术体系

  • 垂直分层:模型架构层→框架调度层→计算图优化层→硬件指令层

  • 横向协同:算法-框架-硬件的联合优化范式

2. 模型架构层的推理优化

  • 前沿架构优化技术

  • 动态计算图优化(DeepSeek 的 Dynamic Token 机制)

  • 稀疏激活模式(Mixtral 的 MoE 门控策略)

  • 计算-通信重叠(LLAMA 的预取策略)

3. 推理框架层的加速革命

  • 框架技术矩阵分析

  • 框架选型决策树

4. 计算图编译层的深度优化

  • Torch2.x 编译技术栈

  • 编译实践陷阱

5. 硬件层的极限压榨

  • CUDA 加速范式

  • GPU 选型决策模型

6. 总结与展望


听众收益:

  • 为听众提供简明扼要的推理部署优化指南,使用户快速找到适合自己场景的模型推理部署策略

  • 了解最前沿的推理优化技术和技术局限性


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-27 14:004402

评论

发布
暂无评论

支持多套对象存储,冷热数据分层又添新功能

焱融科技

分布式 云原生 高性能 文件存储 技术博客

架构是什么?空中楼阁?不切实际?

Java架构师迁哥

麦肯锡最新报告 | 开发者速率成为企业增长助推剂

LigaAI

SaaS

iOS 面试策略之系统框架-设计模式

iOSer

ios 并发编程 tableView

如何快速构建嵌入式全栈知识体系?

博文视点Broadview

一颗CPU与病魔赛跑

E科讯

智能量化网格策略交易机器人,马丁倍投机器人

低代码核心优势是:降本增效+多系统集成,这真的对吗?

优秀

低代码

Java程序员想要拿到50W以上年薪,哪个技术是必备的?

Java架构师迁哥

阿里的互联网三高架构是真的牛!腾讯百度根本模仿不来

Java架构师迁哥

ASP.NET Core整合Zipkin链路跟踪

yi念之间

最详细的 Python 结合 RFM 模型实现用户分层实操案例!

JackTian

Python 编程 程序员 数据分析 RFM模型

强化学习落地:竞态场景下基于锁机制的闲置端口查用

行者AI

强化学习

千万级学生管理系统考试试卷存储方案

chenmin

聊聊业务数据分析那些事儿

小飞象@木木自由

数据分析 业务场景分析 业务数据分析 业务分析

Kubernetes 稳定性保障手册:洞察+预案

阿里巴巴云原生

数据库 容器 云原生 k8s 监控

云小课 | 华为云KYON之L2CG

华为云开发者联盟

虚拟私有云 华为云 大二层网络 KYON企业级云网络 L2CG

书单 | 职场办公类私藏好书,轻松Get职场必备技能

博文视点Broadview

联邦学习在视觉领域的应用,揭秘AI人工智能创新应用奖获奖案例

博文视点Broadview

软硬件融合新时代——让软件够灵活,硬件够高效,鱼和熊掌可兼得

博文视点Broadview

Hive对分区分桶表的操作

五分钟学大数据

大数据 hive 5月日更

并发王者课 - 青铜4:synchronized用法初体验

MetaThoughts

Java 多线程 并发 并发王者课

Mybatis-Plus的应用场景及注入SQL原理分析

vivo互联网技术

源码分析 mybatis

李开复、张亚勤、吴恩达…国际大咖给你讲解AI知识

博文视点Broadview

Leveldb解析之五:理解leveldb的持久化和MVCC实现机制

Jowin

leveldb

五种网络IO模型详解

Linux服务器开发

后端 epoll Linux服务器开发 网络io 网络模型

当当购书优惠码又可以限时抢啦(热卖新书等你来)

博文视点Broadview

面试37次,16个offer上岸,总结了一些面试心得

北游学Java

面试 offer

打破固有思维(十八)

Changing Lin

5月日更

IDC数据中心介绍

大数据技术指南

数据中心 5月日更

KubeSphere+QKE 轻松实现容器多集群管理

青云技术社区

容器 k8s 开发工具

超越算力瓶颈,大模型推理的跨层优化前沿实践|AICon 上海_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章