写点什么

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

  • 2025-04-25
    北京
  • 本文字数:965 字

    阅读完需:约 3 分钟

大小:537.93K时长:03:03
腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


腾讯推理架构师向乾彪已确认出席 AICon 上海并在大模型推理性能优化策略专题发表题为《腾讯混元 AngelHCF 推理加速框架优化实践》的主题分享。腾讯 AngelHCF 推理加速框架针对混元 LLM 大语言模型做了深度推理优化,结合全新的 Hybrid 模型结构整体上取得了不错的推理成本优势,支撑了元宝线上混元模型上万卡推理。同时,AngelHCF 于 24 年初即大规模部署上线了万亿 MoE 大模型,针对大规模 MoE 模型通信特点做了混合切分策略优化,叠加模型压缩、PD 分离等优化手段,显著降低了线上推理成本。本次分享将从不同角度分别介绍腾讯混元推理加速框架 AngelHCF 所做的一些针对性优化,结合全新的 Turbos 模型结构,希望能给听众带来一些新的启发。


向乾彪聚焦于 GPU 推理加速技术多年,在性能优化、高性能异构计算等方面积累了丰富的经验,目前主要负责混元大语言模型推理加速框架 AngelHCF,涉及算子、通信、架构等多方面优化。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 腾讯混元模型 & AngelHCF 推理加速框架概述

2. 混元 Turbos Hybrid 推理优化

  • Mamba Hybrid 模型的推理优势及收益

  • kernel 精度以及性能调优

  • 显存 & KVCache 优化之路

3. 超大规模 MoE 模型并行策略优化

  • 各种模型切分策略的优缺点

  • 模型并行融合策略

  • 通信优化

4. PD 分离部署优化

  • PD 分离部署的优势

  • 请求智能调度策略

  • 计算通信 Overlap

5. 腾讯混元 & AngelHCF 落地情况和展望


听众收益:

  • 了解混元 Turbos Hybrid 结构带来的性能收益以及推理优化手段

  • 了解大规模 MoE 语言模型推理加速具体方法 &实践


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-25 15:008447

评论

发布
暂无评论

「架构师训练营」第 1 周作业 - 食堂就餐卡系统设计

xiaomao

架构第5周总结

Geek_Gu

极客大学架构师训练营

5.2 分布式缓存架构:常见的缓存实现形式

orchid9

5.5负载均衡架构

张荣召

架构第五周作业

Geek_Gu

极客大学架构师训练营

第五周总结

fmouse

架构师训练营第一周学习总结

张小胖

极客大学架构师训练营

「架构师训练营第 1 期」第五周作业

张国荣

Week_05 总结

golangboy

极客大学架构师训练营

5.4 消息队列:如何避免系统故障传递?

orchid9

第一周 架构方法-学习总结

jizhi7

极客大学架构师训练营

食堂就餐卡系统设计

张小胖

极客大学架构师训练营 张小胖

week1- 作业二:周总结

未来已来

架构师训练营Week01总结

第一周作业总结

hunk

极客大学架构师训练营

5.3 分布式缓存架构:一致性 hash 算法

orchid9

架构师训练营第五周命题作业

一马行千里

极客大学架构师训练营 命题作业

食堂就餐卡系统设计

jizhi7

5.1 分布式缓存架构:架构原理与注意事项

orchid9

第五周作业(作业一)

Geek_83908e

极客大学架构师训练营

2期架构师训练营 - 食堂就餐卡系统设计

云飞扬

极客大学架构师训练营

week1-作业一:食堂就餐卡系统设计

未来已来

第五周学习笔记

张荣召

架构师训练营第一周学习总结

xiaomao

2期架构师训练营 - 第一周学习总结

云飞扬

极客大学架构师训练营

架构图

猴子胖胖

架构

5.5 负载均衡架构

orchid9

第五周作业

Geek_ac4080

架构师训练营第五周总结

xs-geek

极客大学架构师训练营

第五周 技术选型 学习总结

应鹏

学习 极客大学架构师训练营

架構師訓練營第 1 期 - 第 05 周總結

Panda

架構師訓練營第 1 期

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章