AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

  • 2025-04-25
    北京
  • 本文字数:965 字

    阅读完需:约 3 分钟

大小:537.93K时长:03:03
腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


腾讯推理架构师向乾彪已确认出席 AICon 上海并在大模型推理性能优化策略专题发表题为《腾讯混元 AngelHCF 推理加速框架优化实践》的主题分享。腾讯 AngelHCF 推理加速框架针对混元 LLM 大语言模型做了深度推理优化,结合全新的 Hybrid 模型结构整体上取得了不错的推理成本优势,支撑了元宝线上混元模型上万卡推理。同时,AngelHCF 于 24 年初即大规模部署上线了万亿 MoE 大模型,针对大规模 MoE 模型通信特点做了混合切分策略优化,叠加模型压缩、PD 分离等优化手段,显著降低了线上推理成本。本次分享将从不同角度分别介绍腾讯混元推理加速框架 AngelHCF 所做的一些针对性优化,结合全新的 Turbos 模型结构,希望能给听众带来一些新的启发。


向乾彪聚焦于 GPU 推理加速技术多年,在性能优化、高性能异构计算等方面积累了丰富的经验,目前主要负责混元大语言模型推理加速框架 AngelHCF,涉及算子、通信、架构等多方面优化。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 腾讯混元模型 & AngelHCF 推理加速框架概述

2. 混元 Turbos Hybrid 推理优化

  • Mamba Hybrid 模型的推理优势及收益

  • kernel 精度以及性能调优

  • 显存 & KVCache 优化之路

3. 超大规模 MoE 模型并行策略优化

  • 各种模型切分策略的优缺点

  • 模型并行融合策略

  • 通信优化

4. PD 分离部署优化

  • PD 分离部署的优势

  • 请求智能调度策略

  • 计算通信 Overlap

5. 腾讯混元 & AngelHCF 落地情况和展望


听众收益:

  • 了解混元 Turbos Hybrid 结构带来的性能收益以及推理优化手段

  • 了解大规模 MoE 语言模型推理加速具体方法 &实践


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-25 15:008054

评论

发布
暂无评论

CAN总线与嵌入式系统通信:实时性和可靠性的平衡

申公豹

嵌入式

2023 年的“云原生的演化”

卢卡多多

总结 2023

被面试官PUA了:创建索引时一定会锁表?

王磊

Java 面试

反向 Debug 了解一下?揭秘 Java DEBUG 的基本原理 | 京东云技术团队

京东科技开发者

Java debug 后端

DDD学习与感悟——向屎山冲锋 | 京东云技术团队

京东科技开发者

架构 DDD 六边形

技术译文 | 微服务测试——契约测试

AREX 中文社区

微服务 测试 契约测试

FPGA在嵌入式系统中的角色:加速、定制与灵活性实战与运用

申公豹

嵌入式

用友全球司库十问(八)|集团企业如何做好资金集中化管理?

用友BIP

全球司库 资金集中管理

主馆位置即将售罄“2024北京信息通信展会”众多知名企聚京城

AIOTE智博会

通信展 信息通信展

文体中心场地预订小程序开发笔记一-功能设计

CC同学

强大的字体设计编辑:FontLab 8最新激活版

胖墩儿不胖y

Mac软件 字体设计 字体编辑 设计字体软件

IntelliJ IDEA安装教程

小魏写代码

大数据从业者必知必会的Hive SQL调优技巧 | 京东云技术团队

京东科技开发者

数仓调优实践丨SQL改写消除相关子查询

华为云开发者联盟

数据库 大数据 华为云 华为云开发者联盟 华为云GaussDB(DWS)

【收藏】法律人办案必备检索网站最新汇总!附检索技巧

科技汇

文心一言 VS 讯飞星火 VS chatgpt (164)-- 算法导论13.1 4题

福大大架构师每日一题

福大大架构师每日一题

边缘智能:嵌入式系统中的神经网络应用开发实战

申公豹

嵌入式

软件开发

Geek_8da502

播下开源教育的种子分论坛圆满举办

开放原子开源基金会

开源

终端闲思录(5)- 终端与缓冲的关系

蓬蒿

终端 缓冲

嵌入式系统的数据存储与管理策略

申公豹

嵌入式

20231225 介绍一个我解决过的难题

Luke

DevSecOps端到端的安全能力构建为什么重要?

极狐GitLab

生成式 AI 的下一阶段将走向何方?

Baihai IDP

深度学习 程序员 AI 白海科技 GenAI

一起学Elasticsearch系列-写入原理

Java随想录

Java 大数据 elastic

大模型加持下,AI招聘的“下一站”

用友BIP

AI招聘

重塑招聘的价值,AI能扮演好企业的“人才捕手”吗?

用友BIP

AI招聘

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章