2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

  • 2025-04-25
    北京
  • 本文字数:965 字

    阅读完需:约 3 分钟

大小:537.93K时长:03:03
腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


腾讯推理架构师向乾彪已确认出席 AICon 上海并在大模型推理性能优化策略专题发表题为《腾讯混元 AngelHCF 推理加速框架优化实践》的主题分享。腾讯 AngelHCF 推理加速框架针对混元 LLM 大语言模型做了深度推理优化,结合全新的 Hybrid 模型结构整体上取得了不错的推理成本优势,支撑了元宝线上混元模型上万卡推理。同时,AngelHCF 于 24 年初即大规模部署上线了万亿 MoE 大模型,针对大规模 MoE 模型通信特点做了混合切分策略优化,叠加模型压缩、PD 分离等优化手段,显著降低了线上推理成本。本次分享将从不同角度分别介绍腾讯混元推理加速框架 AngelHCF 所做的一些针对性优化,结合全新的 Turbos 模型结构,希望能给听众带来一些新的启发。


向乾彪聚焦于 GPU 推理加速技术多年,在性能优化、高性能异构计算等方面积累了丰富的经验,目前主要负责混元大语言模型推理加速框架 AngelHCF,涉及算子、通信、架构等多方面优化。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 腾讯混元模型 & AngelHCF 推理加速框架概述

2. 混元 Turbos Hybrid 推理优化

  • Mamba Hybrid 模型的推理优势及收益

  • kernel 精度以及性能调优

  • 显存 & KVCache 优化之路

3. 超大规模 MoE 模型并行策略优化

  • 各种模型切分策略的优缺点

  • 模型并行融合策略

  • 通信优化

4. PD 分离部署优化

  • PD 分离部署的优势

  • 请求智能调度策略

  • 计算通信 Overlap

5. 腾讯混元 & AngelHCF 落地情况和展望


听众收益:

  • 了解混元 Turbos Hybrid 结构带来的性能收益以及推理优化手段

  • 了解大规模 MoE 语言模型推理加速具体方法 &实践


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-25 15:007465

评论

发布
暂无评论

使用 TypeScript 从零搭建自己的 Web 框架:环境搭建

RoyLin

typescript

使用 TypeScript 从零搭建自己的 Web 框架:依赖注入

RoyLin

typescript

使用 TypeScript 从零搭建自己的 Web 框架:代理(Proxy)

RoyLin

typescript

支付系统概述(七):资产交换

agnostic

支付系统设计与实现

上海携程java高级面试题(一)

程序员李木子

人工智能 | 开启IT服务管理的AI时代,Jira Service Management推出AI虚拟助手

龙智—DevSecOps解决方案

虚拟现实技术在汽车设计中的应用场景

3DCAT实时渲染

使用 TypeScript 从零搭建自己的 Web 框架:文件扫描与动态导入

RoyLin

typescript

工业机器人系统开发中必不可少的工具:Perforce静态分析工具Helix QAC和Klocwork

龙智—DevSecOps解决方案

《自动机理论、语言和计算导论》阅读笔记:p172-p224

codists

编译原理

使用 TypeScript 从零搭建自己的 Web 框架:IoC 容器实现

RoyLin

typescript

使用 TypeScript 从零搭建自己的 Web 框架:探索装饰器与反射 API

RoyLin

typescript

论 预约系统的中的 业务规则架构

执于业务

使用 TypeScript 从零搭建自己的 Web 框架

RoyLin

typescript

分布式应用程序解析:它们是什么?以及它们是如何工作的?

Gingxing

分布式架构 API网关 Kong 网关 消息网关 Kong Gateway

软件开发人员必备的人工智能工具:AI编码工具与Atlassian Intelligence

龙智—DevSecOps解决方案

游戏开发 | 澳大利亚游戏音效巨头Firelight Technologies全面采用Helix Core,助力打造热门游戏音效

龙智—DevSecOps解决方案

编程的思维和方法

Bingo

性能优化 设计模式 领域驱动设计 领域建模

全面介绍Jama Connect,赋能您的系统开发和工程流程

龙智—DevSecOps解决方案

《超算互联网白皮书》正式发布,天翼云为超算行业发展贡献数智力量

编程猫

确保您的API安全:Kong Gateway顶级安全性的最佳实践

Gingxing

api 网关 Kong 网关 API 安全 消息网关 Kong Gateway

《深入理解计算机系统(原书第2版)》PDF

程序员李木子

游戏开发者必看:Perforce Helix Core的功能特点及游戏开发中的常用工具、典型用例介绍

龙智—DevSecOps解决方案

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章