阿里云ODPS普惠算力再升级,Data+AI全产品降价低至59元! 了解详情
写点什么

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

  • 2025-04-25
    北京
  • 本文字数:965 字

    阅读完需:约 3 分钟

大小:537.93K时长:03:03
腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海

5 月 23 日-24 日,AICon 全球人工智能开发与应用大会上海站即将拉开帷幕。本次大会将聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent、多模态应用、大模型架构创新、推理性能优化、大模型驱动数据创新、AI 产品创新与出海策略等核心议题,呈现技术与应用融合的最新趋势。


腾讯推理架构师向乾彪已确认出席 AICon 上海并在大模型推理性能优化策略专题发表题为《腾讯混元 AngelHCF 推理加速框架优化实践》的主题分享。腾讯 AngelHCF 推理加速框架针对混元 LLM 大语言模型做了深度推理优化,结合全新的 Hybrid 模型结构整体上取得了不错的推理成本优势,支撑了元宝线上混元模型上万卡推理。同时,AngelHCF 于 24 年初即大规模部署上线了万亿 MoE 大模型,针对大规模 MoE 模型通信特点做了混合切分策略优化,叠加模型压缩、PD 分离等优化手段,显著降低了线上推理成本。本次分享将从不同角度分别介绍腾讯混元推理加速框架 AngelHCF 所做的一些针对性优化,结合全新的 Turbos 模型结构,希望能给听众带来一些新的启发。


向乾彪聚焦于 GPU 推理加速技术多年,在性能优化、高性能异构计算等方面积累了丰富的经验,目前主要负责混元大语言模型推理加速框架 AngelHCF,涉及算子、通信、架构等多方面优化。他在本次会议的详细演讲内容如下:


演讲提纲:

1. 腾讯混元模型 & AngelHCF 推理加速框架概述

2. 混元 Turbos Hybrid 推理优化

  • Mamba Hybrid 模型的推理优势及收益

  • kernel 精度以及性能调优

  • 显存 & KVCache 优化之路

3. 超大规模 MoE 模型并行策略优化

  • 各种模型切分策略的优缺点

  • 模型并行融合策略

  • 通信优化

4. PD 分离部署优化

  • PD 分离部署的优势

  • 请求智能调度策略

  • 计算通信 Overlap

5. 腾讯混元 & AngelHCF 落地情况和展望


听众收益:

  • 了解混元 Turbos Hybrid 结构带来的性能收益以及推理优化手段

  • 了解大规模 MoE 语言模型推理加速具体方法 &实践


除此之外,本次大会还策划了AI Agent 构建及多元应用多模态大模型创新实践AI for Data,数据管理与价值挖掘实践大模型推理性能优化策略AI 产品设计的创新思维智能硬件与大模型的融合探索金融领域大模型应用实践大模型助力业务提效实践等专题,届时将有来自不同行业、不同领域、不同企业的 60+资深专家在 AICon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-04-25 15:008086

评论

发布
暂无评论

智能合约上链系统开发|智能合约上链APP软件开发

系统开发

进来抄作业:分布式系统中保证高可用性的常用经验

华为云开发者联盟

高可用 运维 设计 分布式系统 系统

跨越全场景统一架构三大挑战,MindSpore亮出“四招”

华为云开发者联盟

深度学习 联邦学习 mindspore 算子 ai框架

盘点2020| 开启小马哥的新未来

小马哥

盘点2020

重学JS | 异步编程 Generator()

梁龙先森

面试 大前端 编程语言 28天写作

okhttp3 第一次使用

我就感觉到快

智汇华云 | 安超OS为企业数字化转型构建坚实的云基座

华云数据

Java 异常处理

大海

Java java异常处理

APICloud的发展和应用

anyRTC开发者

ios android 跨平台 sdk APICloud

新鲜出炉!阿里内部开源SpringCloud Alibaba全解(全彩版)全网首发

Java架构追梦

Java 学习 架构 面试 SpringCloud Alibaba

港股配资系统搭建

软件开发大鱼V15988750073

金融科技 港股交易系统开发 在线开户系统 CFD交易系统 港股多账户系统

开发复杂业务系统,有哪些设计思路

邴越

十八般武艺玩转GaussDB(DWS)性能调优:路径干预

华为云开发者联盟

数据库 sql 性能调优 GaussDB 算子

Serverless 在 SaaS 领域的最佳实践

Serverless Devs

Serverless 云原生 SaaS

高频量化交易机器人系统开发|高频量化交易机器人APP软件开发

系统开发

林昊获中国计算机学会杰出工程师奖,阿里中间件再获高度肯定,“三位一体”推动技术普惠

阿里巴巴云原生

阿里巴巴 阿里云 开发者 云原生 中间件

Redis 学习笔记 02:链表

架构精进之路

redis 七日更 28天写作

快抛弃你错误的坚持

石君

生活随想 28天写作

顶级!13位专家力荐Spring5为企业级开发提供一站式方案

996小迁

Java spring 编程 架构 面试

工业传感器:工业互联网的第一道门

工业互联网

如何对AD和Exchange进行安全加固满足护网需要?

嘉为蓝鲸

安全 asm AD 邮件系统 权限

Socket粘包问题终极解决方案—Netty版(2W字)!

王磊

Java socket Netty

Android开发时的多点触控是如何实现的?

博文视点Broadview

从美国《拜杜法案》到中国供应链体系形成的内在逻辑

JiangX

供应链 28天写作 制造

软件测试--selenium安装使用

测试人生路

软件测试

2020DevOps状态报告——变更管理

禅道项目管理

DevOps 运维 开发 趋势 自动化测试

阿里P8内部架构核心学习知识笔记在各大互联网上流传,限时开放下载

Java架构之路

Java 程序员 架构 面试 编程语言

实时媒体AI,打破内容创作天花板,加速视频创新

华为云开发者联盟

人工智能 云原生 媒体 视频

科技赋能传统产业:工业绿色可视化—核电站工艺流程组态仿真

一只数据鲸鱼

物联网 数据可视化 组态软件 绿色工业 核电站

看图学NumPy:掌握n维数组基础知识点,看这一篇就够了

华为云开发者联盟

Python 机器学习 数组 Numpy

腾讯混元 AngelHCF 推理加速框架优化实践|AICon 上海_架构_AICon 全球人工智能开发与应用大会_InfoQ精选文章