50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

一念 LLM 分布式推理优化实践

  • 2025-08-01
    北京
  • 本文字数:842 字

    阅读完需:约 3 分钟

大小:471.49K时长:02:40
一念 LLM 分布式推理优化实践

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


腾讯公司专家工程师袁镱已确认出席并发表题为一念 LLM 分布式推理优化实践的主题分享,介绍基于大模型推理基本原理,结合 MoE 类模型特性,一念 LLM 设计了一套高效分布式推理优化方案。围绕流水线并行、显存管理、以及 DP/TP/PP 混合并行策略,实现了对推理过程的深度调优。在 DeepSeek 推理测试中,相较于业界主流开源推理框架,整体吞吐性能提升达 48%。



袁镱是腾讯 PCG 机器学习平台技术负责人,负责无量系统和一念 LLM 等机器学习训练和推理框架研发。他在本次会议的详细演讲内容如下:


演讲提纲:

1、大模型推理的挑战

  • 大模型推理的基本逻辑

  • 各个推理加速框架的设计思路对比

2、大模型分布式推理的主要优化技术

  • DP/EP 等并行技术与 MoE 模型的特点

3、一念 LLM 的设计与优化

  • 一念 LLM 的设计思路和主要优化方向

  • 一念 LLM 针对 DeepSeek 特点进行的性能优化

听众收益:

  • 了解大模型推理的基本逻辑以及各个推理加速框架的设计思路对比

  • 了解一念 LLM 的设计思路,以及针对 DeepSeek 特点进行的性能优化


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


大会 9 折优惠倒计时最后 1 天,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-08-01 13:007445

评论

发布
暂无评论

互联网中的缓存

陈皮

基于领域驱动设计的业务中台架构设计

冯文辉

中台 业务中台 领域驱动设计 DDD

架构师训练营第五章作业

吴吴

架构师训练营第五周作业

王铭铭

MQ 核心概念

陈皮

陈芳,高考之后我要学计算机专业,将来干IT发财了,我就娶你!

张小方

程序员 面试 薪资 毕业

UC Token即将强势登陆

Geek_116789

第五周总结

Acker飏

极客大学架构师训练营

架构师训练营第五周总结

王铭铭

「架构师训练营」第五周作业

旭东(Frank)

算法 极客大学架构师训练营 哈希 一致性哈希

架构师训练营Week 05 学习总结

Frank Zeng

学习总结 -- Week 5

吴炳华

极客大学架构师训练营

【架构师训练营】第五周作业

Mr.hou

极客大学架构师训练营

阿里巴巴、百度、美团都在用的 Spring Cloud 微服务架构

java通天架构哪吒

Spring Cloud SpringCloud

负载均衡(Load Balance)

陈皮

分布式技术总结

LEAF

架构师训练营第五周总结

sunnywhy

架构感悟5-算法之美

旭东(Frank)

架构 算法 感悟 极客大学架构师训练营

Week 05 学习总结

卧石漾溪

极客大学架构师训练营

【架构师训练营】第五周总结

Mr.hou

极客大学架构师训练营

计算机操作系统基础(十五)---使用fork系统调用创建进程

书旅

php laravel 操作系统 进程 线程’

架构师训练营第5周作业

时来运转

架构师训练营第五章总结

吴吴

架构师训练营第5周总结

时来运转

第五周总结

秦宝齐

课程作业

第5周总结

娄江国

极客大学架构师训练营

分布式缓存 - 第五周总结

孙志平

Intellij IDEA必备插件,提高效率的“七种武器”

码农神说

面试 IDEA idea插件

架构师训练营 第五周 基于虚拟节点的一致性Hash算法作业

且听且吟

极客大学架构师训练营

「架构师训练营」Week5作业

Frank Zeng

原来 JavaScript 中的 WeakMap 是这样子的

Geek_z9ygea

Java 大前端 Web

一念 LLM 分布式推理优化实践_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章