写点什么

一念 LLM 分布式推理优化实践

  • 2025-08-01
    北京
  • 本文字数:842 字

    阅读完需:约 3 分钟

大小:471.49K时长:02:40
一念 LLM 分布式推理优化实践

8 月 22 日 -23 日,首届AICon 全球人工智能开发与应用大会深圳站即将拉开帷幕。本次大会将聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自阿里、腾讯、字节跳动、微软、华为等头部企业以及商汤、Plaud、Rokid 等 AI 明星公司的专家,分享 AI 落地实战经验。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


腾讯公司专家工程师袁镱已确认出席并发表题为一念 LLM 分布式推理优化实践的主题分享,介绍基于大模型推理基本原理,结合 MoE 类模型特性,一念 LLM 设计了一套高效分布式推理优化方案。围绕流水线并行、显存管理、以及 DP/TP/PP 混合并行策略,实现了对推理过程的深度调优。在 DeepSeek 推理测试中,相较于业界主流开源推理框架,整体吞吐性能提升达 48%。



袁镱是腾讯 PCG 机器学习平台技术负责人,负责无量系统和一念 LLM 等机器学习训练和推理框架研发。他在本次会议的详细演讲内容如下:


演讲提纲:

1、大模型推理的挑战

  • 大模型推理的基本逻辑

  • 各个推理加速框架的设计思路对比

2、大模型分布式推理的主要优化技术

  • DP/EP 等并行技术与 MoE 模型的特点

3、一念 LLM 的设计与优化

  • 一念 LLM 的设计思路和主要优化方向

  • 一念 LLM 针对 DeepSeek 特点进行的性能优化

听众收益:

  • 了解大模型推理的基本逻辑以及各个推理加速框架的设计思路对比

  • 了解一念 LLM 的设计思路,以及针对 DeepSeek 特点进行的性能优化


除此之外,本次大会还策划了AI InfraAI 产品研发与商业落地探索Agent 应用新范式与 MCP 生态实践AI 驱动业务重塑与提效智能硬件与具身智能创新实践AI 原生时代的卓越架构治理、、多模态与空间智能技术创新Agent + Data 落地探索AI 赋能研发体系变革Agent 核心技术与系统架构创新大模型在金融领域的创新实践等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 70+资深专家在 AICon 深圳站现场带来前沿技术洞察和一线实践经验。


大会 9 折优惠倒计时最后 1 天,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-08-01 13:007126

评论

发布
暂无评论

YashanDB数据库的常见问题及解决办法

数据库砖家

YashanDB数据库的多语言支持能力探讨

数据库砖家

YashanDB数据库的扩展性如何满足企业需求

数据库砖家

多场景展示平台

微擎应用市场

基于华为开发者空间AI Agent开发平台构建We码会议助手

华为云开发者联盟

AI hdc 华为开发者空间 MCP

浅谈Java内省

京东科技开发者

YashanDB数据库的多版本控制系统详解

数据库砖家

YashanDB数据库的多语言支持与国际化探索

数据库砖家

深度解析 P600 生态:RWA 与实体经济融合的创新之路

股市老人

YashanDB数据库的技术架构适合企业数字化转型吗?

数据库砖家

YashanDB数据库的技术架构与应用场景

数据库砖家

全场景车辆服务数字化平台

微擎应用市场

最新资讯 | 矩阵起源产品VP邓楠亮相中国行业互联网大会 揭秘AI原生数据工程新范式

MatrixOrigin

活动管理解决方案

微擎应用市场

YashanDB数据库的技术路线图及未来规划

数据库砖家

YashanDB数据库的内存管理技巧及方案总结

数据库砖家

YashanDB数据库的多语言支持与开发环境选择

数据库砖家

YashanDB数据库的多模态功能与应用前景

数据库砖家

订餐数字化中枢

微擎应用市场

由 Mybatis 源码畅谈软件设计(八):从根上理解 Mybatis 二级缓存

京东科技开发者

YashanDB数据库的常见问题与解决办法

数据库砖家

YashanDB数据库的架构特点及应用场景详解

数据库砖家

域名和空间的关系和区别

国科云

区块链数字 ID 系统的开发

北京木奇移动技术有限公司

区块链技术 软件外包公司 数字ID

YashanDB数据库的合规性审计与报告机制

数据库砖家

一分钟入门mcp开发

京东科技开发者

懒懒笔记 | 课代表带你梳理【RAG课程 15&16:从多文档总结到图表生成的论文问答系统打造】

商汤万象开发者

告别盲测时代,用 Playwright 全链路追踪,一键锁定问题!

测试人

软件测试

如何有效实施MyEMS开源能源管理系统?ISO 50004为你提供全面指南

开源能源管理系统

开源 能源管理 开源能源管理系统 ISO 50004

用户活跃管理工具

微擎应用市场

YashanDB数据库的多租户支持能力

数据库砖家

一念 LLM 分布式推理优化实践_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章