AI 进化论丨第五期：推理革命——Mooncake 如何破解成本、吞吐与长上下文困局_阿里巴巴_付秋伟

内容介绍

嘉宾介绍：

主持人：王一鹏 InfoQ 极客传媒总经理、总编辑
嘉宾 1：章明星清华大学副教授
嘉宾 2：马腾阿里云高级技术专家、Mooncake 项目核心贡献者

视频介绍：

大模型应用加速普及的当下，推理面临高成本、低吞吐、长上下文适配难的瓶颈，而底层 OS 的资源调度与 IO 优化是破局关键。

作为阿里云深度参与并主导运营的开源项目，Mooncake 依托阿里云基础软件国产化积累，以“PD 分离”架构、“以存换算”设计，结合 eRDMA 技术，与 OS 层深度协同，实现了 KVCache 跨实例共享，最终使得推理成本、响应时间大幅降低。本次直播聚焦 Mooncake 核心技术解析、企业落地实践及未来规划，共探大模型推理高效化路径。

视频亮点：

● 瓶颈破解：大模型推理痛点解析与 PD 分离、KVCache 池化思路
● 技术干货：详解 Transfer Engine（eRDMA / 零拷贝）+ 多级缓存优化
● 实践验证：vLLM/SGLang 适配 + 企业级部署经验分享
● 未来展望：Mooncake Store v2 多实例共享 + 多框架生态扩展

创作场景

AI 进化论丨第五期：推理革命——Mooncake 如何破解成本、吞吐与长上下文困局

付秋伟

内容介绍

嘉宾介绍：

视频介绍：

视频亮点：

评论

Python 教程之数据分析（5）—— 使用 Python 进行数据分析和可视化 | 第 2 套

字节跳动A/B实验背后的秘密：样本量计算

LED显示屏是否可以实现智能化控制

博云 Kubernetes 开源榜单贡献度进入全球前十

Qt | 关于对象树和元对象的相关问题

MySQL系列——表的创建、插入、修改、删除数据

MySQL系列——约束、存储引擎、事务

NFT艺术品交易平台：有哪些功能？

Python 教程之数据分析（6）—— 数据分析的数学运算

【荣耀开发者服务平台—百亿曝光扶持等你来】智慧服务快应用卡片接入指南（上）

软件测试 | 测试开发 | 测试人员必须掌握的测试用例

源码 | SpringBoot启动流程大揭秘

测试平台解决了什么问题？

博弈论（depu）与孙子兵法-02（46/100）

直播预告 | PolarDB-X 动手实践系列——PolarDB-X 数据导入导出功能

“数智化”时代，房企转型路径与挑战的一种技术思路

字节跳动 DanceCC 工具链系列之Xcode LLDB耗时监控统计方案

数据可视化系列教程之组件通信

iOS端如何实现带UI截屏分享

软件测试 | 测试开发 | 这些常用测试平台，你们公司在用的是哪些呢？

Qt | 关于容器类的一些总结

软件测试 | 测试开发 | 测试工程师用 Shell 定位 Bug 的正确姿势

一加现在属于OPPO吗资深“加油”来解答

基于Hudi的湖仓一体技术在Shopee的实践

软件测试 | 测试开发 | 一文搞定 uiautomator2 自动化测试工具使用

软件测试 | 测试开发 | 智能遍历测试在回归测试与健壮性测试的应用

广东省湛江市等保测评机构有几家？怎么做？

高并发下的网络 IO 模型设计

Qt | Qt中的一些使用在容器类上的算法

软件测试 | 测试开发 | AppCrawler 自动遍历测试实践(三)：动手实操与常见问题汇总

创作场景

AI 进化论丨第五期：推理革命——Mooncake 如何破解成本、吞吐与长上下文困局

内容介绍

嘉宾介绍：

视频介绍：

视频亮点：

评论

精选视频

大厂实战PPT下载