写点什么

Mooncake 正式开源!阿里云与清华大学共建 AI 大模型推理项目,加速大模型推理技术发展

  • 2024-11-28
    北京
  • 本文字数:907 字

    阅读完需:约 3 分钟

大小:366.02K时长:02:04
Mooncake 正式开源!阿里云与清华大学共建AI大模型推理项目,加速大模型推理技术发展

2024 年 6 月,国内优质大模型应用月之暗面 Kimi 与清华大学 MADSys 实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。通过使用以 KVCache 为中心的 PD 分离和以存换算架构,大幅提升大模型应用 Kimi 智能助手推理吞吐的同时有效降低了推理成本,自发布以来受到业界广泛关注。近日,清华大学和研究组织 9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。希望更多的厂商与开发者共建高性能推理框架底层基础设施的开源生态。

Mooncake架构图


基于和清华大学之间的创新研究计划(AIR)项目,阿里云和清华大学共同探讨如何在实际工业界应用大模型资源池化技术,并做出了诸多技术成果积累。其中,为了加速大模型推理技术的发展,特别是推理实例共享的缓存池化层的标准化,阿里云与清华大学深度共建 Mooncake 项目,结合主流大模型推理框架,抽象缓存池化层的底层接口,实现高效分布式资源解耦架构。针对大模型场景进行深度优化,帮助提升大模型超长上下文的推理性能。

 

作为 AI 基础设施服务商,阿里云在 Mooncake 项目中,向传输引擎(Transfer Engine)、点对点存储(P2P Store)和高性能内存存储等关键组件贡献了代码。在推理框架层面,完成了与广泛使用的大模型推理框架 vLLM 的适配,大幅提升了推理性能,并为其他大模型推理框架的对接适配提供了参考实现,推动了大模型资源池化技术在业界的落地。在 Transfer Engine 层面,提供阿里云自研 eRDMA 网络的底层传输路径,并计划提供对于 CXL 的支持,保证用户能够在云上快速规模化部署。

 

清华大学 MADSys 实验室章明星教授表示,通过 Mooncake 可以充分利用 AI Infra 中的 CPU、内存和 SSD 资源,提升推理请求的处理速度,借助资源解耦架构来使能不同推理实例间的缓存共享,减少资源浪费。此次联合阿里云一起将 Mooncake 项目开源,希望能够协同产学研力量共建开源社区,推动当下大模型推理系统的快速发展。

 

未来,阿里云会更深层次的参与 Mooncake 项目的共建,携手更多企业、机构、高校力量,持续探索更加高效和先进的模型推理系统架构创新,让大模型技术真正惠及千行百业。


Mooncake 项目开源地址:

https://github.com/kvcache-ai/mooncake

2024-11-28 09:5816948

评论 1 条评论

发布
用户头像
https://github.com/kvcache-ai/Mooncake 这上面没有代码,代码放在哪里了
2024-11-22 20:15 · 中国香港
回复
没有更多了
发现更多内容

用友与泰安市政府战略签约,打造数据产业合作新模式

用友BIP

智能体 数智化 用友BIP 数据产业合作

“北京小茅台”华都酒业携手用友,开启数智营销新纪元

用友BIP

AI 智能体 用友BIP 数智营销

【Redis技术进阶之路】「原理分析系列开篇」揭秘高效存储模型与数据结构底层实现(SDS)

码界西柚

redis Redis 核心技术与实战 底层原理 数据库· redis 底层原理

直播精彩回顾 | DeepSeek驱动可观测性变革,解锁运维与AI融合新玩法

博睿数据

阿里妈妈基于 Flink+Paimon 的 Lakehouse 应用实践

Apache Flink

大数据 实时计算 流式数仓 Apache Flink Apache Paimon

提示词工程——AI应用必不可少的技术

不在线第一只蜗牛

人工智能 深度学习

从思考,到行动:由Manus爆火谈AI Agent

脑极体

AI

3FS系列(一):存储新纪元的开篇——3FS编译调优与部署的工程实践

九章云极DataCanvas

人工智能 DeepSeek 3FS

换了个图床,以后就用这个了

程序员郭顺发

华为开发者空间:基于DeepSeek+Cherry Studio构建模拟面试助手

华为云开发者联盟

人工智能 云主机 大模型 DeepSeek

现代数据栈:秽土重生?——从 SAP x Databricks 看数据世界的轮回

tapdata

数据孤岛 现代数据栈 仓库原生 统一数据 SAP Databricks

YDS重磅发布,用友BIP让开发者成就“十倍效能工程师”

用友BIP

AI 开发者 数智化 用友BIP YDS

出海行动派 | 全球服务新征程!Bonree ONE海外版正式发布

博睿数据

出海企业 可观测性平台

AI与人类合作:未来工作中最重要的技能是什么?

天津汇柏科技有限公司

人工智能 AI

【Redis技术进阶之路】「底层源码解析」揭秘高效存储模型与数据结构底层实现(链表)

码界西柚

数据库 redis Redis 核心技术与实战 redis 底层原理 挖掘底层原理

网站域名解析怎么更换DNS服务器?需要注意什么?

防火墙后吃泡面

出海行动派 | 全球服务新征程!Bonree ONE海外版正式发布

博睿数据

2025年,从全栈开发到低代码的生存博弈

秃头小帅oi

用友BIP,给软件插上AI翅膀,做实业务创新

用友BIP

智能体 ERP 数智化 用友BIP 业务创新

YashanDB SWAP表空间管理

YashanDB

数据库 yashandb

淘宝API接口实战指南:如何用技术打开淘宝商品详情商品评论数据?(附真实代码)

代码忍者

淘宝API接口

点对点专线有什么优势?适合跨国企业使用吗?

Ogcloud

专线网络 跨国网络 跨国网络专线 网络专线 点对点专线

如何让你的应用在市场中脱颖而出?

HarmonyOS SDK

harmoyos

Mooncake 正式开源!阿里云与清华大学共建AI大模型推理项目,加速大模型推理技术发展_生成式 AI_凌敏_InfoQ精选文章