阿里大模型创作平台 MuseAI 技术研究和最佳实践_技术洞察_技术趋势_大厂实践



 写点什么

MuseAI 是一款专为设计专业人士量身定制的先进 AI 绘图工具，旨在提供卓越的绘画体验，并为设计团队打造一个既稳定又易于管理的创作平台。本专题将汇总阿里大模型创作平台 MuseAI 相关技术研究和最佳实践。

如何重现 DeepSeek 推理性能突破

DeepSeek-V3 在多个评测中展现出强大性能，成为当前最受关注的开源大模型之一。由于采用了大规模 MoE 架构，如何优化推理性能，是工程落地上的关键难点。

阿里集团智能引擎团队

05-19

4179

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

相比于其他 AI 应用，LLM 的推理阶段最大的特点是它是一个自回归过程，绝大部分推理框架的优化工作都是围绕这个自回归过程展开的。

赵骁勇、刘侃策划: Kitty

04-15

10560

GPU，CPU，谁是谁的“伴侣”？—— 阿里 RTP 平台的异构资源解耦大冒险

本文介绍了阿里 RTP 平台在异构资源解耦方面的探索与实践，详细探讨了 DLRM 模型的特点、部署挑战以及资源分配与利用效率问题，并分享了在 NSDI25 上发表的相关研究成果。

刘侃

04-08

10132

显卡在偷懒？阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率

本文主要分析了平台由于频繁切换 Diffusion Pipeline 引起的用户体验与资源浪费问题，并从网络传输、内存管理、Host-to-Device、模型量化等方面着手优化。

杜健聪，刘侃

01-07

10628

为异构推理做好准备：次世代 RTP-LLM 推理引擎设计分享

由于初版 rtp-LLM 是基于 nvidia 的开源库开发，在设计上和 cuda 硬件强耦合，无法摆脱对 nvidia gpu 的依赖，因而不能支持 cuda 以外的硬件设备，这样的框架显然难以支持未来更加丰富的硬件生态。而在硬件问题之外，随着业务复杂度的增长，越来越多的缺陷也被暴露出来。因此，我们本着以硬件接口为第一公民的思想，重构了 rtp-LLM 的模型推理逻辑。本文将从以下几个方面，结合源代码中的模块介绍 rtp-LLM 在计算部分的的设计思想。

杨熙，刘侃

01-14

5339

开源方案之外的选择：阿里内部为设计打造的 AIGC 生产力平台 MuseAI

MuseAI 是由阿里集团爱橙科技研发的面向阿里内部的 AIGC 创作工作台，同时通过与阿里云旗下魔搭社区合作共建的形式，将主体能力通过魔搭社区的 AIGC 专区对公众开放。本文主要介绍该设计平台的定位、目标和主要功能点，同时介绍了一些阿里内部应用的形式与案例。

陆唯一，刘侃策划: Kitty

04-15

9322

大模型推理新突破：分布式推理技术探索与实践

在大模型的推理过程中，通常可以将任务分为两个阶段：Prefill 阶段处理所有输入的 Token，生成第一个输出 Token，并生成 KVCache。Decode 利用 KVCache 进行多轮迭代，每轮生成一个 Token。Pefill 阶段通常是计算密集型的，Decode 阶段通常是显存带宽瓶颈。本文中，我们阐述了 P-D 分离方案上线的实际效果。

阿里巴巴智能引擎/TRE/高性能网络团队策划: Kitty

04-15

9435

没有更多了

创作场景

阿里大模型创作平台 MuseAI 技术研究和最佳实践

如何重现 DeepSeek 推理性能突破

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

GPU，CPU，谁是谁的“伴侣”？—— 阿里 RTP 平台的异构资源解耦大冒险

显卡在偷懒？阿里大模型创作平台 MuseAI 极速模型切换技术提升 AI 创作效率

为异构推理做好准备：次世代 RTP-LLM 推理引擎设计分享

开源方案之外的选择：阿里内部为设计打造的 AIGC 生产力平台 MuseAI

大模型推理新突破：分布式推理技术探索与实践