MUSA 开发者集结!与摩尔线程算力共振,谁将登顶矩阵乘法的性能巅峰?
国产算力生态的崛起,不仅需要坚实可靠的硬件基座,更呼唤能够彻底释放硬件潜能的极致软件优化能力。
GEMM(通用矩阵乘法),正是衡量软件能力的核心标尺。作为触达 GPU 算力峰值、检验架构效率与存储带宽极限的核心算子,它既是验证硬件潜力与软件栈成熟度的试金石,也是每一位追求极致的开发者渴望征服的“性能圣杯”。
此刻,我们诚邀所有心怀极致追求的开发者,共同开启这场极限挑战——基于摩尔线程训推一体全功能智算卡 MTT S4000,在 MUSA 架构 GPU 上深度优化 GEMM,共同挑战 GPU 的性能巅峰。在这里,用你的代码与智慧,亲手将矩阵乘法的性能推向极限!
赛题丨 FP16 GEMM Kernel 极致性能开发
本次挑战赛聚焦于底层 Kernel 开发,要求参赛者在摩尔线程 MTT S4000 上,将 FP16 精度的通用矩阵乘法(GEMM)性能优化到极致。
计算任务:在 MTT S4000 上,实现矩阵乘法(M=8192, N=8192, K=16384)的高性能计算。
精度要求:计算采用 FP16 进行乘加运算,中间累加过程使用 FP32。
硬件架构:所有优化工作须基于 MTT S4000 的硬件特性展开,参赛者需深入研究并充分利用其特性。
优化边界:禁止调用 muBLAS/muDNN 等高层库。鼓励参赛者深挖共享内存分块、寄存器优化等硬件潜力。
评分丨严谨性与高性能的统一
最终比赛结果由主办方统一依据官方评测方案进行综合评定,总分为正确性与性能两部分之和,缺一不可。
1. 正确性测试:不容有失的基石
测试范围:参赛代码必须通过主办方设置的四组不同规模的测试用例验证。
精度要求:计算结果必须严格准确。与官方 muBLAS 库提供的参考结果相比,每个元素的相对误差必须控制在 1e-2 以内。
一票否决:任一测试用例失败,或任一输出元素误差超限,则正确性部分得分为 0,且将直接终止评测,无法进入后续性能评估环节。
2. 性能评估:追求极致的竞技场
评估标准:在通过全部正确性测试后,性能评估将在本次比赛的核心规模——8192 x 8192 x 16384 上展开。系统将进行多次迭代测试,取平均 GFLOPS 作为性能指标。
评分参考:为帮助参赛者了解自身优化水平,我们将根据参赛者代码性能相对于官方 muBLAS 基线性能的百分比效率,进行线性插值计算,提供一个参考性分数。
绝对排名:比赛的最终官方成绩与总排名,严格依据在标准评测环境下测得的绝对 GFLOPS 性能值进行排序。性能越高,排名越前。
自测工具:我们为参赛者提供了性能绝对值测试脚本,参赛者可自行读取并分析 Kernel 的实际性能数据,以便进行针对性优化。
资源丨云端环境与算力支持
摩尔线程将为每一位参赛者提供专业、完备的云端开发环境与算力支持。如下设计致力于最大限度地消除环境差异,确保参赛者自测的性能结果具有高度参考价值,助力大家精准优化。
算力平台:我们将提供本次赛题指定硬件 MTT S4000 的云端算力资源供参赛者调优、测试。
参赛账户:每位参赛者将获得一个专属的 AutoDL 子账号,确保开发环境的独立性与数据安全。
预置镜像:该账号中已内置比赛专用镜像。镜像环境预先配置了所有必要的驱动、工具链,并包含了官方的评估脚本、编译工具及基础示例代码,参赛者登录后即可立即开始开发工作。
标准化工具链:我们提供统一的评测脚本与摩尔线程官方编译器 mcc。参赛者在本地自测时使用的编译命令、优化选项与评测流程,将与最终官方评审环境完全一致。
奖项丨激励卓越,丰厚礼遇
我们为本次大赛的杰出开发者准备了丰厚奖励,以感谢您为探索国产算力性能巅峰付出的智慧与努力。
冠军:大赛前 3 名参赛者,每人将获得 1 台 MTT AIBOOK 算力本。
亚军:大赛第 4 名至第 10 名参赛者,每人将获得 1 张 MTT S80 图形显卡。
专属纪念:大赛前 10 名参赛者,每人还将获得 1 张价值 100 元的 AutoDL 摩尔线程专区算力代金券和 1 个摩尔学院礼盒(内含笔记本、手机支架和徽章各 1 个)
赛程丨敬请关注重要节点
为确保大赛有序进行,请各位开发者关注以下重要时间节点,合理安排您的参赛计划。
报名阶段
报名开放:2025 年 12 月 20 日
报名截止:2026 年 1 月 18 日
正式比赛与提交
比赛开始:2026 年 1 月 19 日
比赛提交截止:2026 年 2 月 15 日
评审与后续
比赛答辩:具体时间将于后续公布,请关注官方通知。
结果公布与颁奖:具体时间将于后续公布,请关注官方通知。
请务必在截止日期前完成报名与最终作品提交。期待您的精彩表现!
报名丨开启极致性能挑战之旅
本次比赛为个人能力的终极试炼,仅限单人报名参与。
请有意参赛的开发者前往摩尔学院官方网站进行注册,并填写完整的个人信息,完成报名流程。

答疑丨资料与交流
在准备或参赛过程中,如有任何疑问,您可以通过以下渠道进行咨询与交流。
大赛课程:请前往摩尔学院《MUSA 开发者大赛——GEMM 优化挑战赛》课程页面获取赛事相关资料或参与讨论。

官方比赛微信群:扫码加入,与组委会及其他参赛者即时沟通。

小助手邮箱:发送邮件至 ning.kang@mthreads.com 进行反馈。
在 AI 浪潮奔涌向前的时代,每一行极致的优化代码,都在悄然重塑计算性能的边界。
我们已备好硬核的算力装备与竞技舞台,诚邀所有开发者,用智慧与代码,亲手定义全新的性能巅峰。
期待您,写下属于这个时代的性能传奇。





