MUSA 开发者大赛丨 GEMM 优化挑战赛火热开启!

  • 2026-01-09
    北京
  • 本文字数:2046 字

    阅读完需:约 7 分钟

MUSA 开发者集结!与摩尔线程算力共振,谁将登顶矩阵乘法的性能巅峰?

国产算力生态的崛起,不仅需要坚实可靠的硬件基座,更呼唤能够彻底释放硬件潜能的极致软件优化能力。

GEMM(通用矩阵乘法),正是衡量软件能力的核心标尺。作为触达 GPU 算力峰值、检验架构效率与存储带宽极限的核心算子,它既是验证硬件潜力与软件栈成熟度的试金石,也是每一位追求极致的开发者渴望征服的“性能圣杯”。

此刻,我们诚邀所有心怀极致追求的开发者,共同开启这场极限挑战——基于摩尔线程训推一体全功能智算卡 MTT S4000,在 MUSA 架构 GPU 上深度优化 GEMM,共同挑战 GPU 的性能巅峰。在这里,用你的代码与智慧,亲手将矩阵乘法的性能推向极限!

赛题丨 FP16 GEMM Kernel 极致性能开发

本次挑战赛聚焦于底层 Kernel 开发,要求参赛者在摩尔线程 MTT S4000 上,将 FP16 精度的通用矩阵乘法(GEMM)性能优化到极致。

  • 计算任务:在 MTT S4000 上,实现矩阵乘法(M=8192, N=8192, K=16384)的高性能计算。

  • 精度要求:计算采用 FP16 进行乘加运算,中间累加过程使用 FP32。

  • 硬件架构:所有优化工作须基于 MTT S4000 的硬件特性展开,参赛者需深入研究并充分利用其特性。

  • 优化边界:禁止调用 muBLAS/muDNN 等高层库。鼓励参赛者深挖共享内存分块、寄存器优化等硬件潜力。

评分丨严谨性与高性能的统一

最终比赛结果由主办方统一依据官方评测方案进行综合评定,总分为正确性与性能两部分之和,缺一不可。

1. 正确性测试:不容有失的基石

  • 测试范围:参赛代码必须通过主办方设置的四组不同规模的测试用例验证。

  • 精度要求:计算结果必须严格准确。与官方 muBLAS 库提供的参考结果相比,每个元素的相对误差必须控制在 1e-2 以内。

  • 一票否决:任一测试用例失败,或任一输出元素误差超限,则正确性部分得分为 0,且将直接终止评测,无法进入后续性能评估环节。

2. 性能评估:追求极致的竞技场

  • 评估标准:在通过全部正确性测试后,性能评估将在本次比赛的核心规模——8192 x 8192 x 16384 上展开。系统将进行多次迭代测试,取平均 GFLOPS 作为性能指标。

  • 评分参考:为帮助参赛者了解自身优化水平,我们将根据参赛者代码性能相对于官方 muBLAS 基线性能的百分比效率,进行线性插值计算,提供一个参考性分数。

  • 绝对排名:比赛的最终官方成绩与总排名,严格依据在标准评测环境下测得的绝对 GFLOPS 性能值进行排序。性能越高,排名越前。

  • 自测工具:我们为参赛者提供了性能绝对值测试脚本,参赛者可自行读取并分析 Kernel 的实际性能数据,以便进行针对性优化。

资源丨云端环境与算力支持

摩尔线程将为每一位参赛者提供专业、完备的云端开发环境与算力支持。如下设计致力于最大限度地消除环境差异,确保参赛者自测的性能结果具有高度参考价值,助力大家精准优化。

  • 算力平台:我们将提供本次赛题指定硬件 MTT S4000 的云端算力资源供参赛者调优、测试。

  • 参赛账户:每位参赛者将获得一个专属的 AutoDL 子账号,确保开发环境的独立性与数据安全。

  • 预置镜像:该账号中已内置比赛专用镜像。镜像环境预先配置了所有必要的驱动、工具链,并包含了官方的评估脚本、编译工具及基础示例代码,参赛者登录后即可立即开始开发工作。

  • 标准化工具链:我们提供统一的评测脚本与摩尔线程官方编译器 mcc。参赛者在本地自测时使用的编译命令、优化选项与评测流程,将与最终官方评审环境完全一致。

奖项丨激励卓越,丰厚礼遇

我们为本次大赛的杰出开发者准备了丰厚奖励,以感谢您为探索国产算力性能巅峰付出的智慧与努力。

  • 冠军:大赛前 3 名参赛者,每人将获得 1 台 MTT AIBOOK 算力本。

  • 亚军:大赛第 4 名至第 10 名参赛者,每人将获得 1 张 MTT S80 图形显卡。

  • 专属纪念:大赛前 10 名参赛者,每人还将获得 1 张价值 100 元的 AutoDL 摩尔线程专区算力代金券和 1 个摩尔学院礼盒(内含笔记本、手机支架和徽章各 1 个)

赛程丨敬请关注重要节点

为确保大赛有序进行,请各位开发者关注以下重要时间节点,合理安排您的参赛计划。

 

报名阶段

  • 报名开放:2025 年 12 月 20 日

  • 报名截止:2026 年 1 月 18 日

 

正式比赛与提交

  • 比赛开始:2026 年 1 月 19 日

  • 比赛提交截止:2026 年 2 月 15 日

 

评审与后续

  • 比赛答辩:具体时间将于后续公布,请关注官方通知。

  • 结果公布与颁奖:具体时间将于后续公布,请关注官方通知。

 

请务必在截止日期前完成报名与最终作品提交。期待您的精彩表现!

报名丨开启极致性能挑战之旅

  • 本次比赛为个人能力的终极试炼,仅限单人报名参与。

  • 请有意参赛的开发者前往摩尔学院官方网站进行注册,并填写完整的个人信息,完成报名流程。

答疑丨资料与交流

在准备或参赛过程中,如有任何疑问,您可以通过以下渠道进行咨询与交流。

  • 大赛课程:请前往摩尔学院《MUSA 开发者大赛——GEMM 优化挑战赛》课程页面获取赛事相关资料或参与讨论。

  • 官方比赛微信群:扫码加入,与组委会及其他参赛者即时沟通。

  • 小助手邮箱:发送邮件至 ning.kang@mthreads.com 进行反馈。

 

在 AI 浪潮奔涌向前的时代,每一行极致的优化代码,都在悄然重塑计算性能的边界。

我们已备好硬核的算力装备与竞技舞台,诚邀所有开发者,用智慧与代码,亲手定义全新的性能巅峰。

期待您,写下属于这个时代的性能传奇。