整理 | 华卫
近日,月之暗面(Moonshot AI)旗下 Kimi 团队发布一篇技术论文,提出全新的“注意力残差”(Attention Residuals)机制,对深度学习领域沿用近十年的传统残差连接架构进行了颠覆性重构。
据论文附录标注信息显示,陈广宇与张宇、苏剑林三人同为同等贡献共同第一作者。其中,张宇是 Kimi 高效模型架构的核心研发人员,苏剑林则是旋转位置编码(RoPE)的提出者。
而排在作者名单首位的陈广宇迅速引发广泛关注,他是来自广东深圳一所国际学校的高三在读生,今年仅 17 岁,预计今年 6 月毕业。值得一提的是,陈广宇真正深耕 AI 领域仅一年时间。去年暑假,他远赴旧金山完成 7 周实习历练,回国后于去年 11 月加入 Kimi 团队参与实习。
面对随之而来的大量关注,陈广宇在朋友圈发文时特意点名三位同等贡献作者,以及负责模型扩展与基础设施搭建的团队同事,称这项工作“缺一不可”。并且,他在回应时多次强调,“不要造神,希望外界少写个人、多写技术和团队,这是大家共同完成的成果。”
Kimi 官方也同样表态,这篇论文是整个团队协作的研究成果。





