免费注册!6月19-20日,「亚马逊云科技中国峰会」重磅来袭! 了解详情
写点什么

谷歌 DeepMind 发布 AI 编程代理 AlphaEvolve

  • 2025-05-28
    北京
  • 本文字数:975 字

    阅读完需:约 3 分钟

大小:522.75K时长:02:58
谷歌 DeepMind 发布 AI 编程代理 AlphaEvolve

谷歌 DeepMind 发表论文,正式发布其 AI 编程代理 AlphaEvolve。该代理利用大语言模型在硬件设计、数据中心运营和 AI 训练等多个领域实现算法发现与优化。

 

AlphaEvolve 采用多模型协同架构(包括 Gemini FlashGemini Pro),通过生成并迭代程序来解决用户定义的问题,也就是说用户需预先设定一系列返回标量指标的评估函数。谷歌已在数学、工程和计算机科学领域的多个问题上成功应用该技术,例如发现更高效的 4x4 矩阵乘法算法。在数学领域的 50 多个测试问题中,该系统不仅重现了 75% 现有最优解,更在 20% 的问题上找到了更优方案。谷歌表示:


虽然当前应用集中于数学和计算领域,但 AlphaEvolve 的通用性使其可应用于任何能用算法描述且可自动验证的问题。我们相信 AlphaEvolve 将在材料科学、药物研发、可持续发展等更广泛的技术与商业领域产生变革性影响。

 

AlphaEvolve 的核心机制是通过大语言模型实现代码生成与进化。系统会维护候选程序数据库,将其与程序进化指令共同作为大语言模型的上下文输入。经评估表现优异的程序会被存入数据库,循环迭代直至找到最优解。


AlphaEvolve 架构图。图源:AlphaEvolve 白皮书

 

除解决数学问题外,谷歌已将 AlphaEvolve 应用于数据中心优化:其开发的启发式函数被用于谷歌的 Borg 任务调度系统,该方案优于此前深度强化学习的成果,帮助谷歌将其全球计算资源的利用率提升 0.7%。在 AI 训练领域,AlphaEvolve 还优化了内核分块和 FlashAttention 操作,分别实现 23% 和 32% 的速度提升。

 

Hacker News 社区用户对 AlphaEvolve 普遍持积极态度,并提及谷歌的 AI 研发历史:


人们常常忽略 Mu Zero 才是谷歌这十年最重要的 AI 论文,在我看来,这篇论文揭示了模型是如何自主习得搜索能力的,其意义甚至超越 Transformer 论文。

 

牛津大学 AI 研究员 Simon Frieder 在 X 上指出 DeepMind 存在代码开源不彻底的问题:

尽管科学价值突出,但 DeepMind 的完整代码公开记录存在瑕疵:AlphaFold2 未发布训练脚本,AlphaGeometry 存在漏洞。二者最终都催生了开源替代方案(OpenFoldNewclid)……鉴于此,AlphaEvolve 可能藏有未公开的缺陷,这会影响其结果的可靠性。虽然部分输出容易验证,但并非所有情况都适用。需注意这与大语言模型幻觉不同,因为 AlphaEvolve 是依赖自动评估机制的。

 

目前该模型虽未公开,但学术研究者可申请 AlphaEvolve 的早期访问权限

2025-05-28 18:001

评论

发布
暂无评论
谷歌 DeepMind 发布 AI 编程代理 AlphaEvolve_AI&大模型_Anthony Alford_InfoQ精选文章