写点什么

遍历 100 篇核心文献,北大这篇综述全景解析「代码智能体」技术演进

  • 2025-09-19
    北京
  • 本文字数:2071 字

    阅读完需:约 7 分钟

大小:216.36K时长:01:13
遍历100篇核心文献,北大这篇综述全景解析「代码智能体」技术演进

近年来,基于大语言模型(LLM)的代码生成技术迅速发展,正逐步改变软件开发的实践方式。然而,尽管 LLM 在生成独立代码片段方面表现出色,其在处理复杂、工程化开发任务时仍存在显著局限——缺乏任务的自主分解能力、与真实开发环境的交互能力、对生成的代码进行验证以及持续的自我修正机制。

 

为解决这些问题,基于 LLM 的代码生成智能体(Code Generation Agent)被提出,其以 LLM 作为“大脑”,通过构建自主规划、行动、观察与迭代优化的能力,模拟人类程序员“分析需求、编写代码、运行测试、修复错误”的完整工作流,从而处理远超单个大语言模型能力范围的复杂编码任务。


当前,AI Agent 技术正迎来商业应用的关键阶段,成为 AI 驱动软件开发领域最受瞩目的方向之一。北京大学李戈教授团队近期发表的《基于大语言模型智能体的代码生成综述》,基于对 100 篇高质量核心文献的分析与总结,系统梳理了代码生成智能体的核心进展、关键技术和未来发展趋势,为该领域的学术研究与工程实践提供了兼具深度和广度的产研视角。



论文下载地址:https://arxiv.org/abs/2508.00083

 

论文通讯作者:北京大学计算机学院长聘教授、教育部长江学者李戈。

第一作者:董益宏,北京大学计算机学院 22 级博士生,曾在 ISSTA、FSE、ACL、NeurIPS、TOSEM 等 CCF-A 类/SCI 一区国际顶级会议和期刊上发表十余篇学术论文。

代码智能体和以往代码生成技术有何区别?

 

《综述》指出,AI 在软件开发中的角色,正从一个“辅助性的帮手”,进化为一个“能独立思考和行动的伙伴”。



代码生成智能体与之前的技术相比,展现出三大核心区别:


  • 自主性:从被动补全到主动闭环:传统代码生成模型多以代码补全/函数生成等方式被动辅助开发;代码生成智能体则能像人类开发者一样,主动管理并执行从需求到实现的开发工作流。这使得开发者角色相应从“代码编写者”转为“任务定义者、过程监督者与成果审查者”。


  • 任务范围的广泛性:从代码片段到软件开发全周期:以往研究聚焦于边界清晰的局部任务,如根据上下文补全代码行;代码智能体则扩展到处理模糊需求、项目级编码实现、测试与重构、基于实时反馈的迭代优化等,覆盖软件开发的大部分任务,更贴近真实软件工程场景。


  • 工程实践性增强:从算法精度到系统工程:早期研究关注提升模型的算法精度;如今代码智能体重心显著转向工程可靠性、复杂工作流管理与高效工具编排等问题,研究边界由“模型生成”扩展至系统设计、过程管理与人机协同等更贴近经典软件工程的范畴。

单智能体和多智能体核心技术全景解析

 

具备上述特征的代码智能体在技术上是如何实现的呢?《综述》分为两大类进行叙述:单智能体代码生成方法和多智能体代码生成系统。

单智能体代码生成关键技术

 

单智能体如何处理复杂开发任务?其三大核心技术是:


  • 规划与推理技术:“先规划,后实现”范式,在生成具体代码前,先输出高层次的求解步骤,有效分解复杂任务。


  • 工具集成与检索增强:集成编译器、网络搜索、静态分析器等外部工具,或利用 RAG 技术从代码库中检索相关信息,扩展模型能力边界。


  • 反思与自改进:模拟人类编程中“生成—评估—修改”的过程进行自主迭代优化,实现代码质量的持续提升。

 


相关的代表性研究工作和演进路径如下图:


多智能体代码生成关键技术

 

多智能体系统的核心在于设计高效的协作机制。例如:安排代码生成智能体系统中的工作流、实现智能体之间高效的信息交互与管理,以及通过协同优化将多个智能体转化为一个能力更强的整体系统,从而解决远比单个智能体所能处理的更大、更复杂的软件工程任务。



相关代表性研究如下图所示:


应用场景广泛,关键挑战也不容忽视


当前,代码生成智能体正深度渗透软件开发的全生命周期,在自动化代码生成与实现、自动化调试与程序修复、自动化测试代码生成、自动化代码重构与优化、自动化需求澄清等多个关键环节发挥作用,显著提升软件开发效率与质量。



多智能体代码生成工具已从技术概念走向产业落地,且清晰地呈现出“编程助手→协同伙伴→自主开发团队”的进阶演进趋势。

 

尽管应用前景广阔,但《综述》同样指出了当前代码智能体所面临的严峻挑战。


新一代软件开发范式——“人→智能体→结果”

 

基于大模型的代码生成智能体,其意义远不止于提升编码效率,它正深刻地变革软件开发范式。《综述》在最后展望了这一新兴领域未来的长期核心研究方向。


目前,我们仍处于“人+智能体→软件”的协作范式中。在此模式下,人类开发者保留核心主导地位,利用智能体加速编码、调试与维护等环节。

 

但未来,一个全新的“人→智能体→结果”范式正在演进而来。在这个新范式下,智能体系统本身成为了封装整个问题解决流程的“即时软件服务”。人类开发者的角色从软件的“构建者”,上升为最终结果的“提供者”,人只需在更高的抽象层次上描述意图,而智能体系统则会自主地完成从即时编码、执行到交付最终成果的全过程。

 

这无疑对智能体系统的自主性、可靠性和端到端任务完成能力提出了前所未有的要求。但正如文中所展望的:随着这些挑战的逐步攻克,代码生成智能体将从根本上重塑软件工程的面貌,将开发者从繁琐的编码工作中解放出来,更专注于创造性的问题定义与系统设计。

2025-09-19 17:318370
用户头像
李冬梅 加V:busulishang4668

发布了 1193 篇内容, 共 816.8 次阅读, 收获喜欢 1305 次。

关注

评论

发布
暂无评论

镜舟科技2024年度回顾,坚持长期价值,进一步实现商业突破

镜舟科技

开源 数据分析 StarRocks 镜舟科技

镜舟科技荣登《2024 中国大数据产业年度「国产化」优秀代表厂商》榜单!

镜舟科技

开源 数据分析 分析型数据库 StarRocks 湖仓

25年你还不知道什么是云管平台吗?来这里看看!

行云管家

云计算 云服务 云管平台

AI技术在英语学习中的应用

北京木奇移动技术有限公司

英语学习 AI技术 软件外包公司

智慧党建系统(源码+文档+部署+讲解)

深圳亥时科技

京东JD商品详情原数据API接口的开发、运用与收益

科普小能手

数据挖掘 数据分析 电商 京东 API 接口

数造科技荣获2024年“年度数据资源创新开发企业”

数造万象

数据 数据治理 数据开发 政府积极推进 科技

一位海外开发者的 OpenSPG KAG 实践分享

可信AI进展

知识图谱 大模型 rag RAG搭建

AI技术在评估英语学习的应用

北京木奇移动技术有限公司

AI技术 AI教育 软件外包公司

商机信息平台(源码+文档+部署+讲解)

深圳亥时科技

京东商品视频数据接口(JD.item_video)丨京东API接口指南

tbapi

京东API接口 京东商品视频接口

AI技术在英语发音纠正中的应用

北京木奇移动技术有限公司

英语学习 AI技术 软件外包公司

谷云科技iPaaS V7.0+企业级AI Agent产品全新发布

谷云科技RestCloud

API 数据集成 ipaas AIAgent

本地(或自下载)浏览器插件 安装指南

京东科技开发者

供应链计划性能优化解决方案-Clickhouse本地Join

京东科技开发者

架构提效的矛盾和矛盾的主要方面

京东科技开发者

鸿蒙NEXT使用request模块实现本地文件上传

威哥爱编程

鸿蒙 HarmonyOS ArkTS HarmonyOS NEXT HarmonyOS5.0

面试必问!项目高频面试题解析

王中阳Go

面试 后端

kookeey功能上新 | 动态线路美国新增51个二级地区

kookeey代理严选

亚马逊 海外直播专线 tiktok直播 跨境电商运营 海外网络连接

警务协同办公系统(源码+文档+部署+讲解)

深圳亥时科技

使用火语言RPA批量创建指纹浏览器

火语言RPA

国家大力推进车联网信息安全体系建设

芯盾时代

车联网 物联网 电动汽车

遍历100篇核心文献,北大这篇综述全景解析「代码智能体」技术演进_生成式 AI_张小倩_InfoQ精选文章