50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

遍历 100 篇核心文献,北大这篇综述全景解析「代码智能体」技术演进

  • 2025-09-19
    北京
  • 本文字数:2071 字

    阅读完需:约 7 分钟

大小:216.36K时长:01:13
遍历100篇核心文献,北大这篇综述全景解析「代码智能体」技术演进

近年来,基于大语言模型(LLM)的代码生成技术迅速发展,正逐步改变软件开发的实践方式。然而,尽管 LLM 在生成独立代码片段方面表现出色,其在处理复杂、工程化开发任务时仍存在显著局限——缺乏任务的自主分解能力、与真实开发环境的交互能力、对生成的代码进行验证以及持续的自我修正机制。

 

为解决这些问题,基于 LLM 的代码生成智能体(Code Generation Agent)被提出,其以 LLM 作为“大脑”,通过构建自主规划、行动、观察与迭代优化的能力,模拟人类程序员“分析需求、编写代码、运行测试、修复错误”的完整工作流,从而处理远超单个大语言模型能力范围的复杂编码任务。


当前,AI Agent 技术正迎来商业应用的关键阶段,成为 AI 驱动软件开发领域最受瞩目的方向之一。北京大学李戈教授团队近期发表的《基于大语言模型智能体的代码生成综述》,基于对 100 篇高质量核心文献的分析与总结,系统梳理了代码生成智能体的核心进展、关键技术和未来发展趋势,为该领域的学术研究与工程实践提供了兼具深度和广度的产研视角。



论文下载地址:https://arxiv.org/abs/2508.00083

 

论文通讯作者:北京大学计算机学院长聘教授、教育部长江学者李戈。

第一作者:董益宏,北京大学计算机学院 22 级博士生,曾在 ISSTA、FSE、ACL、NeurIPS、TOSEM 等 CCF-A 类/SCI 一区国际顶级会议和期刊上发表十余篇学术论文。

代码智能体和以往代码生成技术有何区别?

 

《综述》指出,AI 在软件开发中的角色,正从一个“辅助性的帮手”,进化为一个“能独立思考和行动的伙伴”。



代码生成智能体与之前的技术相比,展现出三大核心区别:


  • 自主性:从被动补全到主动闭环:传统代码生成模型多以代码补全/函数生成等方式被动辅助开发;代码生成智能体则能像人类开发者一样,主动管理并执行从需求到实现的开发工作流。这使得开发者角色相应从“代码编写者”转为“任务定义者、过程监督者与成果审查者”。


  • 任务范围的广泛性:从代码片段到软件开发全周期:以往研究聚焦于边界清晰的局部任务,如根据上下文补全代码行;代码智能体则扩展到处理模糊需求、项目级编码实现、测试与重构、基于实时反馈的迭代优化等,覆盖软件开发的大部分任务,更贴近真实软件工程场景。


  • 工程实践性增强:从算法精度到系统工程:早期研究关注提升模型的算法精度;如今代码智能体重心显著转向工程可靠性、复杂工作流管理与高效工具编排等问题,研究边界由“模型生成”扩展至系统设计、过程管理与人机协同等更贴近经典软件工程的范畴。

单智能体和多智能体核心技术全景解析

 

具备上述特征的代码智能体在技术上是如何实现的呢?《综述》分为两大类进行叙述:单智能体代码生成方法和多智能体代码生成系统。

单智能体代码生成关键技术

 

单智能体如何处理复杂开发任务?其三大核心技术是:


  • 规划与推理技术:“先规划,后实现”范式,在生成具体代码前,先输出高层次的求解步骤,有效分解复杂任务。


  • 工具集成与检索增强:集成编译器、网络搜索、静态分析器等外部工具,或利用 RAG 技术从代码库中检索相关信息,扩展模型能力边界。


  • 反思与自改进:模拟人类编程中“生成—评估—修改”的过程进行自主迭代优化,实现代码质量的持续提升。

 


相关的代表性研究工作和演进路径如下图:


多智能体代码生成关键技术

 

多智能体系统的核心在于设计高效的协作机制。例如:安排代码生成智能体系统中的工作流、实现智能体之间高效的信息交互与管理,以及通过协同优化将多个智能体转化为一个能力更强的整体系统,从而解决远比单个智能体所能处理的更大、更复杂的软件工程任务。



相关代表性研究如下图所示:


应用场景广泛,关键挑战也不容忽视


当前,代码生成智能体正深度渗透软件开发的全生命周期,在自动化代码生成与实现、自动化调试与程序修复、自动化测试代码生成、自动化代码重构与优化、自动化需求澄清等多个关键环节发挥作用,显著提升软件开发效率与质量。



多智能体代码生成工具已从技术概念走向产业落地,且清晰地呈现出“编程助手→协同伙伴→自主开发团队”的进阶演进趋势。

 

尽管应用前景广阔,但《综述》同样指出了当前代码智能体所面临的严峻挑战。


新一代软件开发范式——“人→智能体→结果”

 

基于大模型的代码生成智能体,其意义远不止于提升编码效率,它正深刻地变革软件开发范式。《综述》在最后展望了这一新兴领域未来的长期核心研究方向。


目前,我们仍处于“人+智能体→软件”的协作范式中。在此模式下,人类开发者保留核心主导地位,利用智能体加速编码、调试与维护等环节。

 

但未来,一个全新的“人→智能体→结果”范式正在演进而来。在这个新范式下,智能体系统本身成为了封装整个问题解决流程的“即时软件服务”。人类开发者的角色从软件的“构建者”,上升为最终结果的“提供者”,人只需在更高的抽象层次上描述意图,而智能体系统则会自主地完成从即时编码、执行到交付最终成果的全过程。

 

这无疑对智能体系统的自主性、可靠性和端到端任务完成能力提出了前所未有的要求。但正如文中所展望的:随着这些挑战的逐步攻克,代码生成智能体将从根本上重塑软件工程的面貌,将开发者从繁琐的编码工作中解放出来,更专注于创造性的问题定义与系统设计。

2025-09-19 17:317574
用户头像
李冬梅 加V:busulishang4668

发布了 1170 篇内容, 共 785.3 次阅读, 收获喜欢 1293 次。

关注

评论

发布
暂无评论

618 技术特辑(一)不知不觉超预算3倍,你为何买买买停不下来?

华为云开发者联盟

电商 图数据库 知识图谱 618 图引擎服务

译文 | AI产品经理:如何打造一款SaaS+AI的优质产品

LigaAI

产品经理 研发管理

MySQL中的pid与socket是什么?

Simon

MySQL

校友会小程序开发笔记二:功能需求设计

CC同学

小程序云开发 校友录小程序 校友会小程序

【LeetCode】石子游戏Java题解

Albert

算法 LeetCode 6月日更

JavaScript 学习(三)

空城机

JavaScript 大前端 6月日更

校友会小程序开发笔记四:UI基本元素设计

CC同学

小程序云开发

阿里云视频云 Retina 多媒体 AI 体验馆开张啦!

阿里云CloudImagine

阿里云 短视频 视频处理 媒体处理 视频制作

开发者如何构建技术影响力

不脱发的程序猿

程序人生 开发者如何构建技术影响力 技术影响力

新思科技宣布收购 Code Dx公司 添加软件漏洞关联、优先级和合并风险报告

InfoQ_434670063458

新思科技

针对 MySQL IO 特点进行的存储优化揭秘

焱融科技

MySQL 技术 分布式 高性能 文件存储

可视化协助矿山,打造“高效率运营战略”,年降成本500W

一只数据鲸鱼

数据可视化 工业4.0 智慧矿山

pprof排查Golang服务内存问题

循环智能

pprof 性能分析 Go 语言

谁说双非本就一定无缘阿里!(四年crud经验已拿下P7)面经分享

Java 程序员 架构 面试 计算机

JAVA笔记(三)--变量及运算符

加百利

Java 程序员 后端 6月日更

618 技术特辑(二)几百万人同时下单的秒杀,为什么越来越容易抢到了

华为云开发者联盟

数据库 服务器 流量 618 弹性负载均衡

校友会小程序开发笔记三:数据库设计

CC同学

小程序云开发 校友录小程序 校友会小程序

Bzz节点分币系统开发,云算力矿机租赁系统搭建

5W1H聊开源之Who/When/Where——谁在何时何地“发明”了开源?

禅道项目管理

Linux 开源 软件

公安情报研判分析系统解决方案,合成作战系统搭建

6月26日,HarmonyOS开发者日将于杭州举办

科技汇

🌏【架构师指南】分布式技术知识点总结(上)

码界西柚

分布式 raft协议 paxos协议 6月日更

测试工程师如何收拾交接项目的烂摊子

陈磊@Criss

测试

[译] 规避供应商以及特定版本的 VM Bugs

Antway

6月日更

WebRTC 传输安全机制第二话:深入显出 SRTP 协议

阿里云CloudImagine

音视频 WebRTC 通信 流媒体开发 SRS流媒体服务器

教你两招,解决数据膨胀

华为云开发者联盟

数据 GaussDB(DWS) VACUUM 数据膨胀 FSM

拍乐云受邀2021亚太CDN峰会,技术创新赋能行业新价值

拍乐云Pano

RTC

校友会小程序开发笔记一:背景与技术方案的选型

CC同学

小程序云开发 校友录小程序 校友会小程序

详解 Go 程序的启动流程,你知道 g0,m0 是什么吗?

煎鱼

Java php 后端 Go 语言

凭这份pdf每天花2小时学习,3个月后拿下阿里/美团/京东等offer

Java 程序员 架构 面试

分布式能解决一切问题吗?百度架构师为你解答架构真正奥义!

Java架构师迁哥

遍历100篇核心文献,北大这篇综述全景解析「代码智能体」技术演进_生成式 AI_张小倩_InfoQ精选文章