AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

  • 2025-09-28
    北京
  • 本文字数:1467 字

    阅读完需:约 5 分钟

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!

10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!

阿里巴巴算法工程师赵鹏已确认出席并发表题为AI Coding 全新范式:NES 模型的推理、训练与评测实践的主题分享。当前 AI 编程领域正迎来重大变革,传统的 FIM(填充中间)模式已无法满足开发者对复杂编辑操作的需求,AI 编程助手亟需从单一续写能力升级为支持增、删、改全面操作的 NES(下一代编辑与抑制)模型。本次演讲将系统介绍团队如何通过“全文重写”方案实现 NES 能力,并突破高性能推理、训练数据构建与模型优化等关键技术难题。本次将重点分享 SP Edit 推理方案如何实现 1000+tokens/s 的生成速度,以及如何融合静态代码与动态日志数据构建训练集。此外,针对训练中遇到的回滚、能力冲突等典型问题,提出基于 DPO 和 SFT 的优化策略。最后,通过 IDE 回放与 LLM 评测相结合的评估体系,验证 NES 模型的实际效果,并展望其与 Agent 协同工作的未来方向。

赵鹏,阿里巴巴算法工程师。主要研究 AI Coding 方向,目前负责阿里巴巴 Aone Copilot 代码智能化项目的算法工作,主导代码补全与 NES(Next Edit Suggestions)模型的全链路研发,包括场景探索、应用落地、模型训练、数据构建、评测与部署。模型服务上万阿里集团用户,在实际业务中取得显著效果。他在本次会议的详细演讲内容如下:

演讲提纲

1. 背景与模型演进

  • AI Coding 需求升级:从 FIM 到 NES

  • FIM 与 NES 的效果对比与案例展示

  • 单行补全与 NES 的冲突与融合

  • NES 模型的输入输出设计与 IDE 协作方式

2. 推理方案与性能优化

  • 全文重写 vs. 定点编辑的权衡

  • sp edit 推理方式与性能优化(1000 token/s)

  • 效果对比与落地案例

3. 数据构建与迭代

  • 单行补全扩充方案

  • 基于 PR 的数据构建方式

  • 日志驱动的动态数据收集

4. 模型训练与优化实践

  • SFT 提升 NES 基础能力

  • DPO 针对 bad case 的优化策略

  • GRPO 规则设计与能力扩展

5. 评测与反馈机制

  • IDE 回放策略与真实场景评测

  • EM 强对比与 LLM 评测结合

6. 未来展望

  • NES 与 Agent 的竞争与合作

  • Agent + NES 的 AI Coding 最佳实践

您认为,这样的技术在实践过程中有哪些痛点?

  • 数据构建成本高

  • 模型输出样式冗余度高

  • 跨文件编辑能力不足

演讲亮点

  • 相较于单行和 NES 共存方案,此方案复杂度和灵活性更高

  • 相较于位点预测 + 区域修改,我们推理能支持全文重写,同时通过 Special Token 设计可以控制模型输入输出时间

听众收益

  • NES 成熟实现方案,完整设计思路

  • 行业的新动向

除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。

现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。