50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

  • 2025-09-28
    北京
  • 本文字数:1467 字

    阅读完需:约 5 分钟

大小:793.70K时长:04:30
AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


阿里巴巴算法工程师赵鹏已确认出席并发表题为AI Coding 全新范式:NES 模型的推理、训练与评测实践的主题分享。当前 AI 编程领域正迎来重大变革,传统的 FIM(填充中间)模式已无法满足开发者对复杂编辑操作的需求,AI 编程助手亟需从单一续写能力升级为支持增、删、改全面操作的 NES(下一代编辑与抑制)模型。本次演讲将系统介绍团队如何通过“全文重写”方案实现 NES 能力,并突破高性能推理、训练数据构建与模型优化等关键技术难题。本次将重点分享 SP Edit 推理方案如何实现 1000+tokens/s 的生成速度,以及如何融合静态代码与动态日志数据构建训练集。此外,针对训练中遇到的回滚、能力冲突等典型问题,提出基于 DPO 和 SFT 的优化策略。最后,通过 IDE 回放与 LLM 评测相结合的评估体系,验证 NES 模型的实际效果,并展望其与 Agent 协同工作的未来方向。


赵鹏,阿里巴巴算法工程师。主要研究 AI Coding 方向,目前负责阿里巴巴 Aone Copilot 代码智能化项目的算法工作,主导代码补全与 NES(Next Edit Suggestions)模型的全链路研发,包括场景探索、应用落地、模型训练、数据构建、评测与部署。模型服务上万阿里集团用户,在实际业务中取得显著效果。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景与模型演进

  • AI Coding 需求升级:从 FIM 到 NES

  • FIM 与 NES 的效果对比与案例展示

  • 单行补全与 NES 的冲突与融合

  • NES 模型的输入输出设计与 IDE 协作方式

2. 推理方案与性能优化

  • 全文重写 vs. 定点编辑的权衡

  • sp edit 推理方式与性能优化(1000 token/s)

  • 效果对比与落地案例

3. 数据构建与迭代

  • 单行补全扩充方案

  • 基于 PR 的数据构建方式

  • 日志驱动的动态数据收集

4. 模型训练与优化实践

  • SFT 提升 NES 基础能力

  • DPO 针对 bad case 的优化策略

  • GRPO 规则设计与能力扩展

5. 评测与反馈机制

  • IDE 回放策略与真实场景评测

  • EM 强对比与 LLM 评测结合

6. 未来展望

  • NES 与 Agent 的竞争与合作

  • Agent + NES 的 AI Coding 最佳实践


您认为,这样的技术在实践过程中有哪些痛点?

  • 数据构建成本高

  • 模型输出样式冗余度高

  • 跨文件编辑能力不足


演讲亮点

  • 相较于单行和 NES 共存方案,此方案复杂度和灵活性更高

  • 相较于位点预测 + 区域修改,我们推理能支持全文重写,同时通过 Special Token 设计可以控制模型输入输出时间


听众收益

  • NES 成熟实现方案,完整设计思路

  • 行业的新动向


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-28 13:002

评论

发布
暂无评论

【等保知识】十个等保常见问题解答汇总

行云管家

网络安全 信息安全 等级保护 过等保 数据审计

2021年互联网大厂Java笔经,Java程序员如何有效提升学习效率

Java 面试 后端

如何画UML,几种简单的模型分析

编程 架构 面试 后端

2021年冲刺年薪40w,Java从基础到高级知识点汇总

Java 面试 后端

2021年Java技术下半场在哪,35岁技术人如何转型做管理

Java 面试 后端

2021年互联网大厂Java笔经,Java重点知识大全

Java 面试 后端

2021年一起努力应对互联网寒冬吧,Java程序员面试笔试宝典答案

Java 面试 后端

2021年互联网大厂Java笔经,Java自学宝典电子书下载

Java 面试 后端

Android音频架构| 社区征文

轻口味

android 音视频 新春征文

Github上线仅六天,收获Star超55K+,这套笔记足够你拿下90%以上的Java面试!

Java 架构 面试 后端 计算机

代码检查规则背景及总体介绍

百度开发者中心

最佳实践 代码规则

2021年Java者未来的出路在哪里,让人抓狂的Nginx性能调优

Java 面试 后端

2021年Java高级面试题总结,2021最新大厂高频微服务面试总结

Java 面试 后端

2021年京东Java岗面试必问,我在华为做Java外包的真实经历

Java 面试 后端

设计 | ClickHouse 分布式表实现数据同步

RadonDB

数据库 Clickhouse

2021年Android程序员职业规划,阿里P7大牛亲自讲解

android 面试 移动开发

2021年Java笔试题总,教你抓住面试的重点

Java 面试 后端

2021年Java面经分享,别再说你不会JVM性能监控和调优了

Java 面试 后端

2021年Java面试心得,整理出这份8万字Java性能优化实战解析

Java 面试 后端

2021年Android网络编程总结篇,retrofit面试

android 面试 移动开发

2021年Java网络编程总结篇,红黑树详细分析(图文详解)

Java 面试 后端

2021年Java者未来的出路在哪里,Java开发校招面试题

Java 面试 后端

IT运维和自动化运维以及运维开发有啥不同?能解释下吗?

行云管家

互联网 运维 IT运维 自动化运维 云运维

2021年一起努力应对互联网寒冬吧,字节跳动Java高级工程师

Java 面试 后端

2021年你与字节跳动只差这份笔记,大神码了2000页Spring全家桶笔记

Java 面试 后端

2021年Java开发者常见面试题,初级Java面试题及答案

Java 面试 后端

2021年Android笔试题总,详解Android架构进阶面试题

android 面试 移动开发

2021年Java程序员职业规划,华为Java面试题目

Java 面试 后端

2021年Java面经分享,程序员必备技能:时间复杂度与空间复杂度的计算

Java 面试 后端

谁是中国最受赞赏的创投机构?

创业邦

阿里巴巴首发:Java核心框架指导手册,1小时点击量破千万!

Java 程序员 架构 面试 计算机

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章