写点什么

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

  • 2025-09-28
    北京
  • 本文字数:1467 字

    阅读完需:约 5 分钟

大小:793.70K时长:04:30
AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


阿里巴巴算法工程师赵鹏已确认出席并发表题为AI Coding 全新范式:NES 模型的推理、训练与评测实践的主题分享。当前 AI 编程领域正迎来重大变革,传统的 FIM(填充中间)模式已无法满足开发者对复杂编辑操作的需求,AI 编程助手亟需从单一续写能力升级为支持增、删、改全面操作的 NES(下一代编辑与抑制)模型。本次演讲将系统介绍团队如何通过“全文重写”方案实现 NES 能力,并突破高性能推理、训练数据构建与模型优化等关键技术难题。本次将重点分享 SP Edit 推理方案如何实现 1000+tokens/s 的生成速度,以及如何融合静态代码与动态日志数据构建训练集。此外,针对训练中遇到的回滚、能力冲突等典型问题,提出基于 DPO 和 SFT 的优化策略。最后,通过 IDE 回放与 LLM 评测相结合的评估体系,验证 NES 模型的实际效果,并展望其与 Agent 协同工作的未来方向。


赵鹏,阿里巴巴算法工程师。主要研究 AI Coding 方向,目前负责阿里巴巴 Aone Copilot 代码智能化项目的算法工作,主导代码补全与 NES(Next Edit Suggestions)模型的全链路研发,包括场景探索、应用落地、模型训练、数据构建、评测与部署。模型服务上万阿里集团用户,在实际业务中取得显著效果。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景与模型演进

  • AI Coding 需求升级:从 FIM 到 NES

  • FIM 与 NES 的效果对比与案例展示

  • 单行补全与 NES 的冲突与融合

  • NES 模型的输入输出设计与 IDE 协作方式

2. 推理方案与性能优化

  • 全文重写 vs. 定点编辑的权衡

  • sp edit 推理方式与性能优化(1000 token/s)

  • 效果对比与落地案例

3. 数据构建与迭代

  • 单行补全扩充方案

  • 基于 PR 的数据构建方式

  • 日志驱动的动态数据收集

4. 模型训练与优化实践

  • SFT 提升 NES 基础能力

  • DPO 针对 bad case 的优化策略

  • GRPO 规则设计与能力扩展

5. 评测与反馈机制

  • IDE 回放策略与真实场景评测

  • EM 强对比与 LLM 评测结合

6. 未来展望

  • NES 与 Agent 的竞争与合作

  • Agent + NES 的 AI Coding 最佳实践


您认为,这样的技术在实践过程中有哪些痛点?

  • 数据构建成本高

  • 模型输出样式冗余度高

  • 跨文件编辑能力不足


演讲亮点

  • 相较于单行和 NES 共存方案,此方案复杂度和灵活性更高

  • 相较于位点预测 + 区域修改,我们推理能支持全文重写,同时通过 Special Token 设计可以控制模型输入输出时间


听众收益

  • NES 成熟实现方案,完整设计思路

  • 行业的新动向


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-28 13:004044

评论

发布
暂无评论

A路径 VS B路径:先攻新加坡还是直取美国?中国科技出海的生死选择题

白鲸开源

开源 DataOps 出海 商业化 白鲸开源

人工智能AI在数字化转型有哪些应用?

优秀

人工智能 AI 数字化转型

Web前端入门:JavaScript 循环结构注意事项

不在线第一只蜗牛

前端

5月 | 塞讯模拟攻击库更新汇总

塞讯科技

网络安全

NetTrace 工具介绍

天翼云开发者社区

网络

高德发布智能眼镜解决方案| 携手AR领军企业,引领智慧出行新未来

高德开放平台

AI AR loT 高德地图 AR眼镜

Java后台实现微信小程序不同人员生成不同小程序码并追踪扫码来源

电子尖叫食人鱼

Java 微信小程序

ToDesk优惠码是什么,如何使用?

小喵子

优惠券 远程控制 ToDesk todesk、

零风险操作!DolphinScheduler高可用架构下的无损扩缩容指南

白鲸开源

开源 运维 Apache DolphinScheduler 扩缩容 任务调度平台

上新功能!通义灵码行间建议预测 NES 使用方法

阿里巴巴云原生

阿里云 通义灵码

全维度测试通过!DolphinScheduler 3.2.0单节点部署与验证实录

白鲸开源

大数据 开源 性能测试 Apache DolphinScheduler 工作流任务调度

多源多表写入、数据格式增强,SeaTunnel 2.3.11 重磅更新来了!

白鲸开源

大数据 开源 数据同步 Apache SeaTunnel 版本发布

社区答疑明星招募令 | 成为SeaTunnel社群“技术担当”,我们等你来!

白鲸开源

开源社区 数据集成 Apache SeaTunnel 开源活动

Web3的成功离不开什么?

PowerVerse

去中心化 云算力 web3 #区块链

昆仑万维天工超级智能体APP上线后爆火!全球首款Office智能体APP,开启AI办公新时代

新消费日报

DNS攻击类型有哪些?如何应对DNS攻击威胁?

防火墙后吃泡面

全球科技巨头云集,展现AI前沿成果|2025深圳人工智能展

AIOTE智博会

高交会 高新技术展 深圳高交会

一种更简单的方式运行 C# 代码,简化 C# 开发体验!

不在线第一只蜗牛

C#

小白也能轻松上手:ToDesk、Parsec、AnyDesk、TeamViewer 哪款远程软件最适合新手?

小喵子

远程

如何通过ETLCloud实现跨系统数据同步?

谷云科技RestCloud

MySQL 数据库 数据同步 ETL 数据集成

Vue3组件通信全攻略:多种方式详解+实战场景,轻松玩转复杂数据流!

量贩潮汐·WholesaleTide

JavaScript Vue 3

上新功能!通义灵码行间建议预测 NES 使用方法

阿里云云效

阿里云 通义灵码

前端热更新:无声引擎驱动中国互联网数字化转型

xuyinyin

远控安全进阶之战:TeamViewer/ToDesk/向日葵设备安全策略对比

小喵子

安全 远程办公 远程控制 ToDesk

百度网盘位列AI产品榜APP第一,AI激活网盘内容管理、消费新增量

极客天地

使用 Run:ai Model Streamer 实现模型的高效加载

Se7en

超实用!Dify调用Java的3种实现方式!

王磊

高并发下如何防止商品超卖?

量贩潮汐·WholesaleTide

高并发

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章