50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

  • 2025-09-28
    北京
  • 本文字数:1467 字

    阅读完需:约 5 分钟

大小:793.70K时长:04:30
AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


阿里巴巴算法工程师赵鹏已确认出席并发表题为AI Coding 全新范式:NES 模型的推理、训练与评测实践的主题分享。当前 AI 编程领域正迎来重大变革,传统的 FIM(填充中间)模式已无法满足开发者对复杂编辑操作的需求,AI 编程助手亟需从单一续写能力升级为支持增、删、改全面操作的 NES(下一代编辑与抑制)模型。本次演讲将系统介绍团队如何通过“全文重写”方案实现 NES 能力,并突破高性能推理、训练数据构建与模型优化等关键技术难题。本次将重点分享 SP Edit 推理方案如何实现 1000+tokens/s 的生成速度,以及如何融合静态代码与动态日志数据构建训练集。此外,针对训练中遇到的回滚、能力冲突等典型问题,提出基于 DPO 和 SFT 的优化策略。最后,通过 IDE 回放与 LLM 评测相结合的评估体系,验证 NES 模型的实际效果,并展望其与 Agent 协同工作的未来方向。


赵鹏,阿里巴巴算法工程师。主要研究 AI Coding 方向,目前负责阿里巴巴 Aone Copilot 代码智能化项目的算法工作,主导代码补全与 NES(Next Edit Suggestions)模型的全链路研发,包括场景探索、应用落地、模型训练、数据构建、评测与部署。模型服务上万阿里集团用户,在实际业务中取得显著效果。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景与模型演进

  • AI Coding 需求升级:从 FIM 到 NES

  • FIM 与 NES 的效果对比与案例展示

  • 单行补全与 NES 的冲突与融合

  • NES 模型的输入输出设计与 IDE 协作方式

2. 推理方案与性能优化

  • 全文重写 vs. 定点编辑的权衡

  • sp edit 推理方式与性能优化(1000 token/s)

  • 效果对比与落地案例

3. 数据构建与迭代

  • 单行补全扩充方案

  • 基于 PR 的数据构建方式

  • 日志驱动的动态数据收集

4. 模型训练与优化实践

  • SFT 提升 NES 基础能力

  • DPO 针对 bad case 的优化策略

  • GRPO 规则设计与能力扩展

5. 评测与反馈机制

  • IDE 回放策略与真实场景评测

  • EM 强对比与 LLM 评测结合

6. 未来展望

  • NES 与 Agent 的竞争与合作

  • Agent + NES 的 AI Coding 最佳实践


您认为,这样的技术在实践过程中有哪些痛点?

  • 数据构建成本高

  • 模型输出样式冗余度高

  • 跨文件编辑能力不足


演讲亮点

  • 相较于单行和 NES 共存方案,此方案复杂度和灵活性更高

  • 相较于位点预测 + 区域修改,我们推理能支持全文重写,同时通过 Special Token 设计可以控制模型输入输出时间


听众收益

  • NES 成熟实现方案,完整设计思路

  • 行业的新动向


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-28 13:003840

评论

发布
暂无评论

5分钟速读之Rust权威指南(四十二)高级函数

wzx

rust

🐧【Linux技术专题系列】「必备基础知识」一起探索(用户、用户组与文件权限)

码界西柚

Linux 操作系统 linux 文件权限控制 7月日更

Liunx之chown命令

入门小站

Linux

高阶的产品经理是什么样的?

石云升

产品经理 职场经验 7月日更

phabricator + gitlab 强制code review

阿呆

gitlab Code Review phabricator

极光开发者周刊【No.0716】

极光GPTBots-极光推送

昇腾AI的三级跳

脑极体

B 站崩了:事情不大,影响不小

Java架构师迁哥

架构实战营模块二作业

Clarke

架构实战营

Spark SQL和DataFrames:内置数据源简介(四)

Databri_AI

spark sparksq

【通证经济】价值、应用、市场,被掩盖的区块链宝藏!!

CECBC

有趣的SVG、Favicon

devpoint

favicon SVG 7月日更

北鲲云超算:以HPC解决方案助力生命科学领域研究发展

北鲲云

Python 实战(五)| 字符串

一个优秀的废人

Python 正则表达式急速入门

喵叔

7月日更

架构实战营 模块二 作业

一雄

作业 架构实战营 模块二

百分点大数据技术团队:ClickHouse国家级项目性能优化实践

百分点科技技术团队

百分点数据科学实验室:智慧应急安全生产智能决策方案建设实践

百分点科技技术团队

模块2作业

Tina

如何通过代码审计从三层内网各种漏洞拿到域控?

网络安全学海

黑客 网络安全 信息安全 安全漏洞 渗透测试·

Ping Exporter -- Prometheus

耳东@Erdong

Prometheus ping 7月日更 exporter

【得物技术】零拷贝

得物技术

io 网络 零拷贝 流程 传输

终于学完了阿里P8大牛推荐的527页Java性能优化实践文档

Java 编程 架构 面试

我佛了!花重金求来的并发编程笔记,颠覆了我以往“正确“的认知

Java 编程 程序员

要性能还是要模型?

escray

学习 极客时间 7月日更 如何落地业务建模

模块二作业

VE

架构实战营

hdfs中抽象为block块的好处

五分钟学大数据

hdfs 7月日更

毕业1年,凭借一份 “漫画” 杀进大厂?他是怎么做到的?原理篇+框架篇

Java架构师迁哥

JDBC数据库链接的那些事

卢卡多多

JDBC 7月日更

博睿数据亮相2021中国互联网大会,践行数字政府新路径

博睿数据

博睿数据 数据链DNA

作为程序员,遇到问题时你的解决手段是什么?

阿杰

程序员

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章