50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

  • 2025-09-28
    北京
  • 本文字数:1467 字

    阅读完需:约 5 分钟

大小:793.70K时长:04:30
AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


阿里巴巴算法工程师赵鹏已确认出席并发表题为AI Coding 全新范式:NES 模型的推理、训练与评测实践的主题分享。当前 AI 编程领域正迎来重大变革,传统的 FIM(填充中间)模式已无法满足开发者对复杂编辑操作的需求,AI 编程助手亟需从单一续写能力升级为支持增、删、改全面操作的 NES(下一代编辑与抑制)模型。本次演讲将系统介绍团队如何通过“全文重写”方案实现 NES 能力,并突破高性能推理、训练数据构建与模型优化等关键技术难题。本次将重点分享 SP Edit 推理方案如何实现 1000+tokens/s 的生成速度,以及如何融合静态代码与动态日志数据构建训练集。此外,针对训练中遇到的回滚、能力冲突等典型问题,提出基于 DPO 和 SFT 的优化策略。最后,通过 IDE 回放与 LLM 评测相结合的评估体系,验证 NES 模型的实际效果,并展望其与 Agent 协同工作的未来方向。


赵鹏,阿里巴巴算法工程师。主要研究 AI Coding 方向,目前负责阿里巴巴 Aone Copilot 代码智能化项目的算法工作,主导代码补全与 NES(Next Edit Suggestions)模型的全链路研发,包括场景探索、应用落地、模型训练、数据构建、评测与部署。模型服务上万阿里集团用户,在实际业务中取得显著效果。他在本次会议的详细演讲内容如下:


演讲提纲

1. 背景与模型演进

  • AI Coding 需求升级:从 FIM 到 NES

  • FIM 与 NES 的效果对比与案例展示

  • 单行补全与 NES 的冲突与融合

  • NES 模型的输入输出设计与 IDE 协作方式

2. 推理方案与性能优化

  • 全文重写 vs. 定点编辑的权衡

  • sp edit 推理方式与性能优化(1000 token/s)

  • 效果对比与落地案例

3. 数据构建与迭代

  • 单行补全扩充方案

  • 基于 PR 的数据构建方式

  • 日志驱动的动态数据收集

4. 模型训练与优化实践

  • SFT 提升 NES 基础能力

  • DPO 针对 bad case 的优化策略

  • GRPO 规则设计与能力扩展

5. 评测与反馈机制

  • IDE 回放策略与真实场景评测

  • EM 强对比与 LLM 评测结合

6. 未来展望

  • NES 与 Agent 的竞争与合作

  • Agent + NES 的 AI Coding 最佳实践


您认为,这样的技术在实践过程中有哪些痛点?

  • 数据构建成本高

  • 模型输出样式冗余度高

  • 跨文件编辑能力不足


演讲亮点

  • 相较于单行和 NES 共存方案,此方案复杂度和灵活性更高

  • 相较于位点预测 + 区域修改,我们推理能支持全文重写,同时通过 Special Token 设计可以控制模型输入输出时间


听众收益

  • NES 成熟实现方案,完整设计思路

  • 行业的新动向


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-28 13:003880

评论

发布
暂无评论

兆骑科创双创服务平台,创业赛事活动,投融资对接平台

兆骑科创凤阁

太厉害了!腾讯T4大牛把《数据结构与算法》讲透了,带源码笔记

冉然学Java

编程 算法 排序 java\ 数据结构与算法、

国内IT市场还有发展吗?有哪些创新好用的IT运维工具可以推荐?

行云管家

云计算 多云管理 IT运维 云管理

这几年让你大呼惊人的AI应用,都离不开这项技术

小红书技术REDtech

人工智能 自然语言处理 nlp 自然语言 自然语言理解

Apache APISIX 2.15 版本发布,为插件增加更多灵活性

API7.ai 技术团队

开源 后端 API网关 APISIX 网关

IDO预售DAPP系统开发(NFT挖矿)

薇電13242772558

dapp

华为研究院19级研究员几年心得,终成趣谈网络协议文档,附大牛讲解

冉然学Java

数据库 编程 微服务 网络协议 java\

玉溪卷烟厂通过正确选择时序数据库 轻松应对超万亿行数据

TDengine

数据库 tdengine 时序数据库

Python字体反爬之乐居字体反爬,一文看懂,一文学会

梦想橡皮擦

Python 爬虫 8月月更

史上最全!47个“数字化转型”常见术语合集,看完秒懂~

优秀

数字化转型 数字化业务转型

想做好分布式架构?这个知识点一定要理解透彻

王小凡

Java 程序员 分布式 高并发

中科驭数等单位牵头发布行业首部DPU评测方法技术白皮书

硬科技星球

基于深度学习的图像检索方法!

Geek_e369a5

图像搜索 图像检索

开篇-开启全新的.NET现代应用开发体验

MASA技术团队

.net 云原生 后端

快速搞懂Seata分布式事务AT、TCC、SAGA、XA模式选型

知识浅谈

开源 8月月更

一文搞懂│php 中的 DI 依赖注入

设计模式 依赖注入 8月月更 高级编程

《数字经济全景白皮书》银行业智能风控科技应用专题分析 发布

易观分析

金融 银行 数字经济全景白皮书

兆骑科创创业赛事活动路演,高层次人才引进平台

兆骑科创凤阁

浅析PM2实用入门指南

青年码农

Node pm2

浅聊组合函数

掘金安东尼

前端 函数编程 8月月更

Kubernetes资源编排系列之三: Kustomize篇

阿里云大数据AI技术

运维‘

语音直播系统——做好敏感词汇屏蔽打造绿色社交环境

开源直播系统源码

软件开发 语聊房 直播系统源码 语音直播系统

绝对最直白的MySQL MVCC机制总结,免费拿走

知识浅谈

开源 8月月更

面试SQL语句,学会这些就够了!!!

程序员猪小哼

sql 实用SQl语句

二极管及其应用

厉昱辰

电子技术 8月月更

AI+BI+可视化,Sugar BI架构深度剖析

百度Geek说

架构 数据

并发模型和I/O模型介绍

C++后台开发

后端开发 I/O模型 C/C++后台开发 C/C++开发 并发模型

2022年值得尝试的7个MQTT客户端工具

EMQ映云科技

物联网 IoT mqtt 客户端 8月月更

大咖说·图书分享 | Serverless工程实践:从入门到进阶

大咖说

Serverless 工程实践

开源一夏 | 不会吧,十分钟就能上手Prometheus与Grafana监控SpringBoot项目

知识浅谈

开源 8月月更 SpringBoot实战

大数据培训如何部署一个健壮的Airflow

小谷哥

AI Coding 全新范式:NES 模型的推理、训练与评测实践|QCon 上海_AI&大模型_QCon全球软件开发大会_InfoQ精选文章