限时领|《AI 百问百答》专栏课+实体书(包邮)! 了解详情
写点什么

大模型调优数据的高效构建与进化方法|AICon 北京

  • 2025-06-03
    北京
  • 本文字数:1058 字

    阅读完需:约 3 分钟

大小:591.51K时长:03:21
大模型调优数据的高效构建与进化方法|AICon北京

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


中电金信研究院副院长单海军已确认出席并发表题为《大模型调优数据的高效构建与进化方法》的主题分享,大模型训练调优演进很快,高质量的数据处理与标注也一直是大模型训练与调优的痛点。DeepSeek 最新构建的大模型使用纯强化学习的方式进行大模型训练。未来大模型的训练是否还需标注的数据,数据构建标注是否还有意义?如何高效处理与构建,并进行指令数据的进化,值得研究与探索。



单海军,工学博士,正高级工程师。现任中国电子集团中电金信副总裁、研究院副院长,负责公司 AI 业务线。毕业于浙江大学,先后获得学士和博士学位,2011-2012 期间在美国明尼苏达大学公派留学,有 15 余年人工智能领域的研发和管理经验。担任国家科技项目管理专家库专家、浙江省科技专家库专家、复旦大学电子信息学术学位行业导师,入选了上海市青年拔尖人才、上海市产业菁英高层次人才。曾任职于华为中央软件研究院和之江实验室(国家级),分别担任技术主管和人工智能研究中心负责人。曾主持和参与了 7 个国家级和省部级项目,获得 2022 年度中国电子集团科技人才奖,发表高水平论文和国内外发明专利 50 余篇,拥有国际 ITU 标准 1 项和行业标准多项。他在本次会议的详细演讲内容如下:


演讲提纲

  1. 背景介绍:大模型训练调优对数据的需求变化

  2. 大模型后训练数据准备与处理

  3. SFT 指令数据构建及处理

  4. RLHF 数据的构建与训练

  5. 大模型数据安全与版本管理


您认为,这样的技术在实践过程中有哪些痛点?

  • 未来是否还需要数据标注悬而未决

  • 如何保证数据的质量

  • 如何降低人工标注数据的工作量


您的演讲有哪些前沿亮点?

  • 端到端介绍大模型数据工程的处理链路

  • 除了介绍 SFT 指令数据的构建之外,还会介绍 SFT 指令数据的进化等


听众收益

  • 掌握和了解大模型数据工程处理的全链路

  • 可以看到大模型数据处理的趋势


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-03 16:004004

评论

发布
暂无评论

MQTTX 1.10.0 发布:CLI高级文件管理与配置

EMQ映云科技

mqtt mqttx

VMware vCenter Server 7.0U3r 下载 - 修复堆溢出 (远程执行代码) 和本地权限提升漏洞

sysin

vSphere vcenter esxi

从钉钉到跨境电商技术演变,HHO通过NineData实现全球化业务布局

NineData

数据安全 数据管理 NineData 两氢一氧 本地机房

2025QS最佳留学城市排名发布

财见

更高能效:浪潮信息元脑®服务器NF5280G7刷新SPEC Power测试纪录

财见

英伟达成全球市值第一公司;苹果暂停下一代高端头显研发丨 RTE 开发者日报 Vol.227

声网

VMware vCenter Server 8.0U1e 下载 - 修复堆溢出 (远程执行代码) 和本地权限提升漏洞

sysin

vSphere vcenter esxi

2024年全球架构师峰会(ArchSummit深圳站)

后台技术汇

Java 后台开发 架构师 全球架构师峰会 ArchSubmit

高考志愿服务,一张AI搜索的现实考卷

脑极体

AI

PhantomReference 和 WeakReference 究竟有何不同

bin的技术小屋

JVM Java’

一文读懂Lumoz节点的潜力与收益,加密收益新范式

股市老人

用技术望远镜看国内大模型:文心闪耀 双榜领跑

脑极体

AI

华为阅读亮相BIBF:以AI赋能出版行业,引领阅读新业态

最新动态

解决华为NEXT应用开发中模拟器组件缺失问题

彭康佳

鸿蒙 an'droid

VMware vCenter Server 8.0U2d 下载 - 修复堆溢出 (远程执行代码) 和本地权限提升漏洞

sysin

vSphere vmware vcenter esxi

小鲤AI志愿填报助手:一键探索最适合你的大学专业

AI Inception

AI 高考 AIGC rag

Web3新视野:Lumoz节点的潜力与收益解读

石头财经

报名参加通义灵码高校训练营,领 300 元阿里云产品通用抵扣金

阿里巴巴云原生

阿里云 云原生 通义灵码

火山引擎×OPPO,以多样化AI智能体为手机用户带来全新体验

新消费日报

Altair 助力优化摩托车空气动力学性能,实现最佳的整流罩设计

Altair RapidMiner

人工智能 仿真 AIGC altair

一文读懂Lumoz节点的潜力与收益,加密收益新范式

BlockChain先知

质检迈入新时代,天润融通推出基于大模型的质检3.0解决方案

天润融通

人工智能

Web3新视野:Lumoz节点的潜力与收益解读

股市老人

罗克韦尔自动化发布年度《智能制造现状报告:汽车版》

财见

大模型调优数据的高效构建与进化方法|AICon北京_大数据_AICon 全球人工智能开发与应用大会_InfoQ精选文章