9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

京东大模型蒸馏技术登上 Nature,推理平均提效 30%

  • 2025-05-15
    北京
  • 本文字数:1273 字

    阅读完需:约 4 分钟

大小:674.09K时长:03:50
京东大模型蒸馏技术登上Nature,推理平均提效30%

5 月 15 日,京东探索研究院论文《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》发表于 Nature 旗下期刊 npj Artificial Intelligence,该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法,成为国内首个系统性解决开放环境下大模型开发效率难题并获国际顶刊认证的研究成果。该技术通过模型蒸馏、数据治理、训练优化与云边协同四大创新,将大模型推理效率平均提升 30%,训练成本降低 70%


京东大模型开发计算技术,推理平均提效 30%


企业将大模型应用付诸实践,面临着诸多卡点,一方面进入大模型应用门槛高,另一方面模型训练与推理效率低。


京东大模型开发计算技术,能支持企业的模型开发训练及生产,让庞大、重型的 AI 模型“瘦身”成精悍的小模型,精华依旧,效率大增,瘦身不降智。既能节省算力资源,加速推理,还能适应多平台,广泛部署到更多平台上。


论文中提出了四个创新方法:

  • 模型蒸馏,采用动态分层蒸馏技术,特别是在预训练阶段进行蒸馏,调整仅 0.5%的参数实现低资源场景下的高效训练,减少大型模型的部署成本。

  • 数据治理,提出跨领域数据动态采样算法,自动混合不同领域数据,并引入隐私保护和主动学习技术,提升大模型泛化能力。

  • 训练优化,使用贝叶斯优化(BO)框架进行超参数优化和架构搜索,尤其是擅长处理离散空间,MPMD 场景下资源利用率提升 40%。

  • 云边协同,支持在云端进行模型搜索和训练,边缘设备负责部署和推理,并利用两阶段压缩策略以适应资源限制,提升云边协作的高效性。



值得一提的是,该平台还可支持京东大模型、Llama、DeepSeek 等多个模型的蒸馏、推理。在模型蒸馏层面,效果较同量级模型有明显提升,以京东大模型为例,蒸馏后的大模型 Livebench 提升 14 分。大量的实验结果也证明有效性和效率,推理平均提效 30%,训练成本平均降低 70%

JoyBuild 大模型开发计算平台,让模型训练与应用更普惠


这套京东沉淀下来的大模型开发计算的技术,支撑了 JoyBuild 大模型开发计算平台,广泛服务行业用户。

JoyBuild 能够为客户的大模型开发和行业应用开发,提供定制化解决方案。JoyBuild 支持各类模型的调优开发,内置 20 余种开源模型和丰富的数据集,并提供 100 余种算法和工具链,帮助企业根据自身业务特征,将通用模型迅速转化为专业模型,一站式应用大模型。


现在,不到一周时间,企业即可完成从数据准备、模型训练到模型部署的全流程;之前需要 10 余人的科学家团队工作,现在只需要 1~2 个算法人员;通过平台模型加速工具优化,节约 90%的推理成本。


京东丰富的业务场景,还为平台上的基础大模型提供具体的行业应用场景,加速基于大模型的商业化落地。在行业知识库之外,JoyBuild 沉淀了京东自己的零售、物流、健康、金融等行业 Know-How,可应用于供应链优化、智能客服、营销内容生成等各类场景,加速模型普惠。

 

京东给出的大模型解法并不是“黑箱”,而是一条解决大模型训练效率及应用问题的通用路径,是真正的“授之以渔”,对学术界、产业界均有广泛参考价值。未来,京东将进一步提升大模型开发与计算效率,让中小型和大型企业都能低成本、高效构建专属 AI 应用,助推 AI 规模化应用落地。

2025-05-15 18:066878

评论

发布
暂无评论

App自动化测试是怎么实现H5测试的

和牛

测试

如何选择靠谱大数据课程

小谷哥

如何在java开发行业有更好前景

小谷哥

【字体反爬】目标站点5Lq65Lq66L2m(Base64加密),Python反爬系列再次更新

梦想橡皮擦

Python 爬虫 7月月更

禅道项目管理软件的甘特图功能介绍

禅道项目管理

项目管理 甘特图 项目管理软件 禅道

Moonbeam Orbiters Program:为收集人参与 Moonbeam 和 Moonriver 提供新方式

One Block Community

区块链 科技

聊聊并发编程的12种业务场景

C++后台开发

并发编程 网络编程 后端开发 C++后台开发 C++开发

Java Idea插件Easy Code

孙永潮

idea插件

如何通过在线协作文档提高办公效率

Baklib

LED显示屏和液晶透明拼接屏有什么区别?

Dylan

LED显示屏 led显示屏厂家

【7.15-7.22】写作社区精彩技术博文回顾

InfoQ写作社区官方

优质创作周报

RocketMQ系列二:RocketMQ监控/告警一站式搭建应用

hum建应用专家

数据库 RocketMQ

暗黑王者|ZEGO 低照度图像增强技术解析

ZEGO即构

低照度图像增强技术

零基础学习前端技术方法推荐

小谷哥

音乐 NFT 为什么火了?Polkadot 或将成为发展音乐 NFT 的最佳选择

One Block Community

区块链 科技

web前端开发技术就业前景怎么样

小谷哥

观测云产品更新|新增智能巡检功能;新增用户访问指标检测事件通知模板变量等

观测云

稀缺性之于Web3:如何成为去中心化世界的胜利者

One Block Community

区块链 科技

CESS 测试网上线!首个提供多元应用场景的去中心化存储网络

One Block Community

区块链 科技

3步就能制作漫画头像的机器人,想拥有一个吗?

华为云开发者联盟

人工智能 动漫

李宏毅《机器学习》丨6. Convolutional Neural Network(卷积神经网络)

AXYZdong

机器学习 7月月更

离开大厂,一周965+远程工作报告

无人之路

大厂 内卷 955 远程 WLB

零基础学习大数据开发技术

小谷哥

Spring Security 中的权限注解很神奇吗?

江南一点雨

Redis 做接口限流,一个注解的事!

江南一点雨

Java redis springboot

搭建实用的产品帮助文档,提升用户满意度

Baklib

实力认证!星汉未来正式加入中国通信企业协会

星汉未来

云原生 k8s 星汉未来 中国通信企业协会

如何高效的学习掌握新技术

程序员海军

高效率 7月月更

中移链(基于EOS)测试环境搭建

BSN研习社

软件调优方法有哪些?看看飞腾技术专家怎么说 | 龙蜥技术

OpenAnolis小助手

cpu io 服务器 龙蜥大讲堂 飞腾

京东大模型蒸馏技术登上Nature,推理平均提效30%_生成式 AI_李冬梅_InfoQ精选文章