写点什么

京东集团算法总监韩艾将在 AICon 北京站分享基于强化学习的异构多智能体联合进化算法

  • 2025-06-06
    北京
  • 本文字数:1172 字

    阅读完需:约 4 分钟

大小:648.47K时长:03:41
京东集团算法总监韩艾将在AICon北京站分享基于强化学习的异构多智能体联合进化算法

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


京东集团算法总监韩艾已确认出席并发表题为《JDAgents-R1:基于强化学习的异构多智能体联合进化算法》的主题分享。多智能体强化学习(MARL)已成为处理日益复杂任务的重要范式。然而,异构智能体之间的联合进化仍面临合作效率低与训练不稳定等挑战。为此,京东提出了一种面向 MARL 的联合进化算法框架 JDAgents-R1,该方法首次将组相对策略优化(GRPO)应用于异构多智能体的联合训练中。通过迭代优化智能体的大语言模型(LLMs)与自适应记忆机制,JDAgents-R1 实现了决策能力与记忆能力的动态均衡,并能有效减少重复推理、加快训练收敛。在通用场景以及商家定制化场景中的实验表明,JDAgents-R1 在基于更小规模开源模型的情况下,依然能够达到与大规模语言模型相媲美的性能表现。



韩艾是中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人,QCon 大会优秀出品人和明星讲师。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注 AI 技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。她在本次会议的详细演讲内容如下:


演讲提纲

1. 多智能体训练技术

  • 多智能体应用案例

  • LLM 决策与 Memory 进化

  • 多智能体强化学习

2. JDAgents-R1: 联合进化算法方案

  • 多智能体协作

  • GRPO 联合训练算法技术

  • Memory 更新技术

3. 电商领域落地实战

  • 通用与垂直领域任务

  • 商家多智能体联合进化

4. 未来展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 多个大模型联合训练的信息通信难题:多卡多机,如何实现模型斩断与更新?

  • 智能体 memory 进化:memory 会干扰决策质量,如何评估 memory 的增减?


您的演讲有哪些前沿亮点?

  • 多智能体联合进化的算法设计,符合复杂多智能体场景的 online learning 需要

  • 决策与记忆机制联合更新


听众收益

  • 多智能体如何协作

  • 多个模型训练的更新策略


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-06 18:006123

评论

发布
暂无评论

用复杂的方式学会数组(Python实现动态数组)

宇宙之一粟

Python 数据结构 数组 1月月更

react源码解析20.总结&第一章的面试题解答

buchila11

React

开源走向世界(下):从数据库技术演进看开源力量丨BDTC 2021

PingCAP

尚硅谷《MySQL高级特性篇》教程发布

@零度

MySQL

城墙上的“云镜派”,如何守护云上资产安全?

脑极体

IntelliJ IDEA 的 Metamodel 配置

HoneyMoose

如何优雅的遍历Mycat分库表

编程江湖

mycat

JavaScript 12种设计模式汇总

编程江湖

JavaScript

模块六作业

Geek_e6f7f6

架构训练营

为什么要把系统拆分成分布式的?为啥要用dubbo?

JavaEdge

1月月更

Amazon EC2 串行控制台——化繁为简,高效解决网络问题

亚马逊云科技 (Amazon Web Services)

网络

读《底层逻辑》

wood

300天创作

Kafka的生产集群部署

编程江湖

kafka

如何提高后台服务应用问题的排查效率?日志 VS 远程调试

汪子熙

node.js 后台开发 1月月更

Magic UI四子围城,2022折叠屏灵魂觉醒

脑极体

Hibernate 如何生成 JPA 的 Metamodel

HoneyMoose

ReactNative进阶(十四):初探 Gradle

No Silver Bullet

Gradle React Native 1月月更

TCP socket和web socket的区别

汪子熙

前端 node,js 1月月更

大咖眼中的AI开源|王敏捷:深图在人工智能中的探索和研究

亚马逊云科技 (Amazon Web Services)

网络

“5G+区块链”护航新生儿转诊“生命通道”

CECBC

AWS Command Line Interface 使用S3入门

阿呆

AWS S3

元宇宙,以区块链为核心的Web3.0数字生态

CECBC

Java 常用类大讲解!3️⃣(手写 API、源码必备)

XiaoLin_Java

Java 数组 1月月更

站在面试官角度,看求职与内卷

程序人生

1月月更|推荐学Java——第一个MyBatis程序

逆锋起笔

Java mybatis SSM框架 MyBatis标签 mybatis配置

大咖眼中的AI开源 | 张建:图神经网络和DGL的实际应用

亚马逊云科技 (Amazon Web Services)

网络

架构师实战营3期毕业设计

小饭🍎

react源码解析19.手写迷你版react

buchila11

React

面试突击15:说一下HashMap底层实现?及元素添加流程?

王磊

一个基于PoS共识算法的区块链实例解析(升级版)

恒生LIGHT云社区

区块链 共识算法 PoS

使用亚马逊云科技安全服务防御、检测和响应 Log4j 漏洞

亚马逊云科技 (Amazon Web Services)

网络

京东集团算法总监韩艾将在AICon北京站分享基于强化学习的异构多智能体联合进化算法_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章