2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

京东集团算法总监韩艾将在 AICon 北京站分享基于强化学习的异构多智能体联合进化算法

  • 2025-06-06
    北京
  • 本文字数:1172 字

    阅读完需:约 4 分钟

大小:648.47K时长:03:41
京东集团算法总监韩艾将在AICon北京站分享基于强化学习的异构多智能体联合进化算法

6 月 27 日-6 月 28 日,AICon 全球人工智能开发与应用大会北京站即将拉开帷幕。本次大会将汇聚 AI 前沿技术与落地实践,邀请来自腾讯、阿里、百度、字节跳动等头部大厂以及智谱、硅基流动、智象未来、声智科技等 AI 企业的 50+资深专家,深度探讨 AI Agent、多模态应用、推理性能优化以及 AI 在软件研发、数据分析、业务运营等场景的具体落地实践。


京东集团算法总监韩艾已确认出席并发表题为《JDAgents-R1:基于强化学习的异构多智能体联合进化算法》的主题分享。多智能体强化学习(MARL)已成为处理日益复杂任务的重要范式。然而,异构智能体之间的联合进化仍面临合作效率低与训练不稳定等挑战。为此,京东提出了一种面向 MARL 的联合进化算法框架 JDAgents-R1,该方法首次将组相对策略优化(GRPO)应用于异构多智能体的联合训练中。通过迭代优化智能体的大语言模型(LLMs)与自适应记忆机制,JDAgents-R1 实现了决策能力与记忆能力的动态均衡,并能有效减少重复推理、加快训练收敛。在通用场景以及商家定制化场景中的实验表明,JDAgents-R1 在基于更小规模开源模型的情况下,依然能够达到与大规模语言模型相媲美的性能表现。



韩艾是中国科学院与美国康奈尔大学联合培养博士,北京大学双学士。现任京东集团算法总监,京东零售数据与算法通道委员,CCF 大赛专家委员会专家、京东赛题全球发布人,QCon 大会优秀出品人和明星讲师。兼任中国科学院大学硕士企业导师、北京工业大学硕士企业导师、西安电子科技大学客座教授。在国际顶级期刊发表学术论文数十篇。专注 AI 技术创新,主持设计了 Multi-Agent Planning 算法架构并落地京东商家智能助手,擅长多 Agent 动态规划与协同训练、LLM 微调与强化学习。她在本次会议的详细演讲内容如下:


演讲提纲

1. 多智能体训练技术

  • 多智能体应用案例

  • LLM 决策与 Memory 进化

  • 多智能体强化学习

2. JDAgents-R1: 联合进化算法方案

  • 多智能体协作

  • GRPO 联合训练算法技术

  • Memory 更新技术

3. 电商领域落地实战

  • 通用与垂直领域任务

  • 商家多智能体联合进化

4. 未来展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 多个大模型联合训练的信息通信难题:多卡多机,如何实现模型斩断与更新?

  • 智能体 memory 进化:memory 会干扰决策质量,如何评估 memory 的增减?


您的演讲有哪些前沿亮点?

  • 多智能体联合进化的算法设计,符合复杂多智能体场景的 online learning 需要

  • 决策与记忆机制联合更新


听众收益

  • 多智能体如何协作

  • 多个模型训练的更新策略


除此之外,本次大会还策划了AI Agent 构建与多场景实践多模态实践与应用大模型助力研发的实战经验AI 在业务运营中的深度落地大模型时代的数据处理与分析AI 变革下的工程师等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 580 元,详情可扫码或联系票务经理 13269078023 咨询。



2025-06-06 18:001

评论

发布
暂无评论

LC狂刷66道Dynamic-Programming算法题。跟动态规划说拜拜

android 程序员 移动开发

Tapdata 等40余家行业知名企业,应邀参与共建 NextArch Foundation

tapdata

数据库 数据融合

Gartner预测到2025年,将有一半的云数据中心部署具有人工智能功能的机器人

BeeWorks

MotionLayout_ 打开动画新世界大门 (part II),android插件化原理

android 程序员 移动开发

直呼内行!阿里大佬离职带出内网专属“高并发系统设计”学习笔记

编程 程序员 消息队列 高并发系统

Native开发工具之CPU 和架构(三),学习Android开发的步骤,

android 程序员 移动开发

实验室信息系统的主要功能及作用

低代码小观

企业管理 管理系统 LIMS实验室信息管理系统 信息管理系统 实验室

分享 | 一文了解 PG PITR 即时恢复

RadonDB

数据库 postgresql RadonDB

Spring Boot+Vue实现汽车租赁系统(毕设)

偶尔善良

MySQL redis Spring Boot Vue

Java线程安全ReentrantLock

FunTester

Java 性能测试 线程安全 测试开发 FunTester

MVVM系列之一:Lifecycle,面试竟然被这31道Android基础题难倒了

android 程序员 移动开发

springmvc的定时任务

小鲍侃java

11月日更

LayoutManager高端玩家,实现花式表格,kotlin中文

android 程序员 移动开发

「元宇宙」赛道,除了脸书,微软也来了

BeeWorks

OkHttp 断点上传的“基操”(1),完美讲解内存缓存LruCache实现原理

android 程序员 移动开发

LayoutManager高端玩家,实现花式表格(1),安卓面试题高级

android 程序员 移动开发

MVVM系列之二:LiveData,android程序开发教程

android 程序员 移动开发

OkHttp 3,安卓移动开发大作业

android 程序员 移动开发

OkHttp 断点上传的“基操”,算法题+JVM

android 程序员 移动开发

OkHttp3源码详解之拦截器(四),计算机应届毕业生面试题

android 程序员 移动开发

OkHttp流程分析,音视频编解码技术

android 程序员 移动开发

Linux学习~树莓派gpio控制,如何化身BAT面试收割机

android 程序员 移动开发

就这?腾讯云高工熬夜手写'Java微服务学习笔记'也就让我月薪涨3k

Java spring 程序员 面试

LeetCode,牛客面试必刷,看了这些,flutter面试

android 程序员 移动开发

🔥 DeepVideo 智能视频生产训练营火热报名中!

阿里云CloudImagine

阿里云 媒体处理 智能视频 智能生产 视频云

阿里大佬手写Docker学习笔记就这?也就是让我五体投地的水平罢了

Docker 编程 程序员

lambda表达式(4)(Shawn),开发android

android 程序员 移动开发

Linux编程之权限系统与工具使用(二),一文详解

android 程序员 移动开发

《黑客之道》干了一夜的kali Linux之Metasploit渗透测试框架的基本使用

学神来啦

Linux 运维 黑客 渗透 Metasploit

MotionLayout_ 打开动画新世界大门 (part II)(1),kotlin框架

android 程序员 移动开发

LeakCanary核心源码解析,android开发从入门到精通素材

android 程序员 移动开发

京东集团算法总监韩艾将在AICon北京站分享基于强化学习的异构多智能体联合进化算法_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章