10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

前 OpenAI 研究员吴翼博士确认出席 QCon 上海,分享 AReaL 框架与 Agent 最佳实践

  • 2025-09-15
    北京
  • 本文字数:1269 字

    阅读完需:约 4 分钟

大小:676.31K时长:03:50
前 OpenAI 研究员吴翼博士确认出席 QCon 上海,分享AReaL 框架与 Agent 最佳实践

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


清华大学交叉信息院助理教授,博士生导师,前 OpenAI 研究员吴翼博士已确认出席并发表题为智能体时代的强化学习:AReaL 框架与 Agent 最佳实践的主题分享。随着大模型与智能体(Agent)技术的快速发展,强化学习(RL)正成为提升 AI 代理自主决策能力的关键引擎。然而,传统的 RL 训练方法面临计算成本高、数据需求大、系统复杂度高等挑战,限制了 Agent 的规模化落地。本次演讲将重点介绍针对 Agent 模型的强化学习训练系统 AReaL 及其在 Agent 场景下的最佳实践。通过真实数据和可复现的代码,展示 AReaL 如何帮助开发者和企业高效构建智能体系统,并推动 AI Agent 从实验室走向产业应用。



吴翼博士,清华大学交叉信息院助理教授,博士生导师,前 OpenAI 研究员。博士毕业于加州大学伯克利分校,研究方向为强化学习。Google Scholar 引用超过 13000 次,曾获 NIPS 2016 best paper award,ICRA best demo award finalist,并获得 2025 年 WAIC 云帆奖。他在本次会议的详细演讲内容如下:


演讲大纲

1. Agent 时代的强化学习新挑战

  • 传统 RL 训练的瓶颈

    数据需求:高质量人类反馈(RLHF)的获取成本

    计算效率:长序列任务(10 K+ tokens)的显存与吞吐问题

    系统复杂度:多模块(生成、奖励、策略优化)协同训练的工程难题

  • AReaL 的破局思路

    异步强化学习训练:2.77x 强化学习训练提升

    SOTA 推理模型:通过强化学习在多个任务轻松实现 SOTA

    全栈开源简单易用:代码、数据、模型、脚本的完整可复现性,轻量级版本轻松入门强化学习

2. AReaL 在 Agent 场景的核心技术

3. Agent 最佳实践案例

4. 社区生态与未来计划


演讲亮点

  • 面向 Agent 的强化学习技术突破

  • 独家开源实践

  • 前沿 Agent 场景落地


听众收益

  • 获取降本增效的 RL 落地路径

  • 解锁 AI 与业务场景的融合范式

  • 了解 AReaL 未来支持多模态 Agent、异步训练的路线图,提前布局技术生态


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可联系票务经理 18514549229 咨询。


2025-09-15 13:001

评论

发布
暂无评论

Wall Clock与Monotonic Clock

fliter

商品信息全景图:API接口在聚合商品数据中的应用

Noah

利用技术潜能实现企业全面预算管理的智能化转型

智达方通

信息技术 财务分析 全面预算管理 财务规划

雷军不再主讲小米手机发布会;苹果明确:Vision Pro 头显电池某些场景会降低其性能丨 RTE 开发者日报 Vol.142

声网

聚道云软件连接器:连接薪人薪事与携程商旅的桥梁,出差管理效率的新篇章

聚道云软件连接器

案例分享

WIFI 6E/IPQ5018 WITH QCN9074 Deliver new data experiences

wallysSK

Mocaverse NFT 概览与数据分析

Footprint Analytics

NFT

SD-WAN:企业网络转型的不可逆趋势

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商

理论与实战:一篇看懂Python词云

不在线第一只蜗牛

Python 前端 开发语言

唯品会商品详情数据接口Python

tbapi

唯品会商品列表数据接口 唯品会API接口 唯品会商品数据接口 唯品会商品数据采集接口

八种常见的云存储安全风险及防护建议

伤感汤姆布利柏

企业网络采用SD-WAN的优势

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商

Go中最常用的数据校验库

fliter

DevEco Studio 4.1带来多种调试能力,助力鸿蒙原生应用开发高效调试

新消费日报

区块链游戏解说:Axie Infinity 是什么

Footprint Analytics

NFT

如何用ETL工具实现API调用

谷云科技RestCloud

ETL 数据集成 API调用

一张“哑火”的AI禁令

脑极体

AI

商品管理系统:服装品牌提升工作效率的利器

第七在线

CubeFS源码分析系列(一) 创建Volume

总想做点什么

SD-WAN的安全性体现在哪里?

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商

已有天翼云Ubuntu云主机,搭建幻兽帕鲁服务器

天翼云开发者社区

云计算 云主机 云服务器

低代码平台四大常见用例开发:简化企业数字化进程

不在线第一只蜗牛

低代码 数字化 项目开发 企业转型

前 OpenAI 研究员吴翼博士确认出席 QCon 上海,分享AReaL 框架与 Agent 最佳实践_AI&大模型_QCon全球软件开发大会_InfoQ精选文章