2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

清华大学副教授艾清遥博士将出席 QCon 上海,分享动态化与参数化 RAG 技术探索

  • 2025-10-10
    北京
  • 本文字数:1611 字

    阅读完需:约 5 分钟

大小:866.05K时长:04:55
清华大学副教授艾清遥博士将出席QCon上海,分享动态化与参数化 RAG 技术探索

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


清华大学计算机科学与技术系副教授,博士生导师艾清遥博士已确认出席并发表题为让外部知识“长入”模型:动态化与参数化 RAG 技术探索的主题分享。检索增强生成(RAG)已成为帮助大型语言模型(LLMs)利用和学习外部知识的主流范式。然而,传统的 RAG 方法通常将 LLMs 视为静态的黑箱,仅依赖提示词和上下文工程来整合检索到的信息。这忽略了两个重要的问题,即 LLM 推理过程中的动态信息需求和 LLM 在内、外部知识利用过程存在的机制鸿沟。为此,艾清遥博士团队针对性地提出动态化和参数化的检索增强生成范式,通过主动分析 LLMs 在推理过程中不断变化的需求,实时将检索到的知识注入模型的内部表示和参数中,弥合外部知识检索与内在模型动态之间的差距,实现对 LLM 外部知识利用效率和性能的全面提升。


具体而言,本次分享将重点介绍如何从注意力网络和多层感知机权重两个角度实现动态化和参数化的检索增强,在不改变 LLM 原有参数的前提下实现无缝且实时的外部知识注入。实验表明,与传统 RAG 相比,基于动态化和参数化的检索增强技术可以在提升系统的准确性和适应性的同时显著减少计算开销。相信动态化和参数化的检索增强范式将为弥合外部知识检索与内在模型动态之间的差距,推进大语言模型信息系统的动态定制化和可持续学习提供重要指导。



艾清遥,清华大学计算机科学与技术系副教授,博士生导师。主要研究方向为信息检索,包括信息表示学习、排序优化理论、检索增强技术等在互联网搜推和智慧司法上的应用。曾担任 ACM SIGIR-AP 2023 大会联合主席,NTCIR-18/19 程序联合主席,ACM TOIS 副主编,SIGIR、CIKM、WSDM 等国际顶级信息检索会议的领域主席。曾获北京市科技进步一等奖、钱伟长中文信息处理科学技术奖一等奖、钱伟长青年创新奖、Google 全球研究学者奖、ACM SIGIR 杰出青年学者奖、ACM SIGIR 2024 最佳论文奖、SIGIR-AP’23 最佳论文荣誉提名等。他在本次会议的详细演讲内容如下:


演讲提纲

1. RAG 的技术演进与核心挑战

  • 传统 RAG 的局限性

  • 动态化与参数化的 RAG 价值

2. 基于检索与生成推理解耦技术的动态化 RAG 实例

  • 基于交叉注意力机制的知识注入

  • 跨任务对比实验

  • 推理复杂度理论分析

3. 基于增量参数模块的参数化 RAG 实例

  • LLM 内外部知识机制理论

  • 外部知识的参数化模块构建

  • 参数化 RAG 流程范式

  • 性能与效率对比实验

4. 未来方向与行业启示

  • 动态感知与参数化注入的复合架构

  • 持续学习框架

您认为,这样的技术在实践过程中有哪些痛点?

  • 技术理论仍待完善

  • 需要软硬件结合的系统支持

演讲亮点

  • 解密动态化与参数化 RAG 突破 Transformer 架构限制的核心机理

  • 实证多文档场景下推理延迟与准确率不可兼得的破解之道

听众收益

  • 掌握下一代 RAG 技术的动态化与参数化实施方法论


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。



2025-10-10 13:555025

评论

发布
暂无评论

云网翼连智算未来| 重温天翼云全球行•亚太站精彩盛况

天翼云开发者社区

云计算

Amazon EC2 云服务器体验感爆了

归来

Amazon EC2 云服务器

投资机构Janus Capital Group为Rola-IP品牌融资700万美元

Geek_ccdd7f

这可能是全网最晚的低代码技术总结

互联网工科生

低代码 低代码平台

领跑中国APM市场,博睿数据蝉联第一!

博睿数据

运维 监控 可观测性

星河共创,开为科技加入飞桨大模型生态圈,共建营销应用新范式

飞桨PaddlePaddle

深度学习 飞桨 文心大模型

人民邮电出版社70周年庆暨异步社区8周年庆成功举办,和鲸Heywhale荣获异步社区“2023年度最佳合作伙伴”奖

ModelWhale

IT 数据科学 书籍出版 异步社区 人民邮电出版社

和鲸为神经计算建模及编程培训班提供支持,聚焦学术前沿,助力人才培养

ModelWhale

编程 培训 脑科学 建模 计算神经科学

软件测试/测试开发丨如何利用ChatGPT自动生成测试用例思维导图

测试人

软件测试

视频直播场景下对象存储的应用

天翼云开发者社区

对象存储

一种Mysql和Mongodb数据同步到Elasticsearch的实现办法和系统

天翼云开发者社区

MySQL 数据库

深入Vue.js与TypeScript的生命周期

K8sCat

vue.js 生命周期

Windows、Linux 和 Mac三个操作系统的对比

小魏写代码

天谋科技作为生态企业参与 Data & AI Con Shanghai 2023

Apache IoTDB

罗拉ROLA住宅代理IP市场稳定增长,未来有哪些发展前景?

Geek_ccdd7f

私域流量搭建与运营,全是技巧攻略!

鲸品堂

运营 流量 企业号11月PK榜

行业独家 | 腾讯云ES:PB日志查询大提速,自治索引查询裁剪详解!

腾讯云大数据

ES

AI 女友突然下线,大叔集体「崩溃」;谷歌聊天机器人称谷歌滥用垄断力量丨 RTE 开发者日报 Vol.78

RTE开发者社区

软件测试/测试开发丨Python安装指南(Windows版)

测试人

Python 软件测试

搭建二维码系统,轻松实现固定资产的一物一码管理

草料二维码

sip中继的介绍

cts喜友科技

SIP

sip中继是什么意思

cts喜友科技

SIP

向量数据库的崛起与多元化场景创新

向量数据库

第十五届全国交通运输领域青年学术会议,和鲸 Heywhale 携手龙船科技联合发布科研服务解决方案

ModelWhale

数据 服务 解决方案 交通运输 科研

文心一言 VS 讯飞星火 VS chatgpt (129)-- 算法导论11.1 4题

福大大架构师每日一题

福大大架构师每日一题

清华大学副教授艾清遥博士将出席QCon上海,分享动态化与参数化 RAG 技术探索_AI&大模型_QCon全球软件开发大会_InfoQ精选文章