写点什么

清华大学副教授艾清遥博士将出席 QCon 上海,分享动态化与参数化 RAG 技术探索

  • 2025-10-10
    北京
  • 本文字数:1611 字

    阅读完需:约 5 分钟

大小:866.05K时长:04:55
清华大学副教授艾清遥博士将出席QCon上海,分享动态化与参数化 RAG 技术探索

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


清华大学计算机科学与技术系副教授,博士生导师艾清遥博士已确认出席并发表题为让外部知识“长入”模型:动态化与参数化 RAG 技术探索的主题分享。检索增强生成(RAG)已成为帮助大型语言模型(LLMs)利用和学习外部知识的主流范式。然而,传统的 RAG 方法通常将 LLMs 视为静态的黑箱,仅依赖提示词和上下文工程来整合检索到的信息。这忽略了两个重要的问题,即 LLM 推理过程中的动态信息需求和 LLM 在内、外部知识利用过程存在的机制鸿沟。为此,艾清遥博士团队针对性地提出动态化和参数化的检索增强生成范式,通过主动分析 LLMs 在推理过程中不断变化的需求,实时将检索到的知识注入模型的内部表示和参数中,弥合外部知识检索与内在模型动态之间的差距,实现对 LLM 外部知识利用效率和性能的全面提升。


具体而言,本次分享将重点介绍如何从注意力网络和多层感知机权重两个角度实现动态化和参数化的检索增强,在不改变 LLM 原有参数的前提下实现无缝且实时的外部知识注入。实验表明,与传统 RAG 相比,基于动态化和参数化的检索增强技术可以在提升系统的准确性和适应性的同时显著减少计算开销。相信动态化和参数化的检索增强范式将为弥合外部知识检索与内在模型动态之间的差距,推进大语言模型信息系统的动态定制化和可持续学习提供重要指导。



艾清遥,清华大学计算机科学与技术系副教授,博士生导师。主要研究方向为信息检索,包括信息表示学习、排序优化理论、检索增强技术等在互联网搜推和智慧司法上的应用。曾担任 ACM SIGIR-AP 2023 大会联合主席,NTCIR-18/19 程序联合主席,ACM TOIS 副主编,SIGIR、CIKM、WSDM 等国际顶级信息检索会议的领域主席。曾获北京市科技进步一等奖、钱伟长中文信息处理科学技术奖一等奖、钱伟长青年创新奖、Google 全球研究学者奖、ACM SIGIR 杰出青年学者奖、ACM SIGIR 2024 最佳论文奖、SIGIR-AP’23 最佳论文荣誉提名等。他在本次会议的详细演讲内容如下:


演讲提纲

1. RAG 的技术演进与核心挑战

  • 传统 RAG 的局限性

  • 动态化与参数化的 RAG 价值

2. 基于检索与生成推理解耦技术的动态化 RAG 实例

  • 基于交叉注意力机制的知识注入

  • 跨任务对比实验

  • 推理复杂度理论分析

3. 基于增量参数模块的参数化 RAG 实例

  • LLM 内外部知识机制理论

  • 外部知识的参数化模块构建

  • 参数化 RAG 流程范式

  • 性能与效率对比实验

4. 未来方向与行业启示

  • 动态感知与参数化注入的复合架构

  • 持续学习框架

您认为,这样的技术在实践过程中有哪些痛点?

  • 技术理论仍待完善

  • 需要软硬件结合的系统支持

演讲亮点

  • 解密动态化与参数化 RAG 突破 Transformer 架构限制的核心机理

  • 实证多文档场景下推理延迟与准确率不可兼得的破解之道

听众收益

  • 掌握下一代 RAG 技术的动态化与参数化实施方法论


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。



2025-10-10 13:555008

评论

发布
暂无评论

制作温馨浪漫爱心表白动画特效HTML5+jQuery【附源码】

JavaPub

活动报名:如何高效应对当下的实时场景需求?

tapdata

Tapdata 实时数据

什么是 DevOps?看这一篇就够了!

玩转Devop和研发效能DevStream/DevLake

DevOps

数据中台建设(九):数据中台资产运营机制

Lansonli

数据中台 8月月更

临床研究方法学,到现场,到数据真实发生的地方 | 对话数智 x 张维拓

ModelWhale

数据分析 人才培养 数据科学 8月月更 临床医学

AI 助力双碳目标:让每一度电都是我们优化的

阿里技术

人工智能

2022上半年各银行理财子公司深耕差异化发展,净值型产品数量增加

易观分析

银行 子公司 差异化发展 净值型产品

手把手教你用 Jenkins 自动部署 SpringBoot

江南一点雨

Java spring jenkins springboot

运维:Centos8安装supervisor守护Nginx进程笔记

天使不哭

#开源 8月月更

Java使用IReport导出复杂报表

源字节1号

微信小程序 软件开发 前端开发 后端开发

【黄啊码】MySQL入门—2、使用数据定义语言(DDL)操作数据库

黄啊码

MySQL 8月月更

炫酷又高效的数据可视化大屏,做起来真的没那么难!丨极客星球

MobTech袤博科技

产品设计 数据可视化

【有话耀说】开发小达人们,荣耀开发者服务平台正式入驻InfoQ社区啦~

荣耀开发者服务平台

全面认识MOS管,一篇文章就够了

矜辰所致

电路设计 8月月更 电子设计基础 MOS管

【黄啊码】MySQL入门—1、SQL 的执行流程

黄啊码

MySQL 8月月更

JS逆向字体反爬,某供应商平台反爬实践

梦想橡皮擦

Python 爬虫 8月月更

TPC藏宝计划IDO自由协议复利模式开发功能分析

开发微hkkf5566

技术分享| 小程序实现音视频通话

anyRTC开发者

小程序 uni-app 音视频 语音通话 视频通话

【LeetCode】分组的最大数量Java题解

Albert

LeetCode 8月月更

萌宠来袭,如何让“吸猫撸狗”更有保障?

旺链科技

区块链 产业区块链 宠物行业

直播回放含PPT下载|基于Flink & DeepRec构建Online Deep Learning

阿里云大数据AI技术

深度学习

隐私计算与数据流通:关系、作用及功能

Jessica@数牍

隐私保护 隐私计算 数据流通 数据交易 数牍科技

Tapdata 开源项目基础教程:功能特性及实操演示

tapdata

Tapdata 开源社区

企业应当实施的5个云安全管理策略

SEAL安全

云计算 容器 DevOps 云原生 DevSecOps

聚焦数据来源、数据质量和模型性能构建小微企业信用画像

易观分析

数据技术 小微企业

什么是 DevOps?看这一篇就够了!

胡说云原生

管理 DevOps 运维 开发 签约计划第三季

技术干货 | 用零信任保护代码安全

权说安全

如何过一个充满科技感的七夕?华为告诉你

最新动态

秒云成功入选《2022爱分析 · 银行数字化厂商全景报告》,智能运维能力获认可

MIAOYUN

人工智能 银行数字化转型 智能运维 智能运维AIOps

SchedulX V1.5.0发布,提供快速压测、对象存储等全新功能!

星汉未来

云原生 k8s IT运维 降本增效 星汉未来

分布式链路追踪Jaeger + 微服务Pig在Rainbond上的实践分享

北京好雨科技有限公司

开源 Kubernetes 云原生 SpringCloud Jaeger

清华大学副教授艾清遥博士将出席QCon上海,分享动态化与参数化 RAG 技术探索_AI&大模型_QCon全球软件开发大会_InfoQ精选文章