2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

清华大学副教授艾清遥博士将出席 QCon 上海,分享动态化与参数化 RAG 技术探索

  • 2025-10-10
    北京
  • 本文字数:1611 字

    阅读完需:约 5 分钟

大小:866.05K时长:04:55
清华大学副教授艾清遥博士将出席QCon上海,分享动态化与参数化 RAG 技术探索

如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+可落地的实践案例!


10 月 23 日-10 月 25 日,QCon全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!


清华大学计算机科学与技术系副教授,博士生导师艾清遥博士已确认出席并发表题为让外部知识“长入”模型:动态化与参数化 RAG 技术探索的主题分享。检索增强生成(RAG)已成为帮助大型语言模型(LLMs)利用和学习外部知识的主流范式。然而,传统的 RAG 方法通常将 LLMs 视为静态的黑箱,仅依赖提示词和上下文工程来整合检索到的信息。这忽略了两个重要的问题,即 LLM 推理过程中的动态信息需求和 LLM 在内、外部知识利用过程存在的机制鸿沟。为此,艾清遥博士团队针对性地提出动态化和参数化的检索增强生成范式,通过主动分析 LLMs 在推理过程中不断变化的需求,实时将检索到的知识注入模型的内部表示和参数中,弥合外部知识检索与内在模型动态之间的差距,实现对 LLM 外部知识利用效率和性能的全面提升。


具体而言,本次分享将重点介绍如何从注意力网络和多层感知机权重两个角度实现动态化和参数化的检索增强,在不改变 LLM 原有参数的前提下实现无缝且实时的外部知识注入。实验表明,与传统 RAG 相比,基于动态化和参数化的检索增强技术可以在提升系统的准确性和适应性的同时显著减少计算开销。相信动态化和参数化的检索增强范式将为弥合外部知识检索与内在模型动态之间的差距,推进大语言模型信息系统的动态定制化和可持续学习提供重要指导。



艾清遥,清华大学计算机科学与技术系副教授,博士生导师。主要研究方向为信息检索,包括信息表示学习、排序优化理论、检索增强技术等在互联网搜推和智慧司法上的应用。曾担任 ACM SIGIR-AP 2023 大会联合主席,NTCIR-18/19 程序联合主席,ACM TOIS 副主编,SIGIR、CIKM、WSDM 等国际顶级信息检索会议的领域主席。曾获北京市科技进步一等奖、钱伟长中文信息处理科学技术奖一等奖、钱伟长青年创新奖、Google 全球研究学者奖、ACM SIGIR 杰出青年学者奖、ACM SIGIR 2024 最佳论文奖、SIGIR-AP’23 最佳论文荣誉提名等。他在本次会议的详细演讲内容如下:


演讲提纲

1. RAG 的技术演进与核心挑战

  • 传统 RAG 的局限性

  • 动态化与参数化的 RAG 价值

2. 基于检索与生成推理解耦技术的动态化 RAG 实例

  • 基于交叉注意力机制的知识注入

  • 跨任务对比实验

  • 推理复杂度理论分析

3. 基于增量参数模块的参数化 RAG 实例

  • LLM 内外部知识机制理论

  • 外部知识的参数化模块构建

  • 参数化 RAG 流程范式

  • 性能与效率对比实验

4. 未来方向与行业启示

  • 动态感知与参数化注入的复合架构

  • 持续学习框架

您认为,这样的技术在实践过程中有哪些痛点?

  • 技术理论仍待完善

  • 需要软硬件结合的系统支持

演讲亮点

  • 解密动态化与参数化 RAG 突破 Transformer 架构限制的核心机理

  • 实证多文档场景下推理延迟与准确率不可兼得的破解之道

听众收益

  • 掌握下一代 RAG 技术的动态化与参数化实施方法论


除此之外,本次大会还策划了多模态融合技术与创新应用混沌工程与全链路压测实践Data Infra for AIAgentic AI加速与反哺:AI 时代的可观测实践Vibe Coding端侧大模型的创新与应用大模型推理的工程实践AI 搜索技术的深水区模型训练与微调具身智能:当 AI 学会“动手思考”大模型驱动的制造革命AI4SE:软件研发提质增效实践AI 重塑视觉创作体验从“炫技”走向“实用”的 AI 产品大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,更多详情可联系票务经理 18514549229 咨询。



2025-10-10 13:554951

评论

发布
暂无评论

美团一面,有点难度

王中阳Go

Go 面试题 美团

从扛着麻袋跑海关,到躺着在家收美金:中国代购的逆袭史oopbuy

代码忍者

2024年央国企数智化转型案例持续征集中

信通院IOMM数字化转型团队

数字化转型 数智化转型 案例征集 央国企数字化转型

骨骼点检测技术详解:探索机器识别人体动作的奥秘

HarmonyOS SDK

harmoyos

可灵视频生成可控性为什么这么好?快手又公开了四篇研究

快手技术

快手 #大模型 视频生成 可灵AI

企业数据虚拟化方案选型指南:构建下一代数据架构的核心逻辑

Aloudata

数据仓库 数据分析 数据架构 数据虚拟化 数据编织

Desktop Curtain for mac(桌面图标隐藏工具)v3.2免激活版

小玖_苹果Mac软件

转转平台IM系统架构设计与实践(二):详细设计与实现

JackJiang

网络编程 即时通讯 IM

如何在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型?

阿里巴巴云原生

阿里云 云原生 通义灵码 AI程序员

如何在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型?

阿里云云效

阿里云 云原生 通义灵码 AI程序员

文件夹比较工具Naarak Studio DirEqual for Mac中文激活版

小玖_苹果Mac软件

媒体文件格式转换器Permute for mac

小玖_苹果Mac软件

Eudic欧路词典 for Mac(英语词典翻译查询工具)v4.8.1激活版

小玖_苹果Mac软件

“新旗手”三星Galaxy S25系列,再次定义了AI手机的进化方向

Alter

让AI搜索成为你的工作能力

老张

人工智能 DeepSeek

Supersonic from Unity 营收副总裁:混合休闲破局、AI 赋能,手游行业未来可期

极客天地

JProfiler for Mac(Java开发分析软件)v14.0.5永久激活版

小玖_苹果Mac软件

清华大学副教授艾清遥博士将出席QCon上海,分享动态化与参数化 RAG 技术探索_AI&大模型_QCon全球软件开发大会_InfoQ精选文章