写点什么

Azure AI Search 推出智能会话 AI 的代理式检索

  • 2025-06-08
    北京
  • 本文字数:1084 字

    阅读完需:约 4 分钟

大小:531.50K时长:03:01
Azure AI Search推出智能会话AI的代理式检索

微软已经在Azure AI Search中推出了代理式检索(Agentic Retrieval)的公开预览版,这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法,与传统的 RAG 相比,它将会话AI中的答案相关性提高了40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询,并在文本和向量嵌入中并行执行。

 

这个新功能是通过2025-05-01-preview数据平面REST API和Azure SDK预发布包中的一个新知识智能体对象以编程方式支持的。它建立在 Azure AI Search 的现有索引、一个链接到 Azure OpenAI 的专用“智能体”资源以及编排整个过程的检索引擎之上。微软将代理式检索定位为构建更复杂的知识检索系统的关键一步,这些系统明确为智能智能体而设计,并为下游消费提供高质量的基础数据。

 

根据文档,代理式检索过程包括以下几个阶段:首先,一个大型语言模型(LLM)分析整个聊天线程以识别核心信息。随后,它规划一个包含聊天历史和原始查询的检索策略。接下来,每个子查询同时运行,利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 大会上,Matthew Gotteiner解释道

 

值得注意的是,代理式检索的整体速度与生成的子查询的数量直接相关。虽然并行运行子查询的目的是加快进程,但需要大量子查询的更复杂查询自然需要花费更长的时间来完成。反直觉的是,一个生成较少、更广泛子查询的“迷你”查询规划器可能会比一个旨在创建大量高度专注子查询的“全尺寸”规划器能更快地返回结果。

 

结果使用平台的语义排名器重新排名,形成一个包含顶级命中和结构化元数据的统一基础载荷。最后,API 还将返回检索过程的详细活动日志。

 


(来源:微软技术社区博客文章

 

微软的软件工程师 Akshay Kokane 在一篇 Medium博客文章中总结道:

 

传统的 RAG 系统是增强 LLMs 特定领域知识的一个很好的起点——特别是当使用像 Semantic Kernel 和 Azure AI Search 这样的工具时,这些工具简化了嵌入和检索。然而,随着企业用例变得更加复杂,静态、线性工作流程的局限性变得更加明显。

 

代理式 RAG(Agentic RAG,ARAG)通过引入动态推理、智能工具选择和迭代细化来填补这一空白。智能体可以调整它们的搜索策略,评估结果,并构建更精确的上下文感知答案——这使得它们非常适用于不断演变的业务需求、合规工作流程或多源数据环境。

 

最后,公共预览版目前在特定地区可用,代理式检索定价包括 Azure OpenAI 的查询规划和 Azure AI Search 的语义排名的每令牌计费,这两项在最初的预览版本中都是免费的。并且为开发人员提供了与 Azure AI 智能体服务集成的文档食谱指导

 

原文链接:

https://www.infoq.com/news/2025/05/azure-ai-search-agent-retrieval/

2025-06-08 08:004316

评论

发布
暂无评论

K8S学习笔记--安装Docker环境

IT蜗壳-Tango

IT蜗壳 6月月更

电商如何借助小程序发力

Geek_99967b

小程序 电商

JSON入门教程

倔强的牛角

json Fastjson 6月月更

NodeJS 防止xss攻击

德育处主任

Node 6月月更

flutter系列之:flutter中的Wrap

程序那些事

flutter 程序那些事 6月月更

在线JSON转CSharp(C#)Class工具

入门小站

工具

leetcode 91. Decode Ways 解码方法(中等)

okokabcd

LeetCode 动态规划 算法与数据结构

Android 11适配指南之系统相机拍照、打开相册

yechaoa

android 适配 6月月更 11.0

使用Mycat进行MySQL单库分表

迷彩

架构 运维 mycat 分布式数据库中间件 6月月更

Angular 服务器端渲染应用一个常见的内存泄漏问题

汪子熙

typescript 前端开发 angular Spartacus 6月月更

坚持五件事,带你走出迷茫困境!

博文视点Broadview

《Java编程思想》作者Bruce Eckel新作,到底做了哪些升级?

图灵教育

Java

元素的常用事件

Jason199

js 事件 6月月更

怎样能在小程序中实现视频通话及互动直播功能?

Geek_99967b

小程序 小程序容器 小程序营销

mysql存储引擎之Myisam和Innodb的区别

乌龟哥哥

6月月更

大一学生课设c——服装管理系统

工程师日月

6月月更

Linux开发_摄像头编程(实现拍照、网页监控功能)

DS小龙哥

6月月更

redis 精讲系列介绍八 - 淘汰策略

Nick

Redis 核心技术与实战 6月月更 redis 底层原理 redis 淘汰策略 redis 精讲

【云舟说直播间】-数字安全专场明天下午正式上线

云计算

高效的远程办公经验 | 社区征文

远程办公 6月月更 初夏征文

实战监听Eureka client的缓存更新

程序员欣宸

Java SpringCloud 6月月更

成熟的知识管理,应具备哪些条件?

小炮

运行时应用自我保护(RASP):应用安全的自我修养

SEAL安全

RASP

5 个关于 NFT 的技术漏洞

devpoint

区块链 以太坊 NFT 6月月更

开发增效利器—2022年VsCode插件分享

中原银行

ide vscode 插件 中原银行 降本增效

Kafka ETL 之后,我们将如何定义新一代实时数据集成解决方案?

tapdata

kafka ETL 数据集成 实时数据 DaaS

【愚公系列】2022年06月 Java教学课程 01-Java语言背景介绍

愚公搬代码

6月月更

APM 工具 SkyWalking 是什么

耳东@Erdong

监控 Skywalking 6月月更

quarkus+saas多租户动态数据源切换实现简单完美

weir威尔

SaaS 多租户 Quarkus 动态数据源

消息队列的丢失、重复与积压问题

Damon

6月月更

直播带货app源码搭建中,直播CDN的原理是什么?

开源直播系统源码

软件开发 直播带货 直播系统 app源码

Azure AI Search推出智能会话AI的代理式检索_微软_Steef-Jan Wiggers_InfoQ精选文章