Azure AI Search推出智能会话AI的代理式检索

微软已经在Azure AI Search中推出了代理式检索（Agentic Retrieval）的公开预览版，这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法，与传统的 RAG 相比，它将会话AI中的答案相关性提高了40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询，并在文本和向量嵌入中并行执行。

这个新功能是通过2025-05-01-preview数据平面REST API和Azure SDK预发布包中的一个新知识智能体对象以编程方式支持的。它建立在 Azure AI Search 的现有索引、一个链接到 Azure OpenAI 的专用“智能体”资源以及编排整个过程的检索引擎之上。微软将代理式检索定位为构建更复杂的知识检索系统的关键一步，这些系统明确为智能智能体而设计，并为下游消费提供高质量的基础数据。

根据文档，代理式检索过程包括以下几个阶段：首先，一个大型语言模型（LLM）分析整个聊天线程以识别核心信息。随后，它规划一个包含聊天历史和原始查询的检索策略。接下来，每个子查询同时运行，利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 大会上，Matthew Gotteiner解释道：

值得注意的是，代理式检索的整体速度与生成的子查询的数量直接相关。虽然并行运行子查询的目的是加快进程，但需要大量子查询的更复杂查询自然需要花费更长的时间来完成。反直觉的是，一个生成较少、更广泛子查询的“迷你”查询规划器可能会比一个旨在创建大量高度专注子查询的“全尺寸”规划器能更快地返回结果。

结果使用平台的语义排名器重新排名，形成一个包含顶级命中和结构化元数据的统一基础载荷。最后，API 还将返回检索过程的详细活动日志。

（来源：微软技术社区博客文章）

微软的软件工程师 Akshay Kokane 在一篇 Medium博客文章中总结道：

传统的 RAG 系统是增强 LLMs 特定领域知识的一个很好的起点——特别是当使用像 Semantic Kernel 和 Azure AI Search 这样的工具时，这些工具简化了嵌入和检索。然而，随着企业用例变得更加复杂，静态、线性工作流程的局限性变得更加明显。

代理式 RAG（Agentic RAG，ARAG）通过引入动态推理、智能工具选择和迭代细化来填补这一空白。智能体可以调整它们的搜索策略，评估结果，并构建更精确的上下文感知答案——这使得它们非常适用于不断演变的业务需求、合规工作流程或多源数据环境。

最后，公共预览版目前在特定地区可用，代理式检索定价包括 Azure OpenAI 的查询规划和 Azure AI Search 的语义排名的每令牌计费，这两项在最初的预览版本中都是免费的。并且为开发人员提供了与 Azure AI 智能体服务集成的文档、食谱和指导。

原文链接：

https://www.infoq.com/news/2025/05/azure-ai-search-agent-retrieval/

创作场景

Azure AI Search 推出智能会话 AI 的代理式检索