
微软已经在Azure AI Search中推出了代理式检索(Agentic Retrieval)的公开预览版,这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法,与传统的 RAG 相比,它将会话AI中的答案相关性提高了40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询,并在文本和向量嵌入中并行执行。
这个新功能是通过2025-05-01-preview数据平面REST API和Azure SDK预发布包中的一个新知识智能体对象以编程方式支持的。它建立在 Azure AI Search 的现有索引、一个链接到 Azure OpenAI 的专用“智能体”资源以及编排整个过程的检索引擎之上。微软将代理式检索定位为构建更复杂的知识检索系统的关键一步,这些系统明确为智能智能体而设计,并为下游消费提供高质量的基础数据。
根据文档,代理式检索过程包括以下几个阶段:首先,一个大型语言模型(LLM)分析整个聊天线程以识别核心信息。随后,它规划一个包含聊天历史和原始查询的检索策略。接下来,每个子查询同时运行,利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 大会上,Matthew Gotteiner解释道:
值得注意的是,代理式检索的整体速度与生成的子查询的数量直接相关。虽然并行运行子查询的目的是加快进程,但需要大量子查询的更复杂查询自然需要花费更长的时间来完成。反直觉的是,一个生成较少、更广泛子查询的“迷你”查询规划器可能会比一个旨在创建大量高度专注子查询的“全尺寸”规划器能更快地返回结果。
结果使用平台的语义排名器重新排名,形成一个包含顶级命中和结构化元数据的统一基础载荷。最后,API 还将返回检索过程的详细活动日志。

(来源:微软技术社区博客文章)
微软的软件工程师 Akshay Kokane 在一篇 Medium博客文章中总结道:
传统的 RAG 系统是增强 LLMs 特定领域知识的一个很好的起点——特别是当使用像 Semantic Kernel 和 Azure AI Search 这样的工具时,这些工具简化了嵌入和检索。然而,随着企业用例变得更加复杂,静态、线性工作流程的局限性变得更加明显。
代理式 RAG(Agentic RAG,ARAG)通过引入动态推理、智能工具选择和迭代细化来填补这一空白。智能体可以调整它们的搜索策略,评估结果,并构建更精确的上下文感知答案——这使得它们非常适用于不断演变的业务需求、合规工作流程或多源数据环境。
最后,公共预览版目前在特定地区可用,代理式检索定价包括 Azure OpenAI 的查询规划和 Azure AI Search 的语义排名的每令牌计费,这两项在最初的预览版本中都是免费的。并且为开发人员提供了与 Azure AI 智能体服务集成的文档、食谱和指导。
原文链接:
https://www.infoq.com/news/2025/05/azure-ai-search-agent-retrieval/
评论