写点什么

Azure AI Search 推出智能会话 AI 的代理式检索

  • 2025-06-05
    北京
  • 本文字数:1083 字

    阅读完需:约 4 分钟

大小:531.50K时长:03:01
Azure AI Search推出智能会话AI的代理式检索

微软已经在Azure AI Search中推出了代理式检索(Agentic Retrieval)的公开预览版,这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法,与传统的 RAG 相比,它将会话AI中的答案相关性提高了40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询,并在文本和向量嵌入中并行执行。

 

这个新功能是通过2025-05-01-preview数据平面REST API和Azure SDK预发布包中的一个新知识智能体对象以编程方式支持的。它建立在 Azure AI Search 的现有索引、一个链接到 Azure OpenAI 的专用“智能体”资源以及编排整个过程的检索引擎之上。微软将代理式检索定位为构建更复杂的知识检索系统的关键一步,这些系统明确为智能智能体而设计,并为下游消费提供高质量的基础数据。

 

根据文档,代理式检索过程包括以下几个阶段:首先,一个大型语言模型(LLM)分析整个聊天线程以识别核心信息。随后,它规划一个包含聊天历史和原始查询的检索策略。接下来,每个子查询同时运行,利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 大会上,Matthew Gotteiner解释道

 

值得注意的是,代理式检索的整体速度与生成的子查询的数量直接相关。虽然并行运行子查询的目的是加快进程,但需要大量子查询的更复杂查询自然需要花费更长的时间来完成。反直觉的是,一个生成较少、更广泛子查询的“迷你”查询规划器可能会比一个旨在创建大量高度专注子查询的“全尺寸”规划器能更快地返回结果。

 

结果使用平台的语义排名器重新排名,形成一个包含顶级命中和结构化元数据的统一基础载荷。最后,API 还将返回检索过程的详细活动日志。


(来源:微软技术社区博客文章

 

微软的软件工程师 Akshay Kokane 在一篇 Medium博客文章中总结道:

 

传统的 RAG 系统是增强 LLMs 特定领域知识的一个很好的起点——特别是当使用像 Semantic Kernel 和 Azure AI Search 这样的工具时,这些工具简化了嵌入和检索。然而,随着企业用例变得更加复杂,静态、线性工作流程的局限性变得更加明显。

 

代理式 RAG(Agentic RAG,ARAG)通过引入动态推理、智能工具选择和迭代细化来填补这一空白。智能体可以调整它们的搜索策略,评估结果,并构建更精确的上下文感知答案——这使得它们非常适用于不断演变的业务需求、合规工作流程或多源数据环境。

 

最后,公共预览版目前在特定地区可用,代理式检索定价包括 Azure OpenAI 的查询规划和 Azure AI Search 的语义排名的每令牌计费,这两项在最初的预览版本中都是免费的。并且为开发人员提供了与 Azure AI 智能体服务集成的文档食谱指导

 

原文链接:

https://www.infoq.com/news/2025/05/azure-ai-search-agent-retrieval/

2025-06-05 10:295015

评论

发布
暂无评论

GPT-4:不open的OpenAI,终于不再编造事实

鼎道智联

openai ChatGPT4

Go Slice 扩容的这些坑你踩过吗?

王中阳Go

Go golang 高效工作 学习方法 面试题

GO语言集成开发: GoLand 2022 中文激活版

真大的脸盆

Mac 代码开发 Mac 软件 代码编辑 代码编辑工具

代码质量与安全 | 免费的静态分析工具好吗?

龙智—DevSecOps解决方案

SAST 静态代码扫描 DAST

见技术大佬,领惊喜好礼!快来领取数据库峰会邀请函!

InfoQ写作社区官方

数据库 云原生 阿里 热门活动 阿里云瑶池数据库峰会

硬核!腾讯大佬最新手打的Spring Boot笔记,从原理到实战再到源码

Java你猿哥

Java Spring Boot 后端 面经

中小企业运维安全审计用什么软件好?有推荐吗?

行云管家

信息安全 堡垒机 运维审计

轻松搞定面试拿offer的Java面试宝典(全彩图文版)24个Java技术栈

Java你猿哥

Java 面试 ssm 面经 java技术栈

AI笔刷怎样导入?adobe ai笔刷安装教程

Rose

AI画笔 AI教程 Illustrator 2023 下载 AI中文版

简单小巧的右键助手:MouseBoost for Mac让您的工作效率大幅度提高

Rose

mac效率工具 右键助手 MouseBoost激活版

Portraiture最新版插件新增哪些功能?

茶色酒

Portraiture4

币安欧意交易所合约跟单平台软件开发详情(api对接)

开发微hkkf5566

美团二面特点:喜欢写一个 SQL 语句,然后问你加了哪些锁!

Java你猿哥

Java 数据库 sql ssm InnoDB存储引擎

Neural Filters神经滤镜插件如何安装?PS神经滤镜插件安装教程

Rose

mac系统 Neural Filters PS滤镜插件 PS20221下载

StyleGAN 生成 AI 虚拟人脸,再也不怕侵犯肖像权

江户川码农

人工智能 AI 图像处理 StyleGAN 人脸生成

如何基于 Apache Doris 与 Apache Flink 快速构建极速易用的实时数仓

SelectDB

flink 数据湖 实时数仓 Doris 数据库、

京东三面:说说synchronized和volatile的区别

Java你猿哥

Java 面试 ssm 面经 Java多线程

CorelDRAW Graphics Suite2023功能介绍

茶色酒

cdr2023

EMQ&南洋万邦云边一体化方案:激活数据潜力,打造智慧工业园区

EMQ映云科技

物联网 IoT 工业互联网 智能制造 企业号 3 月 PK 榜

TechBits | TCP 使用 WireShark 进行抓包

Java你猿哥

Java 后端 ssm

阿里巴巴灵魂一问:说说触发HashMap死循环根因

Java你猿哥

Java jdk 后端 ssm

Perforce研讨会回顾 | Helix Core在芯片行业的应用实例:芯片项目的版本控制、持续集成及自动化

龙智—DevSecOps解决方案

ci cicd 版本控制 持续集成 芯片开发

Atlassian Server用户新选择 | 迁移到数据中心版前,您需要做这些准备(1)

龙智—DevSecOps解决方案

Atlassian Atlassian迁移 数据中心版 server版

【IT小知识】扩容是什么意思?扩容的近义词有哪些?

行云管家

扩容 IT运维

代码实战带你了解深度学习中的混合精度训练

华为云开发者联盟

人工智能 深度学习 华为云 华为云开发者联盟 企业号 3 月 PK 榜

如何利用ChatGPT搞科研?

Openlab_cosmoplat

人工智能 开源社区 ChatGPT

Java体系最强干货分享—挑战40天准备Java面试,最快拿到offer!

Java你猿哥

Java 后端 ssm 面经 春招

Apache Doris 1.2.3 Release 版本正式发布

SelectDB

数据仓库 数据湖 Doris 数据湖Catalog catalog

MQTT 5.0特性Inflight Window&Message Queue

EMQ映云科技

物联网 IoT mqtt emqx 企业号 3 月 PK 榜

Azure AI Search推出智能会话AI的代理式检索_AI&大模型_Steef-Jan Wiggers_InfoQ精选文章