写点什么

Azure AI Search 推出智能会话 AI 的代理式检索

  • 2025-06-05
    北京
  • 本文字数:1083 字

    阅读完需:约 4 分钟

大小:531.50K时长:03:01
Azure AI Search推出智能会话AI的代理式检索

微软已经在Azure AI Search中推出了代理式检索(Agentic Retrieval)的公开预览版,这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法,与传统的 RAG 相比,它将会话AI中的答案相关性提高了40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询,并在文本和向量嵌入中并行执行。

 

这个新功能是通过2025-05-01-preview数据平面REST API和Azure SDK预发布包中的一个新知识智能体对象以编程方式支持的。它建立在 Azure AI Search 的现有索引、一个链接到 Azure OpenAI 的专用“智能体”资源以及编排整个过程的检索引擎之上。微软将代理式检索定位为构建更复杂的知识检索系统的关键一步,这些系统明确为智能智能体而设计,并为下游消费提供高质量的基础数据。

 

根据文档,代理式检索过程包括以下几个阶段:首先,一个大型语言模型(LLM)分析整个聊天线程以识别核心信息。随后,它规划一个包含聊天历史和原始查询的检索策略。接下来,每个子查询同时运行,利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 大会上,Matthew Gotteiner解释道

 

值得注意的是,代理式检索的整体速度与生成的子查询的数量直接相关。虽然并行运行子查询的目的是加快进程,但需要大量子查询的更复杂查询自然需要花费更长的时间来完成。反直觉的是,一个生成较少、更广泛子查询的“迷你”查询规划器可能会比一个旨在创建大量高度专注子查询的“全尺寸”规划器能更快地返回结果。

 

结果使用平台的语义排名器重新排名,形成一个包含顶级命中和结构化元数据的统一基础载荷。最后,API 还将返回检索过程的详细活动日志。


(来源:微软技术社区博客文章

 

微软的软件工程师 Akshay Kokane 在一篇 Medium博客文章中总结道:

 

传统的 RAG 系统是增强 LLMs 特定领域知识的一个很好的起点——特别是当使用像 Semantic Kernel 和 Azure AI Search 这样的工具时,这些工具简化了嵌入和检索。然而,随着企业用例变得更加复杂,静态、线性工作流程的局限性变得更加明显。

 

代理式 RAG(Agentic RAG,ARAG)通过引入动态推理、智能工具选择和迭代细化来填补这一空白。智能体可以调整它们的搜索策略,评估结果,并构建更精确的上下文感知答案——这使得它们非常适用于不断演变的业务需求、合规工作流程或多源数据环境。

 

最后,公共预览版目前在特定地区可用,代理式检索定价包括 Azure OpenAI 的查询规划和 Azure AI Search 的语义排名的每令牌计费,这两项在最初的预览版本中都是免费的。并且为开发人员提供了与 Azure AI 智能体服务集成的文档食谱指导

 

原文链接:

https://www.infoq.com/news/2025/05/azure-ai-search-agent-retrieval/

2025-06-05 10:294893

评论

发布
暂无评论

企业数字化转型选用“低代码平台”的8条建议!

优秀

低代码

一萌妹子的面试经历,美团四面三小时,成功拿到Java岗offer

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

密码学系列之:bcrypt加密算法详解

程序那些事

算法 加密解密 密码学 程序那些事

web技术分享| 前端秘籍之“易容”术

anyRTC开发者

人工智能 大前端 音视频 web技术分享

小红书严惩刷量行为:如何才能优雅的种草

石头IT视角

阿里大牛肝出的443页TCP/IP协议趣谈笔记,竟然在GitHub标星27k+

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

眼界大开 声临其境丨胡宜峰:视频深度伪造检测技术在内容安全领域的探索与实践

网易云信

人工智能 深度学习 音视频

新基建+新科技,智慧港口船舶抢抓数字化转型先机

一只数据鲸鱼

数据可视化 智慧港口 智慧船舶 智慧码头

AD域是什么意思?有什么用?

行云管家

服务器 内网 AD域

对象存储手把手教五 | 数据存取与加密

QingStor分布式存储

对象存储 分布式存储 数据加密

阿里内部进阶资料:24w字的Java面试宝典,竟然在GitHub霸榜月余

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

企业级数据融合平台上线,DataPipeline助力中国最大保险公司海外业务再创佳绩!

DataPipeline数见科技

选择低代码应用程序开发框架的5个关键标准

低代码小观

程序员 低代码 企业开发 低代码开发 开发框架

Vite + Vue3 + OpenLayers 弹窗

德育处主任

大前端 地图 vite Vue3 openlayers

程序员35岁后的发展,欢迎一起来讨论

hanaper

腾讯看点CTO徐羽: QQ浏览器背后的推荐AI中台 | AICon

博文视点Broadview

双赞的一体机主板能应用到哪些行业?

双赞工控

DataPipeline助力国际知名物流服务商,打造供应链改革新样本!

DataPipeline数见科技

什么是运维?怎样快速做好运维工作?

行云管家

云计算 运维 服务器 云运维

Python中使用定时调度任务(Schedule Jobs)的5种方式

Regan Yue

Python 调度 9月日更

OpenMetric与时序数据库模型之主流TSDB分析

华为云开发者联盟

Prometheus Influxdb 时序数据库 tsdb OpenMetric

浅谈百度阅读/文库NA端排版技术

百度Geek说

大前端 百度文库

发布半小时登上GitHub首页的Spring Boot实战笔记,竟是京东T8编写

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

牛皮了!阿里大佬总结的图解Java手册在GitHub火了,完整版开源中

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

Alibaba内部最新Java架构核心宝典 (全彩版小册开源)

Java 程序员 架构 面试 计算机

Python基础综合练习1

在即

9月日更

共助数据自主创新生态|DataPipeline实时数据融合平台与华为云GaussDB数据库完成兼容互认证

DataPipeline数见科技

意外发现GitHub 星标35k+ 435页网络协议深度笔记,出自华为架构师

公众号_愿天堂没有BUG

Java 编程 程序员 架构 面试

vue3,对比 vue2 有什么优点?

华为云开发者联盟

Vue Vue3 vue2 diff算法 渲染API

全链路压测流量模型

FunTester

性能测试 全链路压测 FunTester 灰度分流 流量回放

盘点 | 主流云原生数据库技术方案

RadonDB

数据库 云原生

Azure AI Search推出智能会话AI的代理式检索_AI&大模型_Steef-Jan Wiggers_InfoQ精选文章