写点什么

Azure AI Search 推出智能会话 AI 的代理式检索

  • 2025-06-05
    北京
  • 本文字数:1083 字

    阅读完需:约 4 分钟

大小:531.50K时长:03:01
Azure AI Search推出智能会话AI的代理式检索

微软已经在Azure AI Search中推出了代理式检索(Agentic Retrieval)的公开预览版,这是一个能够为复杂问题自动规划和执行检索策略的查询引擎。根据该公司的说法,与传统的 RAG 相比,它将会话AI中的答案相关性提高了40%。这个多轮系统利用会话历史和 Azure OpenAI 将查询分解为专注的子查询,并在文本和向量嵌入中并行执行。

 

这个新功能是通过2025-05-01-preview数据平面REST API和Azure SDK预发布包中的一个新知识智能体对象以编程方式支持的。它建立在 Azure AI Search 的现有索引、一个链接到 Azure OpenAI 的专用“智能体”资源以及编排整个过程的检索引擎之上。微软将代理式检索定位为构建更复杂的知识检索系统的关键一步,这些系统明确为智能智能体而设计,并为下游消费提供高质量的基础数据。

 

根据文档,代理式检索过程包括以下几个阶段:首先,一个大型语言模型(LLM)分析整个聊天线程以识别核心信息。随后,它规划一个包含聊天历史和原始查询的检索策略。接下来,每个子查询同时运行,利用 Azure AI Search 的关键词和语义搜索能力。在微软 Build 大会上,Matthew Gotteiner解释道

 

值得注意的是,代理式检索的整体速度与生成的子查询的数量直接相关。虽然并行运行子查询的目的是加快进程,但需要大量子查询的更复杂查询自然需要花费更长的时间来完成。反直觉的是,一个生成较少、更广泛子查询的“迷你”查询规划器可能会比一个旨在创建大量高度专注子查询的“全尺寸”规划器能更快地返回结果。

 

结果使用平台的语义排名器重新排名,形成一个包含顶级命中和结构化元数据的统一基础载荷。最后,API 还将返回检索过程的详细活动日志。


(来源:微软技术社区博客文章

 

微软的软件工程师 Akshay Kokane 在一篇 Medium博客文章中总结道:

 

传统的 RAG 系统是增强 LLMs 特定领域知识的一个很好的起点——特别是当使用像 Semantic Kernel 和 Azure AI Search 这样的工具时,这些工具简化了嵌入和检索。然而,随着企业用例变得更加复杂,静态、线性工作流程的局限性变得更加明显。

 

代理式 RAG(Agentic RAG,ARAG)通过引入动态推理、智能工具选择和迭代细化来填补这一空白。智能体可以调整它们的搜索策略,评估结果,并构建更精确的上下文感知答案——这使得它们非常适用于不断演变的业务需求、合规工作流程或多源数据环境。

 

最后,公共预览版目前在特定地区可用,代理式检索定价包括 Azure OpenAI 的查询规划和 Azure AI Search 的语义排名的每令牌计费,这两项在最初的预览版本中都是免费的。并且为开发人员提供了与 Azure AI 智能体服务集成的文档食谱指导

 

原文链接:

https://www.infoq.com/news/2025/05/azure-ai-search-agent-retrieval/

2025-06-05 10:294851

评论

发布
暂无评论

协同存储,为边缘计算创造更大价值

阿里云CloudImagine

云计算 边缘计算

GPT-4问世;LLM训练指南;纯浏览器跑Stable Diffusion

OneFlow

人工智能 深度学习

pix2pix3D:只需编辑标签,就能生成更逼真的三维图像

Zilliz

ChunJun 顺利晋级“2022 年中国开源创新大赛”决赛,并荣获“优秀开源项目/社区”奖项

袋鼠云数栈

开源

得物榜单|全链路生产迁移及B/C端数据存储隔离

得物技术

运维 生产

行云管家堡垒机客服电话是多少?谁知道?

行云管家

网络安全 数据安全 堡垒机 行云管家

C#滑动拼图验证码实现笔记

宙哈哈

C# html 验证码

2023最新版Java面试八股文大全PDF版限时分享,含700道高频面试题

Java你猿哥

Java ssm Java 面试 面经 春招

3 月 16 日晚 8 点,陪你一起从 CentOS 迁移到 OpenCloudOS!

OpenCloudOS

Linux

IDEA 插件最佳组合:JRebel+XRebel 热部署和接口分析优化,太爽了

Java你猿哥

Java Spring Boot ssm IDEA 热部署

如何提升运维的效率,可以用小程序试试

没有用户名丶

LED显示屏与LCD拼接屏的对比

Dylan

PC LCD1602液晶显示屏 LED显示屏

应用内支付服务现网、沙盒环境下常见关键事件的对比与总结

HarmonyOS SDK

HMS Core

在昇腾平台上对TensorFlow网络进行性能调优

华为云开发者联盟

人工智能 华为云 昇腾 华为云开发者联盟 企业号 3 月 PK 榜

透过现象看Java AIO的本质 | 得物技术

得物技术

后端 Java】

火山引擎数智平台VeDI 帮助智能投影仪更懂用户需求

字节跳动数据平台

营销数字化 业务增长 用户运营 企业号 1 月 PK 榜

深圳高新技术企业申请条件以及流程简单说明

行云管家

高新企业 高新技术 高新

DNS、硬件、LVS、Nginx该如何搭配?

源字节1号

前端开发 后端开发 小程序开发,软件开发

树莓派+阿里云IoT人脸识别场景实战——业务系统架构类

阿里云AIoT

Python JavaScript 物联网 对象存储 Web App开发

强烈推荐!阿里架构师纯手写的大型分布式项目《凤凰架构》手册

Java你猿哥

Java 架构 微服务 微服务架构 面经

认识一下,我们是应用社交「幕后大佬」 IM 家族

融云 RongCloud

即时通讯 IM

“伯乐”流量调控平台工程视角 | 得物技术

得物技术

运营 架构-

NCCL源码解析①:初始化及ncclUniqueId的产生

OneFlow

人工智能 深度学习

火山引擎DataLeap:一家企业,数据体系要怎么搭建?

字节跳动数据平台

大数据 数据架构 数据治理 数据研发 企业号 3 月 PK 榜

火山引擎DataTester:A/B实验如何应用在抖音的产品优化流程中?

字节跳动数据平台

大数据 云服务 AB testing实战 ab测试 企业号 3 月 PK 榜

LP流动性质押挖矿dapp系统开发分红模式定制

开发v-hkkf5566

【小程序案例】支付宝小程序-MQTT模器,IoT设备通过WSS接入阿里云IoT物联网平台——设备接入类

阿里云AIoT

JavaScript windows 物联网

高级数据库管理:SQLPro for SQLite激活版

真大的脸盆

数据库 Mac 数据库管理工具 数据库管理 Mac 软件

狂野之心 The Wild at Heart for Mac (魔法森林冒险游戏)

互联网搬砖工作者

DockQuery | 成为信创产业“关键码”

BinTools图尔兹

数据库 信创产业 国产数据库工具 DockQuery

【总结】Java实现短信验证码

宙哈哈

Java 验证码

Azure AI Search推出智能会话AI的代理式检索_AI&大模型_Steef-Jan Wiggers_InfoQ精选文章