写点什么

微软推出 CoRAG:通过迭代推理提升 AI 检索能力

作者:Robert Krzaczyński

  • 2025-03-05
    北京
  • 本文字数:1350 字

    阅读完需:约 4 分钟

微软推出CoRAG:通过迭代推理提升AI检索能力

微软人工智能团队与中国人民大学合作,推出了 CoRAG(检索增强生成链 Chain-of-Retrieval Augmented Generation),这是一种全新的人工智能框架,旨在优化检索增强生成(Retrieval-Augmented Generation,RAG)模型。与传统 RAG 系统仅依赖单次检索不同,CoRAG 支持迭代搜索和推理,使得人工智能模型在生成答案前能够动态优化检索结果。


这一改进弥补了传统 RAG 系统的重大缺陷:传统 RAG 系统难以有效整合多源信息。在处理复杂查询,尤其是多跳问答(QA)时,传统 RAG 模型往往力不从心,因为它们仅检索一次信息,这就导致结果不完整或不准确。CoRAG 则通过在每一步重新构建查询来改变这一现状,使人工智能能够像人类研究人员一样“深入思考”检索过程。


CoRAG 的核心创新在于其动态查询重构机制。该模型不再依赖单次检索,而是根据中间推理状态迭代优化查询。这一过程确保了每个阶段检索到的信息都与上下文相关,进而逐步构建出更完整的最终答案。


为了能在无需大量昂贵的人工标注的情况下训练 CoRAG,研究人员采用了 拒绝采样技术(Rejection Sampling),即从现有的 RAG 数据集中生成合理的检索链。模型在这些增强数据集上进行训练,学习生成子查询、子答案和最终答案。


在推理阶段,CoRAG 提供了多种灵活的解码策略,比如:


  • 为提高效率的贪心解码;

  • 为优化准确性的 N 选 1 采样;

  • 为平衡计算成本和性能的树搜索。


这种可扩展性使用户能够控制检索深度,在准确性和计算效率之间实现最佳平衡。



图注:来源:https://arxiv.org/abs/2501.14342


CoRAG 在 KILT 基准测试和多跳问答任务上进行了测试,与现有的 RAG 模型相比,其效果得到了提升。在需要从多个来源检索和整合信息的任务中,该方法尤为有效。



图注:KILT 基准测试结果,来源:https://arxiv.org/abs/2501.14342



图注:多跳问答任务基准测试结果,来源:https://arxiv.org/abs/2501.14342


人工智能领域已经注意到了 CoRAG 的潜在影响力。Durapid Technologies 的创始人兼首席执行官迪普什·贾恩(Deepesh Jain)评价道:> “这是 RAG 向前迈出的一大步!传统方法常常遗漏关键细节,而 CoRAG 的迭代方法让检索更智能、更具动态性。让模型像人类一样优化搜索,有望为复杂查询提供更好的答案。”


此外,Velotix 的高级机器学习工程师叶卡捷琳娜·巴鲁(Ekaterina Baru)强调了该方法与人类研究方法的相似之处:> “这是一种引人入胜的方法——利用迭代检索优化查询,真实地反映了研究人员深入探究问题的过程。它在多跳问答任务上的性能提升令人印象深刻,我很好奇在实际应用中,更长的检索链和计算成本之间的平衡将如何发展。期待看到它的后续进展!”


从静态检索转向迭代方法,CoRAG 开创了一种全新的人工智能搜索和推理处理方式。这在自动研究、企业知识系统以及人工智能辅助决策等领域具有重要价值,因为在这些领域中,获取准确且结构化的信息至关重要。


关于作者


Robert Krzaczyński,Robert Krzaczyński 是一名专注于微软技术的软件工程师。日常工作中,他主要使用.NET 进行软件开发,但他的兴趣远不止于此。除了核心专业技能外,他对机器学习和人工智能有着浓厚的兴趣,并不断在这些前沿领域拓展自己的知识。他拥有控制工程与机器人学的工程学学士学位以及计算机科学的工程学硕士学位。


原文链接:


https://www.infoq.com/news/2025/02/corag-microsoft-ai/

2025-03-05 14:004004

评论

发布
暂无评论

ZAB 与 Paxos:分布式一致性算法的工程实践与深度对比

异常君

zookeeper 分布式 ZAB PAXOS Java.

IPv6检测指标中的IPv6授权体系是什么意思?(国科云)

国科云

Ableton Live 12 Suite for mac v12.2中文:音乐制作软件

晨光熹微

怎么才能知道你的Mac的系统性能呢?Geekbench 5性能测试

Rose

mac苹果设备电量信息实时显示AirBattery免费

Rose

如何使用CAD看图软件放大图纸文字?

在路上

cad cad看图 CAD看图王

AI 技术在图书馆业务中的应用

北京木奇移动技术有限公司

软件外包公司 AI技术应用 图书馆信息化

动漫与游戏产业用到堡垒机的必要性你知道吗?

行云管家

网络安全 等保 堡垒机 游戏行业

现代财务——智能技术背景下的企业变革

智达方通

全面预算管理 财务管理

2025校招/社招Java八股文面试题库,横扫大厂后端岗

Geek_Yin

Java 程序员 java面试 Java面试题

整合YashanDB数据库与人工智能技术的优势

数据库砖家

三大 Mac 软件下载站,总有一款适合你!

晨光熹微

基于生成式物理引擎的AI模型训练方法论

申公豹

人工智能

电线电缆行业MES系统:实现智能制造与全流程追溯

万界星空科技

制造业 mes 万界星空科技mes 电线电缆行业 电线电缆mes

这几道Java集合框架面试题在面试中几乎必问

Geek_Yin

Java 程序员 java面试 Java面试题

苹果macOS 26兼容设备 macos 26完整pkg安装程序

Rose

鸿蒙Next仓颉语言开发实战教程:订单列表

幽蓝计划

【JeecgBoot AIGC】AI知识库实战应用与搭建

JEECG低代码

AI大模型 AI应用 AIGC JeecgBoot

Hype 4 Pro 4.1.19 - 创建动画和交互式的Web内容

Rose

CAD看图软件可以进行标注吗?

在路上

cad cad看图 CAD看图王

Ableton Live 12 Suite v12.2中文版注册机+许可证

Rose

苹果访达Finder增强工具TotalFinder 中文版,让效率提升!

Rose

云原生数据库架构设计指南——基于YashanDB的方案解析

数据库砖家

3D数字绘画和雕刻 Mudbox 2025新功能

Rose

火热报名中丨暨2025第三届中国SRE大会,将于6月26日在上海召开

雅菲奥朗

AI 可观测性 2025SRE大会

优化YashanDB查询逻辑提高响应速度

数据库砖家

简单了解一下数据安全定义以及意义

行云管家

网络安全 数据安全 堡垒机

四维图新与阿里云达成战略合作,联合打造汽车行业一揽子解决方案

科技汇

梁汝波:字节跳动要以持续智能突破,坚定服务产业应用

新消费日报

感谢艾瑞白皮书“点名”,但网易的挖掘机器人真不是“打游戏送的”

网易伏羲

数字孪生 人机协作 网易伏羲 工程机械

流批一体向量化引擎Flex

Apache Flink

大数据 flink 流批一体

微软推出CoRAG:通过迭代推理提升AI检索能力_AI&大模型_InfoQ精选文章