2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

微软推出 CoRAG:通过迭代推理提升 AI 检索能力

作者:Robert Krzaczyński

  • 2025-03-05
    北京
  • 本文字数:1350 字

    阅读完需:约 4 分钟

微软推出CoRAG:通过迭代推理提升AI检索能力

微软人工智能团队与中国人民大学合作,推出了 CoRAG(检索增强生成链 Chain-of-Retrieval Augmented Generation),这是一种全新的人工智能框架,旨在优化检索增强生成(Retrieval-Augmented Generation,RAG)模型。与传统 RAG 系统仅依赖单次检索不同,CoRAG 支持迭代搜索和推理,使得人工智能模型在生成答案前能够动态优化检索结果。


这一改进弥补了传统 RAG 系统的重大缺陷:传统 RAG 系统难以有效整合多源信息。在处理复杂查询,尤其是多跳问答(QA)时,传统 RAG 模型往往力不从心,因为它们仅检索一次信息,这就导致结果不完整或不准确。CoRAG 则通过在每一步重新构建查询来改变这一现状,使人工智能能够像人类研究人员一样“深入思考”检索过程。


CoRAG 的核心创新在于其动态查询重构机制。该模型不再依赖单次检索,而是根据中间推理状态迭代优化查询。这一过程确保了每个阶段检索到的信息都与上下文相关,进而逐步构建出更完整的最终答案。


为了能在无需大量昂贵的人工标注的情况下训练 CoRAG,研究人员采用了 拒绝采样技术(Rejection Sampling),即从现有的 RAG 数据集中生成合理的检索链。模型在这些增强数据集上进行训练,学习生成子查询、子答案和最终答案。


在推理阶段,CoRAG 提供了多种灵活的解码策略,比如:


  • 为提高效率的贪心解码;

  • 为优化准确性的 N 选 1 采样;

  • 为平衡计算成本和性能的树搜索。


这种可扩展性使用户能够控制检索深度,在准确性和计算效率之间实现最佳平衡。



图注:来源:https://arxiv.org/abs/2501.14342


CoRAG 在 KILT 基准测试和多跳问答任务上进行了测试,与现有的 RAG 模型相比,其效果得到了提升。在需要从多个来源检索和整合信息的任务中,该方法尤为有效。



图注:KILT 基准测试结果,来源:https://arxiv.org/abs/2501.14342



图注:多跳问答任务基准测试结果,来源:https://arxiv.org/abs/2501.14342


人工智能领域已经注意到了 CoRAG 的潜在影响力。Durapid Technologies 的创始人兼首席执行官迪普什·贾恩(Deepesh Jain)评价道:> “这是 RAG 向前迈出的一大步!传统方法常常遗漏关键细节,而 CoRAG 的迭代方法让检索更智能、更具动态性。让模型像人类一样优化搜索,有望为复杂查询提供更好的答案。”


此外,Velotix 的高级机器学习工程师叶卡捷琳娜·巴鲁(Ekaterina Baru)强调了该方法与人类研究方法的相似之处:> “这是一种引人入胜的方法——利用迭代检索优化查询,真实地反映了研究人员深入探究问题的过程。它在多跳问答任务上的性能提升令人印象深刻,我很好奇在实际应用中,更长的检索链和计算成本之间的平衡将如何发展。期待看到它的后续进展!”


从静态检索转向迭代方法,CoRAG 开创了一种全新的人工智能搜索和推理处理方式。这在自动研究、企业知识系统以及人工智能辅助决策等领域具有重要价值,因为在这些领域中,获取准确且结构化的信息至关重要。


关于作者


Robert Krzaczyński,Robert Krzaczyński 是一名专注于微软技术的软件工程师。日常工作中,他主要使用.NET 进行软件开发,但他的兴趣远不止于此。除了核心专业技能外,他对机器学习和人工智能有着浓厚的兴趣,并不断在这些前沿领域拓展自己的知识。他拥有控制工程与机器人学的工程学学士学位以及计算机科学的工程学硕士学位。


原文链接:


https://www.infoq.com/news/2025/02/corag-microsoft-ai/

2025-03-05 14:004094

评论

发布
暂无评论

国内外开源数据可视化工具对比:DataEase 与 MetaBase 对比

搞大屏的小北

DataEase Metabase 开源数据可视化

线上GC故障:CMSGC太频繁,你知道这是什么鬼?

Java永远的神

程序员 性能优化 JVM java面试 GC

是不是你在找的推特GIF动图下载方法?!支持苹果安卓双系统使用!

frank

twitter 推特视频下载

贾斯特里尼&布鲁克斯葡萄酒,历经百年的传世经典

联营汇聚

DataEase 做出来好看吗?

搞大屏的小北

数据可视化 大屏可视化 DataEase

关于佛萨奇系统开发及原力元宇宙2.0佛萨奇系统开发方案

I8O28578624

葡萄酒越贵越好?贾斯特里尼&布鲁克斯刷新你的认知

联营汇聚

转转实时OLAP分析场景技术选型与应用实践

转转技术团队

OLAP

微信开放小程序运行SDK,自己的app也能运行小程序

Onegun

微信小程序 小程序容器

【大屏设计】数据大屏间距那点事-距离产生美

搞大屏的小北

大屏布局 报表布局 看板布局排版

全网首发!华为云UCS正式商用

爱科技的水月

让数据说话-中国农业经济发展情况

搞大屏的小北

数据可视化 经济可视化 经济发展

有序存储对于高性能的意义

陈橘又青

算法

HVML 解释器 PurC 0.9.2 发布;持续演进!

hvmlenvoy

编程语言 解释器 HVML

想做运维审计大屏?用这个工具就对了!

搞大屏的小北

大屏可视化 运维审计 审计大屏

DataEase单点登录之OIDC

搞大屏的小北

keycloak 单点登录 OIDC

极客时间运维进阶训练营第九周作业

老曹

弹性公网IP支持多产品灵活绑定或解绑,能为企业提供独立公网IP资源!

秃头也爱科技

同是弹性公网IP,华为云弹性公网IP的优势有哪些?

秃头也爱科技

vivo 游戏中心低代码平台的提效秘诀

vivo互联网技术

低代码 组件化 配置化 提效

如何接受或拒绝 Excel 中的修订

在下毛毛雨

C# .net Excel 工作表 跟踪修订

预测式外呼算法模型的深度应用详解

中关村科金

人工智能 大数据 AI 智能

使用DataEase分析销售数据有多方便?

搞大屏的小北

数据可视化 销售数据分析 数据展示

实践GoF的23种设计模式:命令模式

华为云开发者联盟

Go 开发 华为云 12 月 PK 榜

华为云连接CC——让多区域协同办公更高效更稳定

秃头也爱科技

拒绝内卷挖掘境外新蓝海,华为云虚拟专用网络VPN有多特别?

爱科技的水月

京东金融APP-新交互技术“虚拟数字人”赋能世界杯主题营销

京东科技开发者

大数据 前端 Web 交互 虚拟人

南京公安研究院与秒云达成生态合作,携手赋能产业智能化发展

MIAOYUN

智慧公安 生态合作

用品质提升品味,贾斯特里尼&布鲁克斯葡萄酒

联营汇聚

一招搞定小白最头疼的数据大屏配色问题!

搞大屏的小北

色彩匹配 大屏配色

【JVM规范】第三章-Java虚拟机编译

四月

Java JVM

微软推出CoRAG:通过迭代推理提升AI检索能力_AI&大模型_InfoQ精选文章