写点什么

谷歌 Vertex AI 推出新的 RAG 引擎

作者:Sergio De Simone

  • 2025-02-11
    北京
  • 本文字数:1442 字

    阅读完需:约 5 分钟

谷歌Vertex AI推出新的RAG引擎

Vertex AI RAG Engine 是一项托管的编排服务,旨在简化大语言模型与外部数据源的连接,它能够帮助模型保持数据更新,生成更贴合需求的答案,并有效减少幻觉。


根据谷歌的说法,新的 RAG Engine 是使用 Vertex AI 实现基于 RAG 的 LLM 的“理想选择”,它在 Vertex AI Search 的易用性与基于底层 Vertex AI API(如文本嵌入 API、排名 API 等)构建自定义 RAG 管道的强大功能之间取得了平衡。


Vertex AI RAG Engine 支持的总体工作流包含了从多种不同来源摄取数据的步骤:数据转换,例如在索引之前将数据拆分为块;嵌入处理,将文本转换为数值向量,以捕捉其语义和上下文;数据索引,构建针对搜索进行了优化语料库;基于用户提示词从知识库中检索相关信息;最后是生成内容,将原始用户查询与检索到的信息结合,生成最终输出。


使用 Vertex AI RAG Engine,你可以很容易地将所有这些步骤集成到自己的解决方案中。集成 Vertex AI RAG Engine 最简单的方式是使用它的 Python 绑定 ,这些绑定位于 google-cloud-aiplatform 包中。在设置 Google Cloud 项目并初始化 Vertex AI 引擎后,你可以使用 upload_file 或 import_file 方法快速从本地文件、Google Cloud Storage 或 Google Drive 中的文档创建语料库。


# Currently supports Google first-party embedding modelsEMBEDDING_MODEL = "publishers/google/models/text-embedding-004"  # @param {type:"string", isTemplate: true}embedding_model_config = rag.EmbeddingModelConfig(publisher_model=EMBEDDING_MODEL)

rag_corpus = rag.create_corpus( display_name="my-rag-corpus", embedding_model_config=embedding_model_config)

rag_file = rag.upload_file( corpus_name=rag_corpus.name, path="test.txt", display_name="test.txt", description="my test file",)
复制代码


在有了语料库之后,你就可以创建一个检索工具,然后将其连接到 LLM,并暴露出端点,你可以使用该端点查询增强后的模型:


# Create a tool for the RAG Corpusrag_retrieval_tool = Tool.from_retrieval(    retrieval=rag.Retrieval(        source=rag.VertexRagStore(            rag_corpora=[rag_corpus.name],            similarity_top_k=10,            vector_distance_threshold=0.5,        ),    ))

# Load tool into Gemini modelrag_gemini_model = GenerativeModel( "gemini-1.5-flash-001", # your self-deployed endpoint tools=[rag_retrieval_tool],)

response = rag_gemini_model.generate_content("What is RAG?")
复制代码


根据谷歌的说法,Vertex AI RAG Engine 特别适合用于个性化投资建议与风险评估、加速药物发现与个性化治疗计划制定,以及增强尽职调查和合同审查等场景。


检索增强生成(RAG)是一种用于 “锚定” 大语言模型的技术,即使其更适合特定用例或企业环境。RAG 的核心是从模型训练时无法访问的外部数据源中检索与特定任务相关的信息,并将这些信息与提示词一起提供给模型。或者也可以通过微调来“锚定”模型,这是一个使用外部数据重新训练模型的过程,即使在提示词中未明确指定,模型也能在每次查询时提供更贴合需求的结果。


锚定模型使其能够更好地理解查询的上下文,并提供额外特定于任务的信息,从而生成更好的答案。更具体地说,在企业数据场景中,锚定旨在通过安全地提供防火墙内的私有数据来克服 LLM 的局限性。


查看英文原文


https://www.infoq.com/news/2025/01/google-vertes-ai-rag-engine/

2025-02-11 16:309668

评论

发布
暂无评论

一次RPC请求过程

1412

c++ 开源 RPC workflow srpc

敏捷专题:下一代的飞机交付

DevOps和数字孪生

数字孪生 航空航天 仿真模拟

数字孪生:让ECU在数字环境中“栩栩如生”

DevOps和数字孪生

数字孪生 虚拟ECU 建模仿真

Tampermonkey for Mac(油猴Safari浏览器插件)

展初云

Mac 油猴 Tampermonkey

Mac版本的Java开发工具 IntelliJ IDEA 2023+注册码

展初云

Java Mac IntelliJ IDEA

OpenTiny Vue 支持 Vue2.7 啦!

Kagol

开源 Vue 前端 UI组件库

个头小却很能“打”!合合信息扫描全能王推出A4便携式打印机

合合技术团队

识别 文字 图像 合合信息 扫描全能王

专业强大的CAD绘图软件 CADintosh X 最新激活版

胖墩儿不胖y

Mac软件 CAD绘图 cad工具

对话在行人|中裕能源:基于多业态特点,融合创新数智化应用场景

用友BIP

2023全球商业创新大会 对话在行人

AIGC加速迭代,云栖大会视频云「媒体服务」专场与你共话云智深度融合

阿里云CloudImagine

云计算 视频云 云栖大会

LeetCode题解:剑指 Offer 39. 数组中出现次数超过一半的数字,摩尔投票,JavaScript,详细注释

Lee Chen

JavaScript LeetCode

携程商旅发布“全球影响力计划”

携程商旅

销售易史彦泽:六个点复盘中国 SaaS 的2023

B Impact

开箱即用!教你如何正确使用华为云CodeArts Defect!

华为云PaaS服务小智

云计算 软件开发 华为云 缺陷管理

OmniGraffle Pro for Mac 图表绘制工具 附 注册机

彩云

OmniGraffle Pro

详解GuassDB数据库权限命令:GRANT和REVOKE

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟

DataGrip for Mac(数据库管理工具) 2023.2.3+注册码

展初云

Mac datagrip 数据库管理

火山引擎DataLeap背后的支持者 - 工作流编排调度系统FlowX

字节跳动数据平台

大数据 数据中台 数据安全 数据研发 企业号10月PK榜

BDD模式的自动化测试初体验

QE_LAB

自动化测试 BDD 测试自动化工具

新一代云原生可观测平台之CCE服务监控篇

华为云原生团队

云计算 容器 微服务 云原生

VMware Workstation 17安装教程之轻松构建虚拟机

小齐写代码

谷歌Vertex AI推出新的RAG引擎_AI&大模型_InfoQ精选文章