写点什么

增强 AI 能力:谷歌云在托管数据库中集成向量搜索

作者:Renato Losio

  • 2023-07-15
    北京
  • 本文字数:1127 字

    阅读完需:约 4 分钟

增强AI能力:谷歌云在托管数据库中集成向量搜索

谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了对 pgvector 的支持。这个扩展为托管数据库带来了向量搜索操作,允许开发人员存储大型语言模型(LLM)生成的向量嵌入并执行相似性搜索。


Cloud SQL 和 AlloyDB 现在可以与 Vertex AI 上的生成性 AI 服务配对,帮助创建能够感知应用程序和用户状态的 AI 应用程序。谷歌高级产品经理 Sandhya Ghai 和产品经理 Bala Narasimhan 解释说:


向量嵌入是一种数值表示,通常用于将复杂的用户生成内容(如文本、音频和视频)转换为易于存储、操作和索引的形式。这些表示由嵌入模型生成,如果两个内容在语义上相似,它们各自的嵌入就会在嵌入向量空间中彼此相邻。然后,向量嵌入会被索引,被用于基于相似性进行有效的数据过滤。


例如,开发人员可以使用 Vertex AI 的预训练模型在文本和图像之间生成嵌入,并将它们存储并索引到数据库中,简化查找相似记录的过程。


用户现在可以使用 CREATE EXTENSION 命令在现有的数据库中安装 pgvector 扩展:


postgres=> CREATE EXTENSION IF NOT EXISTS vector;CREATE EXTENSION
postgres=> CREATE TABLE embeddings( id INTEGER, embedding vector(3));CREATE TABLE
postgres=> INSERT INTO embeddings VALUES (1, '[1, 0, -1]'), (2, '[1, 1, 1]'), (3, '[1, 1, 50]');INSERT 0 3
复制代码


来源:https://cloud.google.com/blog/products/databases/using-pgvector-llms-and-langchain-with-google-cloud-databases


正如 Ghai 和 Narasimhan 所解释的那样,这一新功能还可以帮助开发人员利用预训练的 LLM:


我们需要了解的是,LLM 没有状态的概念……嵌入允许你将大型上下文(如文档或历史聊天记录)存储在数据库中,并过滤它们,以便查找最相关的信息。然后,你可以将最相关的聊天历史记录或文档片段输入模型来模拟长期记忆和业务特定知识。


谷歌云发布了一个 Colab Notebook 和一个视频,用 pgvector、开源框架 LangChain 和 LLM 构建 AI 驱动的应用程序。谷歌高级软件工程师 Saket Saurabh 演示了如何在示例 Python 应用程序中添加生成式 AI 功能,他写道:


pgvector 扩展还引入了用于对向量执行相似性匹配的新运算符,你可以用它查找语义上相似的向量。这样的运算符有两个:

‘<->’:返回两个向量之间的欧几里得距离……

‘<=>’:返回两个向量之间的余弦距离


在过去的几个月中,谷歌云并不是唯一一个瞄准向量数据库的云供应商,Amazon RDS for PostgreSQL 也支持 pgvector 扩展,微软还展示了如何将 Azure Data Explorer(ADX)作为向量数据库,并讨论了几种连接到向量数据库的连接器。


原文链接:


https://www.infoq.com/news/2023/07/gcp-databases-vector-search/

2023-07-15 08:003244

评论

发布
暂无评论
发现更多内容

告别野路子代练!护航小程序源码系统上线:大神打手任选,交易安全有保障

DUOKE七七

MySQL uniapp thinkphp

术业有专攻——AI系统主控CPU英特尔至强6新品处理器浅析

科技热闻

将你的闲置算力上链,获得Token收益

PowerVerse

去中心化 Token 算力 DAO DePIN

刘强东宣布发力稳定币,大厂找到了「新金矿」

TechubNews

Intellij IDEA:升级到2025.1后无法运行Python配置:packaging_tool.py': [Errno 2] 没有此文件或目录

柠檬与橘子

HDC 2025丨华为云开源专题论坛,携手开发者迈向AI时代

华为云原生团队

云计算 容器 云原生

天翼云“一云多芯”构建通算智算一体化混合云新范式!

天翼云开发者社区

云计算

当国产AI嵌入国产智能终端交互,AI应用落地加速

新消费日报

提升应用灵活性的热更新技术

Speedoooo

热更新 小程序容器 小程序技术

《中国手机银行白皮书(2015-2024)》重磅发布:6亿用户崛起,手机银行十年蝶变!

易观分析

数据“活”起来,办事“跑”起来|小奇说

奇点云

国产智能终端AI能力再升级,火山引擎助力打造应用场景新可能

新消费日报

2025测试新标配:Browser Use开源方案落地实录

测试人

C# 将 CSV 转化为 Excel

不在线第一只蜗牛

C#

ChatClient vs ChatModel:开发者必须知道的4大区别!

王磊

别把CrossOver当虚拟机!CrossOver软件和虚拟机区别详解

阿拉灯神丁

crossover Mac软件 如何在Mac上运行win游戏 虚拟机软件 Mac游戏推荐

Intel至强6:AI江湖的幕后大佬、NVIDIA B300的唯一伙伴

科技热闻

技术干货 | 注塑件电磁网格划分指南(HyperMesh+SimLab)

Altair RapidMiner

仿真 CAE Hypermesh 网格划分 Simlab

Project Office X Pro|轻松管理各种项目

柠檬与橘子

重磅!天翼云多云统管体系及两个验证节点通过云计算服务安全评估

天翼云开发者社区

云计算 安全

数据要素市场崛起,通信运营或迎来身份大转型?

郑州埃文科技

百空间成网 可信数据生态如何重塑数字时代生产关系

郑州埃文科技

Java 并发工具类核心使用场景深度解析

电子尖叫食人鱼

Java

懒懒笔记 | 课代表带你梳理【RAG课程 13&14:多模态突围与综合论文问答系统实战】

商汤万象开发者

AI 大模型 LLM LLM 推理优化

火山引擎助力安卓手机抢滩AI应用,生态合力推动技术普惠进程

新消费日报

JUC并发—AQS源码分析

量贩潮汐·WholesaleTide

Java

英特尔宣布新任销售及工程技术领导层任命

科技热闻

Excel包含文本的单元格,'=A1>0' 返回 TRUE,但 '=COUNTIF(A1, ">0")' 返回 0

柠檬与橘子

将安全融入软件开发的每一步 | DevSecOps

禅道项目管理

项目管理 DevOps 软件开发 DevSecOps SaC安全即代码

Navicat Premium Mac|数据库一键切换

柠檬与橘子

数据要素治理框架下图情学科的核心角色重塑

郑州埃文科技

增强AI能力:谷歌云在托管数据库中集成向量搜索_AI 工程化_InfoQ精选文章