写点什么

Redis 8 为向量相似性推出新的数据结构

  • 2025-05-13
    北京
  • 本文字数:1103 字

    阅读完需:约 4 分钟

大小:541.73K时长:03:04
Redis 8为向量相似性推出新的数据结构

Redis 最近推出向量集合(Vector Set) 功能,这是一种专为向量相似性设计的数据类型,也是 Redis 针对人工智能应用的一个新的选项。这是 Redis 创始人 Salvatore Sanfilippo(“antirez”)自 重新加入 公司以来的第一个重大贡献。


向量集合 是一种类似于有序集合(Sorted Set)的数据类型,不一样的是它将字符串元素与向量(而不是分数)关联起来,可以添加项目并检索与指定向量最相似的子集。它还支持过滤搜索功能,允许同时进行向量相似性和标量过滤。Sanfilippo 在他的博客中解释道:


简单来说,这个新的数据结构的目标是创建一种类似于有序集合的“集合类”数据类型,但分数是一个向量而不是标量。你可以像使用普通 Redis 数据结构一样添加和删除元素,无需担心其他问题,只需关注 Redis 抽象数据结构本身的特性即可。你可以查询与给定向量(或集合中已有的某个元素的向量)相似的元素,等等。


向量集合基于 hnsw.c 的 HNSW 数据结构实现,并进行了速度和特性方面的扩展。Redis 首席执行官 Rowan Trollope 称赞了 Sanfilippo 所做的贡献:


他的专业知识催生了一个简单直观的 API,这体现了 Redis 提供高性能解决方案的理念,同时保持了极简的复杂性。


向量数据库对于由生成式人工智能驱动的应用程序来说至关重要,它们可以检索语义相关的信息,用来丰富大语言模型(RAG)的上下文。其他的应用场景还包括:聊天机器人的语义缓存、推荐系统和人脸识别。Redis 产品经理 Mirko Ortensi 在另一篇文章中解释了如何 使用向量集合进行人脸识别。Ortensi 写道:


人脸识别本质上是基于向量的计算过程。它使用专门的嵌入模型对已知的人脸图像进行建模,并将映射后的向量存储在 Redis 中,然后通过搜索在数据库中存储的向量来实现人脸识别。


来源:Mirco Ortensi


Sanfilippo 补充道:


实现向量相似性搜索的基本要求是从头开始重新实现 HNSW(你可以在 hnsw.c 中看到我的实现),因为这将成为核心数据结构,我不想从 GitHub 上抓取一些随机代码来应付了事。


专注于高性能,Sanfilippo 不仅对 HNSW 进行了修改,还为所有向量相似性搜索请求引入了多线程特性,并支持 8 位和二进制量化。他强调了他的实现与其他数据结构的主要区别:


向量集合最有趣的部分是数据模型和相关的 API。许多数据库将向量相似性作为一种索引,但 Redis 不一样,Redis 里的东西是数据结构:这次也不例外。


向量集合并不是 Redis 唯一的新特性:LangCache 是一个专门为人工智能应用和智能体设计的语义缓存服务,旨在通过缓存它们的响应来减少对大语言模型的调用。


向量集合功能随 Redis 8 RC1 发布,目前处于预览阶段,许可协议为 RSALv2 或 SSPLv1。


查看英文原文

https://www.infoq.com/news/2025/04/redis-vector-sets/

2025-05-13 14:004910

评论

发布
暂无评论

贝锐向日葵、ToDesk、网易UU远程、RayLink,四款远控软件暑假用哪款?

科技热闻

引领国资监管新变革——国资国企穿透式监管白皮书重磅来袭

用友BIP

订单初版—取消订单链路中的技术问题说明文档

量贩潮汐·WholesaleTide

Java 数据库 服务器

ColorWell for Mac(调色板软件)

晨光熹微

MySQL为什么有时候会选错索引?

电子尖叫食人鱼

MySQL 数据库

一颗车灯的智能化之旅

脑洞汽车

AI

对初学者来说,YashanDB数据库的学习路线图

数据库砖家

数智焕新!用友BIP交出央国企价值替代新答卷

用友BIP

吉他初学者入门教程:Guitar Pro是如何帮助我从入门到大成的?

阿拉灯神丁

五线谱 吉他学习 吉他谱 Guitar Pro8 乐谱制作

中烟创新为千行百业客户免费部署DeepSeek,让AI应用遍地开花

中烟创新

Murus Pro for mac(网络安全防火墙工具)

晨光熹微

从语音识别到智能助手:Voice Agent 的技术进化与交互变革丨Voice Agent 学习笔记

声网

深度解析 DApp 开发:从技术架构到商业落地的全链路解决

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

重塑法律服务新生态,AlphaGPT筑牢法律AI数据安全防线

科技汇

常用YashanDB命令与操作实例

数据库砖家

开放YashanDB数据库的功能与特性介绍

数据库砖家

快速构建高效数据仓库:YashanDB数据库应用指南

数据库砖家

SketchUp Pro 2020 for Mac(草图大师)

晨光熹微

错误码502终结指南:3步根除MCP加载失败难题​​

聚客AI学院

人工智能 MCP MCP协议 MCP Server MCP头号玩家

苏超如何带火了5G-A?

脑极体

AI

SketchUp Pro 2024 for mac(su草图大师 专业的3D建模软件)

晨光熹微

灯塔低代码开发平台与DeepSeek深度融合,共筑AI编程的星辰大海

中烟创新

用友BIP企业AI全栈云:为中企出海筑牢全球化运营底座

用友BIP

这5种规则引擎,真香!

电子尖叫食人鱼

前端 开发

快速入门YashanDB数据库:安装配置全流程

数据库砖家

Studio One 7 Pro for mac(音乐创作编辑软件)

晨光熹微

iCourt重启“律师大航海”计划,2024年美国行扬帆起航

科技汇

治理代币的质押周期应该如何科学设定?

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 代币开发 代币开发公链开发

不同质押周期对代币价格稳定性的具体影响及数据支撑

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

Java集合框架性能特征与使用场景深度解析

不在线第一只蜗牛

Java

成功的DApp经济模型中治理代币与功能代币的协同机制解析

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 公链开发代币开发

Redis 8为向量相似性推出新的数据结构_大数据_Renato Losio_InfoQ精选文章