10 月 23 - 25 日,QCon 上海站即将召开,现在大会已开始正式报名,可以享受 8 折优惠 了解详情
写点什么

Redis 8 为向量相似性推出新的数据结构

  • 2025-05-13
    北京
  • 本文字数:1103 字

    阅读完需:约 4 分钟

大小:541.73K时长:03:04
Redis 8为向量相似性推出新的数据结构

Redis 最近推出向量集合(Vector Set) 功能,这是一种专为向量相似性设计的数据类型,也是 Redis 针对人工智能应用的一个新的选项。这是 Redis 创始人 Salvatore Sanfilippo(“antirez”)自 重新加入 公司以来的第一个重大贡献。


向量集合 是一种类似于有序集合(Sorted Set)的数据类型,不一样的是它将字符串元素与向量(而不是分数)关联起来,可以添加项目并检索与指定向量最相似的子集。它还支持过滤搜索功能,允许同时进行向量相似性和标量过滤。Sanfilippo 在他的博客中解释道:


简单来说,这个新的数据结构的目标是创建一种类似于有序集合的“集合类”数据类型,但分数是一个向量而不是标量。你可以像使用普通 Redis 数据结构一样添加和删除元素,无需担心其他问题,只需关注 Redis 抽象数据结构本身的特性即可。你可以查询与给定向量(或集合中已有的某个元素的向量)相似的元素,等等。


向量集合基于 hnsw.c 的 HNSW 数据结构实现,并进行了速度和特性方面的扩展。Redis 首席执行官 Rowan Trollope 称赞了 Sanfilippo 所做的贡献:


他的专业知识催生了一个简单直观的 API,这体现了 Redis 提供高性能解决方案的理念,同时保持了极简的复杂性。


向量数据库对于由生成式人工智能驱动的应用程序来说至关重要,它们可以检索语义相关的信息,用来丰富大语言模型(RAG)的上下文。其他的应用场景还包括:聊天机器人的语义缓存、推荐系统和人脸识别。Redis 产品经理 Mirko Ortensi 在另一篇文章中解释了如何 使用向量集合进行人脸识别。Ortensi 写道:


人脸识别本质上是基于向量的计算过程。它使用专门的嵌入模型对已知的人脸图像进行建模,并将映射后的向量存储在 Redis 中,然后通过搜索在数据库中存储的向量来实现人脸识别。


来源:Mirco Ortensi


Sanfilippo 补充道:


实现向量相似性搜索的基本要求是从头开始重新实现 HNSW(你可以在 hnsw.c 中看到我的实现),因为这将成为核心数据结构,我不想从 GitHub 上抓取一些随机代码来应付了事。


专注于高性能,Sanfilippo 不仅对 HNSW 进行了修改,还为所有向量相似性搜索请求引入了多线程特性,并支持 8 位和二进制量化。他强调了他的实现与其他数据结构的主要区别:


向量集合最有趣的部分是数据模型和相关的 API。许多数据库将向量相似性作为一种索引,但 Redis 不一样,Redis 里的东西是数据结构:这次也不例外。


向量集合并不是 Redis 唯一的新特性:LangCache 是一个专门为人工智能应用和智能体设计的语义缓存服务,旨在通过缓存它们的响应来减少对大语言模型的调用。


向量集合功能随 Redis 8 RC1 发布,目前处于预览阶段,许可协议为 RSALv2 或 SSPLv1。


查看英文原文

https://www.infoq.com/news/2025/04/redis-vector-sets/

2025-05-13 14:004717

评论

发布
暂无评论

带你全方位体验 Amazon Connect

亚马逊云科技 (Amazon Web Services)

自定义限速功能实践——Map版本

FunTester

万字长文讲解关于LowCode你需要知道的一切

canonical

DDD 低代码 软件架构 可逆计算 Nop平台

一文读懂Penpad 以 Fair Launch 方式推出的首个资产 PEN

BlockChain先知

AIGC 周报(2.26~3.03)

AIGC Weekly 周报

人工智能 AI AI应用 openai AIGC

技术管理者如何避免被裁掉(1)

芃篙君

管理

我正在使用React Native (Expo) 开源一个精美的电商购物应用。

Geek_9da61c

产品设计 软件开发 开源中国 品牌设计

编程究竟难在哪?

算法的秘密

华为智慧教室3.0的晨光,点亮教育智能化变革

脑极体

AI

百度AI,能否“投”出未来?

自象限

百度 AI

再聊对架构决策记录的一些思考

疯狂架构

架构设计实战 架构决策记录 ADR

如何将Word一键转PPT?收好这3个办公提效神器!

彭宏豪95

效率 PPT 在线白板 办公软件 AI工具

一文读懂Penpad 以 Fair Launch 方式推出的首个资产 PEN

股市老人

HttpMessageConverter添加java8 LocateTime时间转换

智慧源点

华为云低代码Astro企业应用 Astro Pro上线啦!

低代码 华为云 公测

无惧“高基数”数据挑战,TDengine 携手树根互联

TDengine

tdengine 时序数据库

App前端开发跨平台框架比较:React Native、Flutter、Xamarin等

天津汇柏科技有限公司

App app定制开发 软件开发定制

融云 IM 史无前例五折优惠!

融云 RongCloud

一文读懂Penpad 以 Fair Launch 方式推出的首个资产 PEN

加密眼界

一文读懂Penpad 以 Fair Launch 方式推出的首个资产 PEN

股市老人

Git 安全远程访问:SSH 密钥对生成、添加和连接步骤解析

小万哥

git 程序人生 编程语言 软件工程 后端开发

作业12

大肚皮狒狒

SpringBoot混淆代码,防止反编译代码泄露

源字节1号

开源 软件开发 前端开发 后端开发 小程序开发

牛市初期,Penpad 以 Fair Launch 方式推出首个资产 PEN

石头财经

华为云时习知&成都大学附属医院,打造“互联网+医疗”标杆

轶天下事

Redis 8为向量相似性推出新的数据结构_大数据_Renato Losio_InfoQ精选文章