写点什么

Redis 8 为向量相似性推出新的数据结构

  • 2025-05-13
    北京
  • 本文字数:1103 字

    阅读完需:约 4 分钟

大小:541.73K时长:03:04
Redis 8为向量相似性推出新的数据结构

Redis 最近推出向量集合(Vector Set) 功能,这是一种专为向量相似性设计的数据类型,也是 Redis 针对人工智能应用的一个新的选项。这是 Redis 创始人 Salvatore Sanfilippo(“antirez”)自 重新加入 公司以来的第一个重大贡献。


向量集合 是一种类似于有序集合(Sorted Set)的数据类型,不一样的是它将字符串元素与向量(而不是分数)关联起来,可以添加项目并检索与指定向量最相似的子集。它还支持过滤搜索功能,允许同时进行向量相似性和标量过滤。Sanfilippo 在他的博客中解释道:


简单来说,这个新的数据结构的目标是创建一种类似于有序集合的“集合类”数据类型,但分数是一个向量而不是标量。你可以像使用普通 Redis 数据结构一样添加和删除元素,无需担心其他问题,只需关注 Redis 抽象数据结构本身的特性即可。你可以查询与给定向量(或集合中已有的某个元素的向量)相似的元素,等等。


向量集合基于 hnsw.c 的 HNSW 数据结构实现,并进行了速度和特性方面的扩展。Redis 首席执行官 Rowan Trollope 称赞了 Sanfilippo 所做的贡献:


他的专业知识催生了一个简单直观的 API,这体现了 Redis 提供高性能解决方案的理念,同时保持了极简的复杂性。


向量数据库对于由生成式人工智能驱动的应用程序来说至关重要,它们可以检索语义相关的信息,用来丰富大语言模型(RAG)的上下文。其他的应用场景还包括:聊天机器人的语义缓存、推荐系统和人脸识别。Redis 产品经理 Mirko Ortensi 在另一篇文章中解释了如何 使用向量集合进行人脸识别。Ortensi 写道:


人脸识别本质上是基于向量的计算过程。它使用专门的嵌入模型对已知的人脸图像进行建模,并将映射后的向量存储在 Redis 中,然后通过搜索在数据库中存储的向量来实现人脸识别。


来源:Mirco Ortensi


Sanfilippo 补充道:


实现向量相似性搜索的基本要求是从头开始重新实现 HNSW(你可以在 hnsw.c 中看到我的实现),因为这将成为核心数据结构,我不想从 GitHub 上抓取一些随机代码来应付了事。


专注于高性能,Sanfilippo 不仅对 HNSW 进行了修改,还为所有向量相似性搜索请求引入了多线程特性,并支持 8 位和二进制量化。他强调了他的实现与其他数据结构的主要区别:


向量集合最有趣的部分是数据模型和相关的 API。许多数据库将向量相似性作为一种索引,但 Redis 不一样,Redis 里的东西是数据结构:这次也不例外。


向量集合并不是 Redis 唯一的新特性:LangCache 是一个专门为人工智能应用和智能体设计的语义缓存服务,旨在通过缓存它们的响应来减少对大语言模型的调用。


向量集合功能随 Redis 8 RC1 发布,目前处于预览阶段,许可协议为 RSALv2 或 SSPLv1。


查看英文原文

https://www.infoq.com/news/2025/04/redis-vector-sets/

2025-05-13 14:00154

评论

发布
暂无评论

探索生成式AI与低代码结合的无限可能

天津汇柏科技有限公司

低代码 生成式AI

高效文件查找工具ProFind for Mac中文激活版

小玖_苹果Mac软件

低代码开发中的创新实践

伤感汤姆布利柏

综合治理系统(源码+文档+部署+讲解)

深圳亥时科技

阿里云 EMR Serverless Spark 在微财机器学习场景下的应用

阿里云大数据AI技术

大数据 数据采集 分布式训练 EMR

谷歌访问助手(谷歌浏览器插件)Mac版

Rose

2024年最受欢迎的5个Go框架

王中阳Go

后端 go框架

音视频互动APP的开发框架

北京木奇移动技术有限公司

软件外包公司 音视频APP 音视频编解码

Volcano v1.11 重磅发布!开启AI与大数据的云原生调度新纪元

华为云原生团队

云计算 开源 容器 云原生

【YashanDB知识库】对比Oracle和YashanDB对象不一致的方法

YashanDB

数据库 yashandb

技术干货|Altair HyperWorks 二次开发与 Python 重构仿真新体验

Altair RapidMiner

Python 重构 开发语言 前处理软件

火山引擎数据飞轮2.0助力中信银行,用“AI”开启新年新气象

字节跳动数据平台

华为Mate 70的麒麟9020芯片是谁生产的?

博文视点Broadview

Numa初识

天翼云开发者社区

服务器 构架 NUMA

DeepSeek 爆火全球,昇腾让DeepSeek上线加速

极客天地

Three-Body Technology Lost Soul for mac(三体洞箫软件音源) 激活版

Rose

PlistEdit Pro for Mac(Plist编辑器)v1.9.7直装版

Rose

专业级别的视频编辑软件Adobe Premiere Pro 2025 for Mac中文激活

小玖_苹果Mac软件

未来技术路线选择:低代码开发还是传统开发?

秃头小帅oi

提示词工程的十大认知误区

阿里技术

提示词

音视频互动APP的成本

北京木奇移动技术有限公司

音视频开发 软件外包公司 音视频APP

人工智能丨DeepSeek-V3:推理速度飙升,开源模型新王者诞生!

测试人

人工智能 软件测试

Type Fu for Mac(打字练习)v4.8.0激活版

Rose

Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践

阿里云大数据AI技术

大数据 阿里云 数据集成 Dataworks FFA

音视频互动APP的技术难点

北京木奇移动技术有限公司

音视频开发 软件外包公司 音视频APP

交互式产品原型设计工具 Axure RP 9 mac中文破解版 含永久密钥

Rose

3D渲染和动画制作 KeyShot 2024.3浮动许可证

Rose

Redis 8为向量相似性推出新的数据结构_大数据_Renato Losio_InfoQ精选文章