写点什么

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

Renato Losio

  • 2024-09-17
    北京
  • 本文字数:1179 字

    阅读完需:约 4 分钟

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案

随着 MariaDB 11.6 的发布,MariaDB 基金会宣布了公开预览的向量(Vector)搜索,以用于开源 fork 的 MySQL 引擎。数据库专家和开源倡导者认为向量搜索是 MariaDB 引领 MySQL 生态系统的一个机会,尤其是在甲骨文公司只为其企业版保留了大部分新特性的情况下。


根据发布公告,特性完备的 MariaDB 11.6 向量版本预计在几个月内发布,向量功能将会在 MariaDB 11.7 及以后的版本中全面可用。与 MySQL 9.0 目前提供的不带索引(Indexes)的新向量类型不同,MariaDB 没有提供专门的数据类型,但是引入了专门的索引以及 VEC_ToText 和 VEC_FromText 函数,这是向量存储的新可选方案。


向量搜索是基于行业标准 HNSW 算法实现的,新的 MariaDB Vector(也就是在今年早些时候 FOSDEM 上演示的 LLM 存储引擎)即将成为标准 MariaDB 服务器的一部分。


MariaDB 基金会首席执行官 Kaj Arnö 这样写到:


我们与 MySQL 服务器中的向量支持(称为 Heatwave)的差异在于,我们的向量搜索是开源的。实际上,与 MySQL 不同的是,我们仍然缺少一个单独的向量数据类型,不过我们会在正式发布前添加该数据类型。


Percona 创始人、开源倡导者 Peter Zaitsev 评论说:


显然,这个项目还处于早期阶段,但是它展示了一个重要的现象,那就是,在对现代开发人员至关重要的向量搜索方面,MariaDB 击败了甲骨文 MySQL。我很好奇甲骨文公司会有什么反应。它是否会迫使甲骨文在 MySQL 社区版中采用向量搜索,还是甲骨文不再关心他们的开源版本是否会受到现代开发者青睐?


Arnö补充道:


我们不仅要帮助 MariaDB 服务器的用户,还要帮助 MySQL 服务器的用户能够轻松地以开源方式采用向量功能。我们一直认为,从 MySQL 服务器迁移到 MariaDB 服务器非常容易,而获得向量功能则是迁移的一个重要原因。


向量搜索的实现是 MariaDB plc 员工、MariaDB 基金会和其他贡献者(尤其亚马逊云科技,它是 MariaDB 最新的支持者之一)共同努力的结果。


随着生成式 AI 工作负载越来越流行,MariaDB 并不是唯一一家致力于支持向量搜索的关系型数据库。正如 InfoQ 此前报道的那样,谷歌和亚马逊云科技已经在其托管的 RDBMS 中引入了这一选项,而 MySQL 9.0 则是首个支持向量搜索的甲骨文产品。此外,PlanetScale 去年 宣布计划 fork MySQL,以增加向量搜索的功能。


虽然许多开发人员对向量搜索的众多可选方案表示了赞赏,但用户 nhatnv 在 Reddit 上发表了这样的评论:


除非你面对的是数十亿的规模,否则我认为没有必要为向量数据库提供如此多样的选择。


MariaDB plc 首席架构师 Sergei Golubchik 在“MariaDB 向量有多么快?”一文中使用 ann-benchmarks 套件将新功能与其他向量数据库进行了对比。


鉴于目前还是 alpha 版本,所以还没有完整的二进制包;不过,Quay.io 上已经提供了支持向量搜索并启用了 CPU 优化的容器镜像。


查看英文原文

https://www.infoq.com/news/2024/08/mariadb-vector-search/

2024-09-17 08:3010207

评论

发布
暂无评论
发现更多内容

从零做网站开发:基于Flask和JQuery,实现表格管理平台

华为云开发者联盟

jquery flask 框架

精彩回顾 | 一张图读懂OPPO应用与数据安全防护

OPPO安全

OPPO安全

进一步深挖工业数据价值

CECBC

数据安全;工业互联网

GO训练营第2周总结

Glowry

中国CRM突围指南

ToB行业头条

CRM

设备常用网管配置举例

爆买剁手之后,我们的快乐为什么越来越贬值?

脑极体

OPPO技术开放日第六期丨OPPO安全解析“应用与数据安全防护”背后的技术

OPPO安全

OPPO安全

同步与异步,回调与协程

Linux服务器开发

线程 后端 协程 底层应用开发 Linux服务器开发

浅谈互斥锁与进程间的通信(举例说明)

ShenDu_Linux

Linux 程序员 架构师 进程线程区别

数字货币将带来怎样的“革命”

CECBC

数字货币 货币

Accept-Language是什么? 就在身边,你却没看见的“冷知识”系列(不定期偶遇)

八苦-瞿昙

随笔杂谈 HTTP

你敢信?就是这个Netty的网络框架差点把我整疯了,哭jj

小Q

学习 编程 面试 Netty 网络

linux后台开发必知的linux系统内存知识总结

linux大本营

c++ Linux 后台开发 架构师 内存管理

关于物联网规则引擎技术,你想要知道的都在这儿!

华为云开发者联盟

数据 联动 iotda

在K8S/OpenShift上开发应用程序的14种最佳实践

东风微鸣

Kubernetes 最佳实践 k8s最佳实践 openshift

LeetCode题解:455. 分发饼干,贪心while循环,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

《迅雷链精品课》第九课:区块链P2P网络

迅雷链

区块链

「云原生上云」后的聚石塔是如何应对 双11 下大规模应用挑战的

阿里巴巴云原生

阿里云 云原生

大企软件系统问题多?归乡名企工程师:解决很简单,分分钟做个新系统

Learun

敏捷开发 快速开发 企业开发 CRM 企业应用

测试过程中如何快速定位一个bug

测试人生路

软件测试

当居住空间被智能包裹:OTA智能社区改变了什么?

脑极体

《视觉系统中的深度学习》PDF及源代码免费下载

计算机与AI

学习 计算机视觉

架构师 3 期 3 班 -week2- 作业

zbest

作业 week2

Serverless 应用引擎的远程调试和云端联调

阿里巴巴云原生

Java Serverless 云原生 后端

年轻人快来学习TCP 协议如何解决粘包、半包问题!

程序员小灰

c++ Linux TCP 后台开发 Linux服务器开发

为什么从蚂蚁离职?base拉胯,高潜也被倒挂,就是酸,忍不了

Java架构师迁哥

cncf serverless 所有项目全解读

coldTea214

云计算 Serverless 容器 cncf

技术应用丨DWS 空间释放(vacuum full) 最佳实践

华为云开发者联盟

内存 存储 磁盘

深入了解进程间通信:System V信号量+共享内存

ShenDu_Linux

Linux 进程 内存管理 通信协议

区块链在国际贸易领域应用的法律问题

CECBC

区块链

MariaDB 发布开源向量的预览功能,致力于成为默认的 MySQL 方案_后端_InfoQ精选文章