2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

亚马逊 MemoryDB 快速向量搜索功能全面可用

Renato Losio

  • 2024-08-30
    北京
  • 本文字数:1377 字

    阅读完需:约 5 分钟

亚马逊 MemoryDB 快速向量搜索功能全面可用

亚马逊云科技最近宣布 Amazon MemoryDB 向量搜索功能全面可用,这是一款具备多区域可用性的托管内存数据库。这项新功能提供了超低延迟和在 AWS 所有向量数据库中具有最高召回率的快速向量搜索性能。


Amazon MemoryDB 于 2021 年推出,是一款与 Redis 兼容的持久性内存数据库。目前,它已成为 AWS 上向量搜索的首选托管解决方案,尤其适合那些对峰值性能要求极高的应用场景,如生成式 AI 应用程序。亚马逊云科技开发者布道师 Channy Yun 写道:


有了 Amazon MemoryDB 的向量搜索,你可以使用现有的 MemoryDB API 来实现包括检索增强生成(RAG)、异常(欺诈)检测、文档检索和实时推荐引擎在内的生成式 AI 应用场景。你还可以使用 Amazon Bedrock 和 Amazon SageMaker 等人工智能和机器学习服务生成向量嵌入,并将它们存储在 MemoryDB 中。


开发人员可以使用 Amazon Bedrock 和 SageMaker 等托管服务生成向量嵌入,并将它们存储在 MemoryDB 中,从而实现 RAG 的实时语义搜索、低延迟持久性语义缓存和实时异常检测。


MemoryDB 的向量搜索 支持存储数百万个向量,保证查询响应时间在个位数毫秒级别,并在维持最高吞吐量的同时,提供极低的更新延迟,召回率超过 99%。Yun 补充道:


使用 MemoryDB 的向量搜索功能,你可以将基于批量机器学习模型识别出的欺诈交易,连同正常交易数据一起加载到 MemoryDB 中,通过主成分分析(PCA)等统计分解技术生成它们的向量表示,从而有效地进行欺诈检测。



这项新功能在 2023 年的 re:Invent 大会上首次以预览版的形式亮相,最近的全面可用带来了一系列新功能和改进,包括 VECTOR_RANGE,使得数据库能够以极低延迟运行,同时保持持久性语义缓存,以及 SCORE,它提供了更精细的相似性过滤能力。向量字段支持使用平面搜索(FLAT)和分层可导航小世界(HNSW)算法对固定大小的向量进行 K 最近邻搜索(KNN)搜索。


MemoryDB 并非亚马逊云科技提供的唯一一个支持向量搜索的托管数据库。在过去一年中,为了满足生成式 AI 工作负载的需求,OpenSearch、Aurora PostgreSQL、RDS PostgreSQL、Neptune 和 DocumentDB 纷纷引入了与向量相关的功能。美国银行的软件工程经理 Vinod Goje 评论 道:


我一直在关注向量数据库市场的发展,这个市场正在迅速增长,涌现出许多新产品……专家们认为这个市场变得过于拥挤,使得新产品很难在众多现有选项中脱颖而出。


亚马逊云科技数据库专家解决方案架构师 Shayon Sanyal 和 Graham Kutchek 详细说明了 为生成式 AI 应用程序选择数据库时的关键考虑因素。他们建议:


如果你已经在使用 OpenSearch Service、Aurora PostgreSQL、RDS for PostgreSQL、DocumentDB 或 MemoryDB,那么就充分利用它们内置的向量搜索功能来处理现有的数据。对于基于图的 RAG 应用程序,请考虑使用 Amazon Neptune。如果你的数据存储在 DynamoDB 中,OpenSearch 零 ETL 集成的优势将是你进行向量搜索的极好选择。如果仍然不确定,可以将 OpenSearch Service 作为起点。


最近,各大云服务厂商纷纷推出了自己的向量搜索功能,以与 Pinecone 等向量数据库以及无服务器解决方案,入 Momento Cache 展开竞争。例如,InfoQ 先前就报道了 Google BigQuery 和 Microsoft Vector Search。


向量搜索功能在 Amazon MemoryDB 7.1 中可用,并支持所有数据库可用区域的单分片配置。


原文链接

https://www.infoq.com/news/2024/08/aws-memorydb-vector-search/

2024-08-30 08:009779

评论

发布
暂无评论
发现更多内容

阿里云 EMAS Serverless 升级发布

移动研发平台EMAS

小程序云开发 阿里云 Serverless 开发者 云开发

交大医学院临床研究中心如何将 ModelWhale 应用于临床医生教学、研究丨数据科学 x 临床医学

ModelWhale

人才培养 数据科学 低代码平台 教学 临床医学

Jupyter Notebook 交互式编程 & 低代码拖拽式编程 | 数据科学生态下的理想平台

ModelWhale

云原生 Jupyter Notebook 数据科学 低代码开发 协作平台

使用华为HECS云服务器打造Telegraf+Influxdb+Grafana 监控系统【华为云至简致远】

科技云未来

Grafana Influxdb 系统管理 开源监控系统 提高效率

阿里大佬力荐的这份“Spring全家桶”太强了,在轻松中学习掌握

Java工程师

Java spring spring-boot

DeepLink在转转的实践

转转技术团队

ios android 客户端

NFT盲盒挖矿DAO智能合约dapp系统开发详情

开发微hkkf5566

快速定位线上慢SQL问题,掌握这几个性能排查工具可助你一臂之力

IT学习日记

MySQL性能优化 数据库优化 MySQL 数据库 签约计划第三季 explain关键字

大数据培训学习开发技术费用

小谷哥

使用域名注册服务 Domains配置域名【华为云至简致远】

科技云未来

域名配置 端口映射

2022最新发布超全的Java面试八股文,整整1700页,太全了

Java工程师

Java 面试 八股文

使用前端技术实现静态图片局部流动效果

dragonir

CSS JavaScript html 前端 SVG

云硬盘EVS详解以及如何用与避坑【华为云至简致远】

神奇视野

Python 后端 云服务 科技

拿来即用!Get计算机视觉核心知识,看这本书就够了!

博文视点Broadview

多图预警!华为 ECS 与 阿里云 ECS 对比实战【华为云至简致远】

科技云未来

华为云 虚拟私有云VPC ECS

利用华为云ECS服务器搭建安防视频监控平台【华为云至简致远】

科技云未来

nginx securecrt RTMP SSH工具

【实战】Next.js + 云函数开发一个面试刷题网站

狂奔滴小马

Serverless React

上海web前端培训课程

小谷哥

手摸手带你完成智慧路灯构建及避坑【华为云至简致远】

神奇视野

Python 科技

彻底搞懂云桌面配置及实践踩坑【华为云至简致远】

神奇视野

Python 科技

树莓派 USB摄像头 实现网络监控( MJPG-Streamer)

Five

树莓派 网络监控 #web 8月月更

大数据程序员培训学习多长时间可以找工作

小谷哥

兆骑科创高层次人才引进平台,创新创业赛事活动路演

兆骑科创凤阁

为什么Spring Boot项目加上就可以更新版本?

冉然学Java

程序员 源码分析 springboot Java 分布式 Java core

生物统计师与临床医生协同研究使用的低代码洞察平台丨数据科学 x 临床医学

ModelWhale

团队协作 Jupyter Notebook 数据科学 低代码开发 临床医学

基于ModelArts的动漫头像自动生成丨【华为云至简致远】

科技云未来

华为云ModelArts

Mysql 生成排序序号

六月的雨在InfoQ

8月月更

ffplay视频播放原理分析

百度Geek说

音视频

兆骑科创创业大赛,双创服务平台,线上直播路演

兆骑科创凤阁

亚马逊 MemoryDB 快速向量搜索功能全面可用_亚马逊云科技_InfoQ精选文章