写点什么

亚马逊 MemoryDB 快速向量搜索功能全面可用

Renato Losio

  • 2024-08-30
    北京
  • 本文字数:1377 字

    阅读完需:约 5 分钟

亚马逊 MemoryDB 快速向量搜索功能全面可用

亚马逊云科技最近宣布 Amazon MemoryDB 向量搜索功能全面可用,这是一款具备多区域可用性的托管内存数据库。这项新功能提供了超低延迟和在 AWS 所有向量数据库中具有最高召回率的快速向量搜索性能。


Amazon MemoryDB 于 2021 年推出,是一款与 Redis 兼容的持久性内存数据库。目前,它已成为 AWS 上向量搜索的首选托管解决方案,尤其适合那些对峰值性能要求极高的应用场景,如生成式 AI 应用程序。亚马逊云科技开发者布道师 Channy Yun 写道:


有了 Amazon MemoryDB 的向量搜索,你可以使用现有的 MemoryDB API 来实现包括检索增强生成(RAG)、异常(欺诈)检测、文档检索和实时推荐引擎在内的生成式 AI 应用场景。你还可以使用 Amazon Bedrock 和 Amazon SageMaker 等人工智能和机器学习服务生成向量嵌入,并将它们存储在 MemoryDB 中。


开发人员可以使用 Amazon Bedrock 和 SageMaker 等托管服务生成向量嵌入,并将它们存储在 MemoryDB 中,从而实现 RAG 的实时语义搜索、低延迟持久性语义缓存和实时异常检测。


MemoryDB 的向量搜索 支持存储数百万个向量,保证查询响应时间在个位数毫秒级别,并在维持最高吞吐量的同时,提供极低的更新延迟,召回率超过 99%。Yun 补充道:


使用 MemoryDB 的向量搜索功能,你可以将基于批量机器学习模型识别出的欺诈交易,连同正常交易数据一起加载到 MemoryDB 中,通过主成分分析(PCA)等统计分解技术生成它们的向量表示,从而有效地进行欺诈检测。



这项新功能在 2023 年的 re:Invent 大会上首次以预览版的形式亮相,最近的全面可用带来了一系列新功能和改进,包括 VECTOR_RANGE,使得数据库能够以极低延迟运行,同时保持持久性语义缓存,以及 SCORE,它提供了更精细的相似性过滤能力。向量字段支持使用平面搜索(FLAT)和分层可导航小世界(HNSW)算法对固定大小的向量进行 K 最近邻搜索(KNN)搜索。


MemoryDB 并非亚马逊云科技提供的唯一一个支持向量搜索的托管数据库。在过去一年中,为了满足生成式 AI 工作负载的需求,OpenSearch、Aurora PostgreSQL、RDS PostgreSQL、Neptune 和 DocumentDB 纷纷引入了与向量相关的功能。美国银行的软件工程经理 Vinod Goje 评论 道:


我一直在关注向量数据库市场的发展,这个市场正在迅速增长,涌现出许多新产品……专家们认为这个市场变得过于拥挤,使得新产品很难在众多现有选项中脱颖而出。


亚马逊云科技数据库专家解决方案架构师 Shayon Sanyal 和 Graham Kutchek 详细说明了 为生成式 AI 应用程序选择数据库时的关键考虑因素。他们建议:


如果你已经在使用 OpenSearch Service、Aurora PostgreSQL、RDS for PostgreSQL、DocumentDB 或 MemoryDB,那么就充分利用它们内置的向量搜索功能来处理现有的数据。对于基于图的 RAG 应用程序,请考虑使用 Amazon Neptune。如果你的数据存储在 DynamoDB 中,OpenSearch 零 ETL 集成的优势将是你进行向量搜索的极好选择。如果仍然不确定,可以将 OpenSearch Service 作为起点。


最近,各大云服务厂商纷纷推出了自己的向量搜索功能,以与 Pinecone 等向量数据库以及无服务器解决方案,入 Momento Cache 展开竞争。例如,InfoQ 先前就报道了 Google BigQuery 和 Microsoft Vector Search。


向量搜索功能在 Amazon MemoryDB 7.1 中可用,并支持所有数据库可用区域的单分片配置。


原文链接

https://www.infoq.com/news/2024/08/aws-memorydb-vector-search/

2024-08-30 08:009677

评论

发布
暂无评论
发现更多内容

硬盘性能提升100倍的秘密:看懂顺序I/O的魔力

poemyang

计算机原理 PageCache I/O模型 储存

龙蜥邀您参加 AICon 全球人工智能开发与应用大会,探索 AI 应用边界

OpenAnolis小助手

AI 操作系统 龙蜥社区

自控学习历程系列 设备维护经验总结(2)

万里无云万里天

工厂运维

自控学习历程系列 项目管理经验总结(3)

万里无云万里天

工厂运维

如何轻松编写Rootkit:Linux内核系统调用拦截技术解析

qife122

Linux内核 漏洞挖掘

自控学习历程系列 过程仪表经验总结(7)

万里无云万里天

工厂运维

引领中国企业软件出海新局面,用友BIP让AI应用在全球落地

用友BIP

体验为王时代,天润融通助力台铃以服务撬动品牌长期价值

天润融通

基于扩散先验的自适应多模态蛋白质即插即用框架

qife122

机器学习 扩散模型

深度学习如何优化某中心包装减废方案

qife122

自然语言处理 深度学习

用“数”创新,聚“数”赋能!中石大携手和鲸主办 2025 年青岛市公共数据创新应用大赛圆满落幕!

ModelWhale

中国石油大学 和鲸 公共数据创新应用大赛

PPT文件怎么添加视频?3个PPT高级技巧盘点!

职场工具箱

效率工具 PPT 办公软件 AI生成PPT

自控学习历程系列 项目管理经验总结(2)

万里无云万里天

工厂运维

华为元服务“服务商”生态加速计划正式启动,共拓服务分发新蓝海

新消费日报

自控学习历程系列 自控设计经验总结(2)

万里无云万里天

工厂运维

自控学习历程系列 低压电工经验总结(11)

万里无云万里天

工厂运维

自控学习历程系列 项目管理经验总结(4)

万里无云万里天

工厂运维

混合合成先验增强表格基础模型Mitra

qife122

机器学习 基础模型

让AI应用落地!大型企业一定要来这场盛会的8个理由

用友BIP

企业软件与智能服务迎变革,用友BIP将现新动作

用友BIP

计算机视觉构建地球数字孪生体

qife122

计算机视觉 卫星遥感

征程 6 | 自定义查表算子实现量化部署

地平线开发者

自动驾驶 算法工具链 地平线征程6

自控学习历程系列 设备维护经验总结(1)

万里无云万里天

工厂运维

夜莺监控的几种架构模式详解

巴辉特

Prometheus 夜莺监控 Victoriametrics

深度学习为何有效及其局限性解析

qife122

机器学习 深度学习

自控学习历程系列 项目管理经验总结(1)

万里无云万里天

工厂运维

自控学习历程系列 团队建设经验总结(2)

万里无云万里天

工厂运维

AI突破企业软件能力边界,用友BIP5即将破局发布!

用友BIP

微软SharePoint五重漏洞剖析:ToolShell攻击链技术内幕

qife122

漏洞分析 零日漏洞 反序列化漏洞

开源免费!敲敲云APaaS零代码平台,做轻流/明道本地化的平替产品

JEECG低代码

零代码 无代码平台 流程引擎 敲敲云 表单引擎

ICASSP 2024语音技术前沿论文速览

qife122

人工智能 语音识别

亚马逊 MemoryDB 快速向量搜索功能全面可用_亚马逊云科技_InfoQ精选文章