亚马逊云科技近日宣布,原生支持向量数据存储与查询的云对象存储服务 S3 Vectors 已正式商用。随着 GA 版本的发布,亚马逊云科技 将单索引容量提升了 40 倍,最高可支持 20 亿个向量,并将查询延迟缩短至 100 毫秒以内。
今年 7 月,该服务曾推出预览版。据亚马逊云科技报告,预览期间用户已创建超过 25 万个向量索引,摄入向量总数突破 400 亿个。预览版曾将索引上限限制在 5000 万个向量,而 亚马逊云科技首席开发者 Sebastian Stromacq 对此写道:
现在可以在单个索引中存储并搜索多达 20 亿个向量……这意味着可以将整个向量数据集整合到同一个索引中,无需再进行复杂的跨多索引分片,也无需实现繁琐的联合查询逻辑。
此外,亚马逊云科技还大幅优化了查询性能:低频查询可在 1 秒内返回结果,而高频查询的延迟可低至 100 毫秒甚至更短,这对于对话式 AI 等交互式应用至关重要。据官方介绍,单次查询现在可检索多达 100 条结果,显著增强了检索增强生成(RAG)应用的上下文丰富度。在写入性能方面,针对单向量更新的 PUT 事务处理能力提升至每秒 1,000 次,支持在小批量作业下实现更高吞吐量,并能即时搜索来自多个并发源的新数据。
亚马逊云科技同时确认,预览期间推出的两项关键集成功能现已正式商用。用户可以将 S3 Vectors 作为 Amazon Bedrock 知识库的向量存储引擎;同时,S3 Vectors 与 Amazon OpenSearch 的集成也已就绪,允许用户在利用 S3 Vectors 开展底层向量存储的同时,通过 OpenSearch 进行高级搜索与分析。
开发者 Jalaj Nautiyal 在 LinkedIn 的贴文中评价道:
S3 Vectors 将向量搜索从“计算优先”的问题转变为“存储优先”:的方案。这是一种无服务器(Serverless)的转型:你不再需要管理集群、节点(Pods)或分片,而是像对待 S3 中的任何其他对象一样处理向量。它具备极强的扩展性,可存储数十亿向量。更重要的是成本:它能将总体拥有成本(TCO)降低多达 90%。你只需支付便宜的 S3 存储费和查询费,再也没有闲置的计算成本。
他补充道:
对于 80% 的内部 RAG 应用和自主智能体来说,你可能并不需要向量数据库中的‘法拉利’,你只需要一个可靠且近乎无限的‘载重货箱’。而 S3 恰恰成了那个货箱。
目前,S3 Vectors 已在 14 个亚马逊云科技区域可用,较预览版的 5 个区域显著扩大。该服务的计费主要基于下述三个维度。
PUT 费用:根据用户上传向量的逻辑 GB 计算,每个向量包含其逻辑数据、元数据和键值。
存储费用:由跨索引的总逻辑存储量决定。
查询费用:包含单次 API 调用费以及基于索引大小(不含不可过滤元数据)的流量费。
关于费用的更多细节,请参阅定价页面。
原文链接:





