在 2025 收官前,看清 Data + AI 的真实走向,点击查看 BUILD 大会精华版 了解详情
写点什么

Pinecone 在公开预览中引入专用读取节点,用于可预测的向量工作负载

作者:Craig Risi

  • 2025-12-26
    北京
  • 本文字数:2035 字

    阅读完需:约 7 分钟

大小:1.01M时长:05:52
Pinecone在公开预览中引入专用读取节点,用于可预测的向量工作负载

Pinecone 最近公布了专用读节点(Dedicated Read Nodes,DRN)的公开预览版本,这是其向量数据库的一种新的容量模式,旨在为高吞吐量应用(如十亿向量语义搜索、推荐系统和关键任务 AI 服务)提供可预测的性能和大规模成本。此功能建立在 Pinecone 现有的无服务器按需模型之上,为企业提供了稳定的硬件资源,以应对持续的高查询量,而无需担心基于使用量的定价中的固有可变性。

 

对于那些不熟悉 Pinecone 的人,Pinecone是一个完全管理的向量数据库,旨在以低延迟和可预测的性能大规模存储、索引和搜索高维嵌入。它通常用于驱动生产 AI 系统中的语义搜索、推荐系统和检索增强生成(RAG)应用。

 

专门的读节点为查询操作分配独占的计算和内存资源,确保数据在内存和本地 SSD 存储中保持热状态,以避免因冷数据取取和共享队列而导致的延迟峰值。DRN 采用按节点计费而不是按请求计费的方式,目的是让成本在流量持续的情况下更可预测,同时即使在重负载下也能提供一致的低延迟性能。开发人员使用相同的 Pinecone API 和 SDK 与 DRN 交互,就像他们在按需模式中一样,保留了现有的代码和工作流。

 

架构在两个维度上进行扩展:副本用于提高查询吞吐量和可用性,分片用于随着数据集的增长扩大存储容量。Pinecone 在后台处理数据移动和容量调整,消除了手动迁移,并允许组织以最小的运维开销增长。DRN 特别适用于具有严格的服务等级目标和一致需求模式的应用程序,例如需要在数百万向量上的延迟低于 100 毫秒的面向用户的助手,或者驱动个性化推送的高QPS 推荐引擎。

 

在公告中分享的性能基准说明了 DRN 的能力:一个设计平台在 1.35 亿向量上持续约 600 QPS,中位数延迟约 45 ms,负载下扩展到约 2200 QPS,而一个处理约 14 亿个向量的电子商务市场记录了 5700 QPS,中位数延迟在几十毫秒内。

 

成本可预测性是 DRN 的核心优势之一。通过与节点数量挂钩的固定小时定价,团队可以更好地预测支出,并在没有与单个查询量相关的波动性收费的情况下优化价格性能。对于突发或变化的工作负载,按需索引仍然适用,其中自动扩展和基于使用的计费提供了成本优势。然而,对于可预测的、重度使用,DRN 在需要该成本模型时提供了一个令人信服的替代方案。

 

因为 DRN 索引是在 Pinecone 的平台上构建的,但为读取操作提供了专用硬件,所以它们消除了按需模式中的速率限制,并在添加副本时提供了线性扩展。这种灵活性允许企业微调吞吐量容量,并随着数据量和查询需求的增加而无缝增长。

 

首先,用户可以通过 Pinecone 控制台或 API 创建专用的读节点索引,选择节点类型、分片数量、副本和云区域,通常在大约 30 分钟内达到完整的读容量。对于那些已经使用按需索引的人,Pinecone 提供了 API 支持,可以在不停机的情况下将现有索引迁移到 DRN。

 

在向量数据库生态系统中有许多不同的参与者,在 Pinecone 的解决方案之外还有几种替代方案,它们反映了 Pinecone 专用节点模型之外的常见架构模式。

 

Milvus旨在实现大规模可扩展性和高性能,适用于非常大的数据集,通常达到数十亿个向量。它支持多种索引结构,如 IVF、HNSW 和 GPU 加速,允许针对不同的工作负载模式进行优化搜索。Milvus 通常能够实现高吞吐量,独立基准测试显示,在正确配置的情况下,它可以每秒维持数千个查询。重要的是,Milvus 将存储和计算分开,支持分布式部署,能够水平扩展以满足大型工作负载需求;这在概念上类似于专用容量,但需要更多的基础设施管理。与 Pinecone 的托管 DRN 产品不同,Milvus 可以自托管或通过托管服务(如Zilliz Cloud)使用,使团队能够完全控制资源分配。

 

Qdrant通过云原生、水平可扩展的设计专注于高性能的相似性搜索。它是用 Rust 编写的,强调低延迟和强有效负载过滤,使其适合于需要快速最近邻结果和丰富的元数据约束的工作负载。在吞吐量和延迟基准测试中,Qdrant 与 Pinecone 等托管服务在中等规模工作负载上具有竞争力,并且可以通过向分布式集群添加节点进行扩展。

 

Pinecone 的 DRN 模式通过预留的硬件提供了可预测的性能,而 Qdrant 的模型通常需要运维人员自己管理和扩展集群。水平扩展可以提高吞吐量和弹性,但创建可预测的成本/性能概要更依赖于基础设施的选择(虚拟机类型、集群大小),而不是 Pinecone 的捆绑节点定价。

 

Weaviate的突出之处在于将语义向量搜索与结构化元数据模型和混合查询功能相结合。它支持混合检索(向量+关键字),通常被选择用于用于需要比纯相似性搜索更需要表达能力的应用。Weaviate 通过在节点上分布分片来扩展,随着集群的增长处理高吞吐量,其模块化架构允许直接在数据库内链接嵌入模块。

 

对于已经投资关系型数据库的团队,pgvector扩展了 PostgreSQL,使用HNSWDiskANN等算法支持近似最近邻搜索。虽然它将向量搜索带入到了熟悉的 SQL 生态系统,但 pgvector 通常最适合于较小或混合的工作负载,并且缺乏专用数据库的原始分布式吞吐量。它的性能和可扩展性严重依赖于 PostgreSQL 的配置和底层硬件,这使得它在没有额外自定义分片或复制策略的高 QPS 环境中不太理想。

 

原文链接:

https://www.infoq.com/news/2025/12/pinecone-drn-vector-workloads/

2025-12-26 14:201

评论

发布
暂无评论

Drone CI 部署

流火

阿里云可观测 2023 年 3 月产品动态

阿里巴巴云原生

阿里云 云原生 可观测

行业盛会丨九科信息亮相第十一届中国电子信息博览会(CITE2023),与您共享科技盛宴

九科Ninetech

阿里内部都在疯传!企业级Spring Boot 项目开发实战教程,我先肝了

程序知音

Java 微服务 springboot java架构 Java进阶

浪潮inBuilder低代码平台分布式微服务架构事务一致性技术解析

inBuilder低代码平台

分布式事务 低代码

“ONE”有引力,4月21日见!

博睿数据

智能运维 博睿数据 发布会 Bonree ONE

选择低代码,帮企业数字化转型提交一份满分答卷

加入高科技仿生人

软件开发 低代码 数字化 数字转型

现在学C4D还是Blender好?这俩有啥区别?

Finovy Cloud

blender C4D

OpenSea交易平台开发NFT系统部署技术

薇電13242772558

NFT

华秋PCB生产工艺分享 | 第十一道之成型

华秋电子

Django笔记三之使用model对数据库进行增删改查

Hunter熊

Python django model 增删改查

封仲淹:OceanBase开源技术生态全景解析

OceanBase 数据库

数据库 oceanbase

IBM Semeru Runtime 17.0.6.0 在 Linux 下的安装

HoneyMoose

携多款产品亮相“深圳先进制造业集群展”,华秋积极探索发展机遇

华秋电子

【论文解读】不和谐区域定位

合合技术团队

人工智能 图像识别 图像处理

在生产环境中运行 grpc 服务所面临的挑战

蓬蒿

golang gRPC

面试还不懂Netty,看这篇文章就够了!

程序员小毕

Java 程序员 后端 Netty 架构师

面试官:谈谈分布式一致性机制

Java永远的神

程序员 分布式 微服务 后端 架构师

上传了ipa但在苹果App Store中没有看到构建版本的问题

OpenTiny 的这些特色组件,很实用,但你应该没见过

Kagol

开源 前端 Vue3 组件库

PCB拼版对SMT组装的影响,华秋一文告诉你

华秋电子

关于 IDP 的五大认知误解

SEAL安全

IdP 平台工程

智慧污水处理厂Web3D管理系统 把“污水洗白”

2D3D前端可视化开发

智慧水务 智慧污水厂 智慧污水处理 污水厂三维可视化 数字孪生污水厂

用户需求挖掘与分析,某新零售快消品电商系统成功交付的秘诀

L3C老司机

产品 产品设计 需求分析 产品管理 用户画像

新旧版本功能对比 | v1.5.0 全新升级

BinTools图尔兹

数据库 社区版 版本更新

NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等

汀丶人工智能

人工智能 自然语言处理 深度学习 关系抽取 命名实体识别

智慧公共厕所,重构城市公共服务的新模式@光明源智慧公厕

光明源智慧厕所

智慧城市

折叠屏时代的全新故事,由华为领启

脑极体

华为

Pinecone在公开预览中引入专用读取节点,用于可预测的向量工作负载_架构_InfoQ精选文章