写点什么

PayPal 开源 JunoDB,支持 3500 亿次日请求的键值存储

  • 2023-06-24
    北京
  • 本文字数:1172 字

    阅读完需:约 4 分钟

PayPal开源JunoDB,支持3500亿次日请求的键值存储

PayPal 最近开源了JunoDB,这是一个底层使用 RocksDB 存储引擎的分布式键值存储。JunoDB 是一个高度可用且非常注重安全的数据库。在 PayPal,它每天处理 3500 亿次请求。

 

JunoDB是用 Golang 编写的,采用了基于代理的设计,支持连接的线性横向扩展。它使用一致性哈希算法对数据进行分区,最大限度地减少了集群扩展或收缩时的数据移动。为了实现零停机,JunoDB 使用了数据中心内和跨数据中心复制,并通过基于仲裁的协议和两阶段提交确保数据一致性。PayPal 首席 MTS Yaping Shi写道:


实际上,PayPal 的每一个核心后端服务都依赖于 JunoDB,从登录到风险再到最终的交易处理。使用 JunoDB,应用程序可以有效地存储和缓存数据,以便在关系数据库和其他服务上快速访问以及降低负载。



图片来源:https://medium.com/paypal-tech/unlocking-the-power-of-junodb-paypals-key-value-store-goes-open-source-ee85f935bdc1

 

该数据库主要包含三个组件:JunoDB 客户端库(有面向不同语言的版本)、JunoDB 客户端代理(一个连接存储服务器并负责分片的负载平衡器),以及 JunoDB 存储(基于高性能嵌入式数据库RockDB,同时提供了内存和磁盘持久化存储)。

 

如果出现节点故障,那么它提供的自动化即时故障转移功能避免了集群领导的重新选举或数据的重新分配。

 

对于这个新的 NoSQL 解决方案,其建议的应用场景包括缓存、存储用户首选项、帐户详情和 API 响应等信息、幂等性(确保操作幂等并消除任何重复处理)和延迟桥接(帮助解决由跨区域的分布式数据库所造成的复制延迟)。Shi 介绍了该项目在 PayPal 内部的演进情况:


它最初是一个单线程的 C++程序,但后来,为了实现高并发和多核友好性,我们用 Golang 进行了重写。JunoDB 还从一个短 TTL(生存时间)的内存数据存储演变为一个支持长 TTL 的持久数据存储。默认情况下,它通过磁盘加密和 TLS 传输来提升数据的安全性。

 

Mercado Libre 高级软件工程师 Nahim Felicito Gomez评论道:


使用 Golang 重写 JunoDB,PayPal 充分利用了该语言的并发性和多核能力,那也是 Golang 成为构建 JunoDB 客户端库的理想选择的原因。

 

Hacker News上,许多用户讨论了该项目及键值存储的好处,并将 JunoDB 与FoundationDB等其他数据库进行了比较,而用户 gregwebs 则质疑公告中缺乏数据:


如果能看到一些基准测试,或者只是提供一些数据,那就太好了。TiKV是 CNCF 捐赠的项目,具有大致相同的架构,并已部署在超过 200 个节点的大型集群中。

 

JunoDB 是GitHub上的一个开源项目,遵循 Apache 2 许可。为了帮助开发人员有效地使用该数据库,PayPal 发布了服务器设置客户端构建视频教程。该项目的路线图上还包括 Golang 客户端和 Kubernetes JunoDB 操作符。

 

原文链接:

https://www.infoq.com/news/2023/06/paypal-junodb-kv-store/


相关阅读:

Skyscanner 数据文化的改进之道

DevSecOps,将安全性集成到软件开发的每一个阶段

零拷贝技术升级,V6D 让数据传输更高效

2023-06-24 08:004804

评论 1 条评论

发布
用户头像
如果已经存储10亿条数据在内了,一天存取3500亿还是可以的,如果本身10条数据,任何一个循环存储本地map对象都比这个快。。。。。
2023-08-01 21:36 · 广东
回复
没有更多了
发现更多内容

让编程变成一种享受-明基RD320U显示器

陈老老老板

Svelte 最新中文文档翻译(11)—— 动画相关语法 transition、in、out、animate

冴羽

vue.js 前端 React Svelte SvelteKit

DeepSeek-R1满血版性能飙升四倍,成本大降,竟是因为……

天翼云开发者社区

大模型 AI应用 DeepSeek

数字化转型,五大系统要上哪些?

积木链小链

数字化转型 企业管理 制造业

《Indie Tools • 半月刊》第001期

Immerse

《Operating System Concepts》阅读笔记:p26-p33

codists

操作系统

花西子携手赛博威共创新品创新平台,驱动“新质美力”高质量发展

赛博威科技

数字化转型 赛博威

提问攻略:如何让 DeepSeek 更懂你?

测吧(北京)科技有限公司

测试

使用实例:DeepSeek 在工作中的惊艳表现

测吧(北京)科技有限公司

测试

在华为开发者空间,使用鲲鹏BoostKit数学库优化程序性能

华为云开发者联盟

人工智能 C语言 云主机 鲲鹏 BoostKit

AI与大数据:双剑合璧的智能革命

天津汇柏科技有限公司

AI #大数据

用户或有意或不经意正在使用零信任理念解决安全问题

芯盾时代

统一身份认证 零信任

百度百舸 DeepSeek 一体机发布,支持昆仑芯 P800 单机 8 卡满血版开箱即用

Baidu AICLOUD

专有云 昆仑芯 百度百舸 DeepSeek

人工智能丨提问攻略:如何让 DeepSeek 更懂你?

测试人

人工智能

《Operating System Concepts》阅读笔记:p17-p25

codists

操作系统

夜莺监控发布 v8.beta5 版本,优化 UI,新增接口认证方式便于鉴权

巴辉特

Nightingale 夜莺监控 开源监控

电子病历信息系统(源码+文档+部署+讲解)

深圳亥时科技

Flink Materialized Table:构建流批一体 ETL

Apache Flink

大数据 flink 实时计算 流批一体

平台工程年度盘点与2025展望

杨振涛

DevOps 云原生 平台工程 平台工程社区 PECommunity

DeepSeek的出现,让我们重新审视了仿真软件

思茂信息

AI 仿真 DeepSeek

PayPal开源JunoDB,支持3500亿次日请求的键值存储_数据库_Renato Losio_InfoQ精选文章