

 写点什么

登录/注册

分布式数据存储

收录了分布式数据存储频道下的 50 篇内容

讲给普通人听的分布式数据存储

在AWS这么多的数据存储选项中，应该如何选择？在这分成三部分的博客系列中，我将试图对这些常见问题做一些澄清。在第一部分，我会论述高可用性的基础，以及为什么冗余是实现高可用性的常用方法。我也简要地提到在数据层加入冗余会带来新的问题。在第二部分，我会讨论这其中的一些问题，以及在克服这些问题时你需要考虑的取舍。第三部分在这些信息的基础上，论述AWS特定的数据存储选项，以及每个存储选项的优化所针对的是哪些工作负载。在你读完本博客系列的全部三部分之后，你就会赞同AWS提供了丰富的数据存储产品，并学会针对正确的工作负载选择正确的数据存储产品。

作者 : Slavik Dimitrovich

2015-09-24

10950

高可用分布式流数据存储设计

高可用分布式流数据存储设计

本次分享介绍京东高可用分布式流数据存储系统的架构。

作者 : 李玥

2019-08-06

4555

Apache Pinot 1.0发布，提供实时的分布式OLAP数据存储

Apache Pinot 1.0 发布，提供实时的分布式 OLAP 数据存储

Apache Pinot 是一个使用 Java 编写的开源列式分布式数据存储系统。

作者 : Johan Janssen 译者: 明知山策划: Tina

2024-01-06

0

分布式数据库的存储设计改进

为什么 hdfs 的 namenode 没有存储块的对应节点信息，导致启动 hdfs 的时候，datanode 需要扫描所有的数据块，再将该 datanode 上的块信息发送给 namenode，namenode 才能构建完整的元数据信息。根据文件和数据块的多少，启动 hdfs 的时候需要几分钟到几个小时。对比下分布式数据库，如果把记录对应的节点信息发送给 Master，那就不可想象了。所以在分布式数据库中 hdfs 的存储策略不可取。同时我最近一直被目前的分布式数据库的存储上有几个问题困扰着。

作者 : 江和慧

2017-09-13

2161

LogDevice：来自 Facebook 的分布式日志数据存储系统

做过分布式系统的人都知道，想要在大规模集群下处理高并发事务时同时满足CAP（一致性、可用性、分区容错），从理论上来说不可能，当然听说最近谷歌已经实现了这样的分布式系统，但是总的来说确实非常难。对于社交媒体的海量日志文件，如果我们也提出了需要确保高可用、持续写入数据、按照记录顺序返回数据等三条要求，你觉得是否可以实现？FaceBook的LogDevice实现了。

作者 : 麦克周

2017-10-22

4206

SQL 分布式缓存与数据存储 VMware vFabric SQLFire 简介

VMware vFabric SQLFire是个内存、分布式、基于SQL的缓存，可以与传统数据库协同工作将数据持久化到磁盘上。

作者 : Abel Avram 译者: 张龙

2011-07-25

3639

独家解读！京东高可用分布式流数据存储的架构设计

独家解读！京东高可用分布式流数据存储的架构设计

本文主要介绍了京东高可用分布式流数据存储系统的架构，内容涵盖流数据存储集群的高可用架构设计，改进于 Raft 的流数据选举和复制机制和理解数据流的特性和针对性性能优化手段等内容。

作者 : 李玥

2019-06-12

19436

如何使用 YashanDB 进行分布式数据存储

在现代数据库技术领域，随着数据量的爆发性增长和业务复杂性的提升，传统单机数据库在性能、可扩展性和高可用性方面的限制日益凸显。分布式数据存储作为应对海量数据和高并发访问的有效解决方案，逐渐成为大规模数据处理的主流架构选择。然而，分布式环境带来

数据库砖家

2025-10-04

0

分布式存储的元数据设计

虽然分布式存储的存储层和上传下载这一层很重要，但在元数据方面有哪些选择，这些选择有什么优缺点则更为重要。在QCon北京2015大会上，七牛云存储首席架构师李道兵结合自己多年的实践和思考，分享了关于存储设计的几大方法，并详细地分析了各自的利弊。

作者 : 李道兵

2015-06-09

4441

分布式 KV 存储秒级扩缩容与数据零误差的实现之道 | 腾讯云数据库 DBTalk



分布式 KV 存储秒级扩缩容与数据零误差的实现之道 | 腾讯云数据库 DBTalk

的存储模块。存储的。如何保证事务跨越多个数据分片而不丢失数据。为提高性能、降低成本所做的优化。扫码添加企微小助手，加入开发者企微群，获取直播回放、参与有奖互动!

演讲人: 刘畅

2025-03-28

0

YashanDB 分布式数据存储一致性保障机制

分布式数据库系统中，如何保障数据一致性是核心技术难题之一。数据一致性保障直接影响系统的可靠性、并发性能及数据准确性。分布式环境下，数据分片、节点故障、网络异步传输等因素容易引发数据不一致情况，进而威胁业务连续性和数据完整性。因此，设计完善的

数据库砖家

2025-08-19

0

像用水用电一样用数据库:分布式KV存储秒级扩缩容的实现之道



像用水用电一样用数据库: 分布式 KV 存储秒级扩缩容的实现之道

像用水用电一样用数据库:分布式KV存储秒级扩缩容的实现之道

演讲人: 刘畅

2025-04-27

0

分布式存储中的数据分布策略

分布式存储中的数据分布策略

本文提出一种分层的数据放置策略DPRD。DPRD主要应用于分布式存储系统中，目前DPRD应用于Zeppelin中。

作者 : 赵明寰

2019-11-26

136

2010 年代的分布式系统（一）：存储之数据库篇

2010 年代的分布式系统（一）：存储之数据库篇

无论哪个时代，存储都是一个重要的话题，今天先聊聊数据库。在过去的几年，数据库技术上出现了几个很明显的趋势。

作者 : 黄东旭策划: 田晓旭

2019-12-26

3816

LinkedIn如何对分布式列式OLAP数据存储Pinot进行实时自动调优？

LinkedIn 如何对分布式列式 OLAP 数据存储 Pinot 进行实时自动调优？

从实时流中摄取行对数据查询服务提出了一系列独特的挑战。Pinot一直在努力解决这些挑战，并随着时间的推移，做得越来越好。

作者 : Subbu Subramaniam 译者: 姚佳灵策划: 蔡芳芳

2019-09-17

505

深入解读 YashanDB 数据库的分布式存储技术创新

如何优化大规模数据环境下的查询速度和数据处理能力，是分布式数据库技术研究和应用的核心问题。随着业务系统的数据规模急剧增长，传统单机数据库面临的存储瓶颈和性能瓶颈逐渐显现，严重影响系统的实时响应和可用性。分布式存储技术作为解决海量数据高效管理

数据库砖家

2025-10-09

0

分布式数据库架构：高可用、高性能的数据存储

分布式数据库架构：高可用、高性能的数据存储

在现代信息时代，数据是企业发展的核心。为了支持海量数据的存储、高并发访问以及保证数据的可靠性，分布式数据库架构应运而生。

分布式数据库

高性能

高可用性

互联网工科生

2023-08-22

0

YashanDB 数据库的分布式存储与一致性协议详解

在现代应用场景中，如何优化数据库的查询速度一直是技术领域内的重要议题。随着数据量的不断增长，传统的单机数据库已无法满足对高可用性和高并发的需求。分布式存储架构因其优越的扩展性和容错能力逐渐成为主流。在分布式环境中，确保数据一致性和处理并发事

数据库砖家

01-15

0

通过 YashanDB 实现数据的分布式存储

数据存储是现代企业应用中的重要组成部分，尤其在大数据时代，数据量急剧增加，传统单机数据库面临性能瓶颈和数据一致性问题。为了解决这些挑战，分布式数据库技术应运而生，YashanDB作为一种高性能、支持分布式存储的数据库系统，提供了灵活的架构实现。本文

数据库砖家

2025-07-11

0

一文熟知存储 – 从磁盘到文件，到数据库，到分布式环境集中式存储，再到分布式数据库

一文熟知存储 – 从磁盘到文件，到数据库，到分布式环境集中式存储，再到分布式数据库

相信我，认真读完之后，你是业余数据库选手里靠前的，至少不至于民科。

数据库

分布式事务

分布式系统

2023-07-25

0