收录了 数据库存储 频道下的 50 篇内容
近年来 HTAP 数据库受到工业界和学术界越来越多的关注,数据库存储引擎也从以往的面向 TP 场景的行存和面向 AP 场景的列存储独立发展的道路,走向了行存 + 列存并由存储引擎根据数据冷热度自动调度数据分布的混和形式,以实现在同一份数据上同时满足 TP AP 两种需求,并且降低用户存储成本,同时结合云原生时代的廉价对象存储可以进一步降低用户成本,本次分享将带来业界在存储引擎方向兼容 TP 与 AP 能力,打造极致性能的探索与实践。
近日,O'Reilly Radar发表了一篇文章,探讨闪存如何改变了数据库存储引擎的设计,其作者是已在O'Reilly Media工作了22年的Andy Oram。为了写那篇文章,他采访了数位数据库专家,其中包括Aerospike、Cassandra、FoundationDB、RethinkDB和Tokutek的代表人物。
京东基于ChuBaoFS+Vitess的低成本数据库存储计算分离实现方案——Disca。
2017 年时序数据库忽然火了起来。开年 2 月 Facebook 开源了 beringei 时序数据库;到了 4 月基于 PostgreSQL 打造的时序数据库 TimeScaleDB 也开源了,而早在 2016 年 7 月,百度云在其天工物联网平台上发布了国内首个多租户的分布式时序数据库产品 TSDB,成为支持其发展制造,交通,能源,智慧城市等产业领域的核心产品,同时也成为百度战略发展产业物联网的标志性事件。时序数据库作为物联网方向一个非常重要的服务,业界的频频发声,正说明各家企业已经迫不及待的拥抱物联网时代的到来。 本文会从时序数据库的基本概念、使用场景、解决的问题一一展开,最后会从如何解决时序数据存储这一技术问题入手进行深入分析。
作为Amazon Aurora的竞品,微软推出的Azure SQL DB Hyperscale是一种基于SQL的高度可扩展的服务层,借助SQL DB Hyperscale,数据库可以快速自动扩展至100TB,无需预先配置存储资源,并显著扩大应用程序增长的潜力,而不受存储大小的限制。
云数据库服务。云数据库服务广泛使用在游戏玩家信息和状态管理、配对、排行榜、装备财产清单、社交、埋点数据捕获与分析等场景,它可以在全球范围内提供更低延迟的多玩家体验,并大幅减少数据库管理运维工作。
DingoDB提供了同时处理结构化和非结构化数据的能力,其多模态特性使其在处理不同类型的数据时更加灵活和高效。
每种NoSQL数据库最重要的应用场景。
本文主要以介绍方法为主,落地过程可以归纳为方案->收益测算->数据安全验证->系统稳定性验证->灰度与回滚。文中的账单系统通过step1大表压缩32%,step2大JSON字段序列化12%,step3删除无效数据10%,3个方案的顺利落地,有效的减少了50.7%的磁盘空间,成本下
亿多人。 数据库进行数据存储。业务发展,用户量增长迅速,存储在云端的数据量越来越大,海量数据给后端存储和数据库带来了巨大的挑战。
本文来自OceanBase社区分享,仅限交流探讨。原作者马伟,长期从事互联网广告检索系统的研发,对数据库,编译器等领域也有浓厚兴趣。
2023 可信数据库发展大会上,中国移动信息技术中心政企业务支撑中心副总经理梁恩磊论道我国数据库自立自强之路。
深度解密阿里GDB图数据库的设计架构与产品化实践
物联网领域近期如火如荼,互联网和传统公司争相布局物联网。作为物联网领域数据存储的首选,时序数据库也越来越多进入人们的视野,而早在2016年7月,百度云在其天工物联网平台上发布了国内首个多租户的分布式时序数据库产品TSDB,成为支持其发展制造,交通,能源,智慧城市等产业领域的核心产品,同时也成为百度战略发展产业物联网的标志性事件。 前文提到低成本的存储是时序数据库需要解决的一个主要问题,而上一篇文章介绍了通过针对时序数据的压缩方法,从利用数据本身特征的方面,降低时序数据的存储成本。 本文将介绍通过对数据进行分级存储,从使用不同存储介质,以及减少数据的副本数的方面,介绍如何在保证时序数据的查询性能的前提下,降低时序数据的存储成本。
如图所示,表示发起一个请求时,涉及到数据库的相关操作,在前面的文章中我们说过,如果服务端要提升整体的吞吐量,就必须要减少每一次请求的处理时长,那么在当前这个场景中,数据库层面哪些因素会影响到性能呢?
2021-06-24 23:15:50.190193 IP 172.17.136.216.3306 > 218.76.8.219.57423: Flags [.], ack 63, win 229, length 0
专业的向量数据库需要有长时间的积累和投入才能做得出来,但相应的它的天花板也更高。
本文来自OceanBase社区分享,仅限交流探讨。原作者马伟,长期从事互联网广告检索系统的研发,对数据库,编译器等领域也有浓厚兴趣。
为什么 hdfs 的 namenode 没有存储块的对应节点信息,导致启动 hdfs 的时候,datanode 需要扫描所有的数据块,再将该 datanode 上的块信息发送给 namenode,namenode 才能构建完整的元数据信息。根据文件和数据块的多少,启动 hdfs 的时候需要几分钟到几个小时。 对比下分布式数据库,如果把记录对应的节点信息发送给 Master,那就不可想象了。所以在分布式数据库中 hdfs 的存储策略不可取。同时我最近一直被目前的分布式数据库的存储上有几个问题困扰着。