
最近,谷歌云推出了Bigtable分层存储的预览版。这项新功能允许开发人员在单个 Bigtable 实例中管理热数据和冷数据,在保证保所有数据可访问的同时优化成本。
借助 Bigtable 的这项新功能,开发人员可以为表设置基于年龄的分层策略,最低年龄阈值为 30 天。该服务会自动在 SSD 和非频繁访问层之间移动数据,无需手动导出不常访问的数据。
谷歌高级产品经理Anton Gething和软件工程师Derek Lee解释了分层存储如何减少运维开销并避免手动数据迁移。他们写道:
搭配 Bigtable 的自动扩展,这个功能可以优化 Bigtable 实例的资源利用率。此外,开发人员仍然可以通过相同的 Bigtable API 访问非频繁访问存储层中的数据与现有的 SSD 存储。
开发人员可以配置年龄阈值,使数据根据基于年龄的分层策略移动到非频繁访问层。当一个单元格的时间戳超过配置好的年龄时,它就从 SSD 层移动到非频繁访问层。数据移动仅依据单元格的时间戳,不受数据读取频率的影响。
Bigtable是谷歌云提供的一项键值和宽列存储服务,提供托管的低延迟 NoSQL 数据库,可兼容 Cassandra 和 HBase。该服务旨在实现结构化、半结构化或非结构化数据的快速访问。在该服务的常见用例中,云服务提供商建议用它处理制造和汽车等行业中传感器、设备及操作活动产生的时序数据。
这项新功能的文档强调,为了实现最佳的 SSD 性能并充分利用分层存储,在仅访问 SSD 数据的查询中,开发人员应使用时间戳范围过滤器。
由于 Bigtable 的目标是在单个数据库中支持操作型和分析型工作负载,Gething 和 Lee 解释了新推出的分层存储如何简化分析和报告数据的可访问性:
使用 Bigtable SQL 查询不常使用的数据。然后,你可以构建 Bigtable 逻辑视图,将数据以可以按需查询的格式呈现。该功能有助于为特定用户提供报告所需的历史数据访问权限,同时避免授予其对表的完全访问权限。
此外,新功能增加了 Bigtable 节点的存储容量,分层存储节点提供的容量比常规 SSD 节点多 540%。德意志银行首席 DevOps 工程师和副总裁 Florin Lungu评论道:
Bigtable 分层存储提供了一种管理数据成本的解决方案,而又不必牺牲数据。(...)这可能会显著影响组织优化数据存储策略的方式。
要将数据移回 SSD,开发人员可以增加分层策略的年龄阈值使 SSD 包含较早的数据,也可以禁用分层存储,或者用新的时间戳重写数据并删除旧副本。
Bigtable的定价基于计算能力、数据库存储、备份存储和网络使用情况,冷存储比 SSD 存储便宜高达 85%。Bigtable HDD 实例不支持分层存储。此外,它也不支持Bigtable Data Boost和热备份。
今年早些时候,谷歌在 Spanner 上引入了分层存储。InfoQ之前报道过,这是一个托管的分布式 SQL 数据库。
声明:本文为 InfoQ 翻译,未经许可禁止转载。
原文链接:https://www.infoq.com/news/2025/11/google-bigtable-tiered-storage/







评论