写点什么

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

  • 2025-04-11
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

谷歌最近为其在 Google Cloud 上的分布式 SQL 数据库 Spanner 引入 了分层存储。这种分层存储架构包含一种新的 HDD 存储选项,比现有的 SSD 选项便宜 80%,可降低旧数据的存储成本,同时尽可能减少与传统数据迁移相关的开销。


该架构中,默认的 SSD 层是为需要高吞吐量和低延迟的数据而设计的,新的 HDD 层则是为不经常访问或对延迟不敏感的较大数据集而设计的。存储分层 架构由策略驱动:作为维护任务的一部分,异步后台进程会根据用户定义的策略自动将数据从 SSD 移动到 HDD。无论数据在哪个存储层,SQL 查询都可以访问 SSD 和 HDD 层上的数据,并且备份策略在所有数据上一致应用。


谷歌团队强调,对于大多数数据库记录而言,数据的运营价值会随着时间的推移而降低,而其报告和合规性作用则会增强。这种转变意味着旧的“冷”数据不需要像当前的“热”事务数据那样具有高性能访问能力,从而鼓励公司寻求更具成本效益的历史信息存储解决方案。



来源:Google Cloud 博客


谷歌软件工程师 Matthew Muckloo 和谷歌集团产品经理 Piyush Mathur 写道:

迁移到其他类型的存储通常需要复杂的数据管道,并且会影响操作系统的性能。手动在存储解决方案之间分离数据可能会导致读取不一致,需要应用程序级的协调。此外,这种分离对应用程序查询当前和历史数据(例如响应监管机构)的操作施加了重大限制;它还增加了需要审计的治理接触点。


现在用户可以在各种 Spanner 级别(数据库、表、列或二级索引)实施存储分层策略,并可以灵活地将特定数据移动到速度较慢但成本较低的 HDD 存储。例如,很少访问的数据(如 JSON 产品属性)可以移动到 HDD,而无需重构表,并且可以将索引保留在更快的 SSD 上,同时将实际数据存储在 HDD 上。


要启用分层存储,必须创建一个定义存储选项 [SSD(默认)/HDD] 的位置组,并可以选择定义 ssd_to_hdd_spill_timespan 来指定在压缩周期将数据移动到 HDD 之前应在 SSD 上保留数据的时间。例如:


CREATE LOCALITY GROUP recent_on_ssd OPTIONS (storage = 'ssd', ssd_to_hdd_spill_timespan = '15d');
复制代码


创建 SSD 到 HDD 溢出策略。在移动数据之前,数据必须在 SSD 中存储至少 1 小时。


Google Spanner 不是唯一提供分层存储的分布式云数据库。Amazon DynamoDB 隐藏了所使用的存储技术,提供具有不同存储和检索费用的标准和标准 IA 存储类别。


Spanner 的分层存储支持 GoogleSQL 和 PostgreSQL 方言,并且在所有提供 Spanner 的 Google Cloud 区域中都可用。可以从 System Insights 监控 HDD 使用情况。


原文链接:

Google Cloud Introduces HDD Tier for Spanner Database, Cutting Cold Storage Costs by 80%(https://www.infoq.com/news/2025/03/google-spanner-tiered-storage/)

2025-04-11 08:0011000

评论

发布
暂无评论

Linux下TCP网络编程-创建服务器与客户端

DS小龙哥

3月月更

大数据自动管理,24 小时服务无间断,StarRocks 如何做到?

StarRocks

大数据 数据分析 StarRocks

Linux之file命令

入门小站

Linux

开放报名丨《音视频社交新风口》线上峰会,聚焦海外社交生态升级

融云 RongCloud

java版gRPC实战之四:客户端流

程序员欣宸

gRPC grpc双向流

web前端培训-MySQL的索引下推解析

@零度

MySQL 前端开发

java版gRPC实战之五:双向流

程序员欣宸

gRPC grpc双向流

java版gRPC实战之六:客户端动态获取服务端地址

程序员欣宸

gRPC grpc双向流

《2022网络威胁形势研究报告》重磅发布 | 附下载

青藤云安全

java培训-JVM内存分配面试题分享

@零度

JVM JAVA开发

学习编程是最好的复利方式

FunTester

FunTester

java版gRPC实战之三:服务端流

程序员欣宸

gRPC

java版gRPC实战之七:基于eureka的注册发现

程序员欣宸

gRPC 注册中心 eureak

JavaScript数组,看这篇就ok了!

坚果

3月月更

生产环境频繁内存溢出,原来就是因为这个“String类”

华为云开发者联盟

jdk JVM 内存 字符串 String类

java版gRPC实战之二:服务发布和调用

程序员欣宸

Java gRPC

100行代码实现HarmonyOS“画图”应用,eTS开发走起!

HarmonyOS开发者

HarmonyOS ETS ArKUI 3.0

云效持续交付流水线,免费还好用!

阿里云云效

云计算 阿里云 持续集成 持续交付 持续交付流水线

2.7万只!当前及未来仍将是量化交易的黄金期

非凸科技

rust 招聘 机器学习算法 算法交易

《LeetCode刷题报告》题解内容 Ⅲ

謓泽

3月月更

在线正则表达式大全测试

入门小站

工具

在线Javascript美化格式化工具

入门小站

工具

求职有 Pulsar | 中国联通、StreamNative 多个热招岗位

Apache Pulsar

开源 云原生 代码 Apache Pulsar 岗位招聘

亚马逊云科技创新大会 | 云基础架构

亚马逊云科技 (Amazon Web Services)

架构

TiDB 在携程 | 实时标签处理平台优化实践

PingCAP

如何判断线程池已经执行完所有任务了?

CRMEB

面试突击35:如何判断线程池已经执行完所有任务了?

王磊

Java java面试

TDengine 助力国产芯片打造“梦芯解算”,监测地质灾害 24 小时无间断

TDengine

数据库 tdengine 物联网

基于服务网格的分布式 ESB, 实现应用无关的传统 ESB 转型升级

BoCloud博云

微服务 ESB

架构实战营-模块一-作业

CityAnimal

架构实战营 #架构实战营 「架构实战营」

一个服务器轻松存储上亿数据,TDengine 在北京智能建筑边缘存储的应用

TDengine

数据库 tdengine 物联网

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%_云计算_Renato Losio_InfoQ精选文章