2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

  • 2025-04-11
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

谷歌最近为其在 Google Cloud 上的分布式 SQL 数据库 Spanner 引入 了分层存储。这种分层存储架构包含一种新的 HDD 存储选项,比现有的 SSD 选项便宜 80%,可降低旧数据的存储成本,同时尽可能减少与传统数据迁移相关的开销。


该架构中,默认的 SSD 层是为需要高吞吐量和低延迟的数据而设计的,新的 HDD 层则是为不经常访问或对延迟不敏感的较大数据集而设计的。存储分层 架构由策略驱动:作为维护任务的一部分,异步后台进程会根据用户定义的策略自动将数据从 SSD 移动到 HDD。无论数据在哪个存储层,SQL 查询都可以访问 SSD 和 HDD 层上的数据,并且备份策略在所有数据上一致应用。


谷歌团队强调,对于大多数数据库记录而言,数据的运营价值会随着时间的推移而降低,而其报告和合规性作用则会增强。这种转变意味着旧的“冷”数据不需要像当前的“热”事务数据那样具有高性能访问能力,从而鼓励公司寻求更具成本效益的历史信息存储解决方案。



来源:Google Cloud 博客


谷歌软件工程师 Matthew Muckloo 和谷歌集团产品经理 Piyush Mathur 写道:

迁移到其他类型的存储通常需要复杂的数据管道,并且会影响操作系统的性能。手动在存储解决方案之间分离数据可能会导致读取不一致,需要应用程序级的协调。此外,这种分离对应用程序查询当前和历史数据(例如响应监管机构)的操作施加了重大限制;它还增加了需要审计的治理接触点。


现在用户可以在各种 Spanner 级别(数据库、表、列或二级索引)实施存储分层策略,并可以灵活地将特定数据移动到速度较慢但成本较低的 HDD 存储。例如,很少访问的数据(如 JSON 产品属性)可以移动到 HDD,而无需重构表,并且可以将索引保留在更快的 SSD 上,同时将实际数据存储在 HDD 上。


要启用分层存储,必须创建一个定义存储选项 [SSD(默认)/HDD] 的位置组,并可以选择定义 ssd_to_hdd_spill_timespan 来指定在压缩周期将数据移动到 HDD 之前应在 SSD 上保留数据的时间。例如:


CREATE LOCALITY GROUP recent_on_ssd OPTIONS (storage = 'ssd', ssd_to_hdd_spill_timespan = '15d');
复制代码


创建 SSD 到 HDD 溢出策略。在移动数据之前,数据必须在 SSD 中存储至少 1 小时。


Google Spanner 不是唯一提供分层存储的分布式云数据库。Amazon DynamoDB 隐藏了所使用的存储技术,提供具有不同存储和检索费用的标准和标准 IA 存储类别。


Spanner 的分层存储支持 GoogleSQL 和 PostgreSQL 方言,并且在所有提供 Spanner 的 Google Cloud 区域中都可用。可以从 System Insights 监控 HDD 使用情况。


原文链接:

Google Cloud Introduces HDD Tier for Spanner Database, Cutting Cold Storage Costs by 80%(https://www.infoq.com/news/2025/03/google-spanner-tiered-storage/)

2025-04-11 08:0010962

评论

发布
暂无评论

2020年书单

井中人

甲方日常72

句子

工作 随笔杂谈 日常

执法办案信息化建设,情报研判管控分析平台搭建解决方案

t13823115967

智慧公安

向我看齐!京东智联云成 2020 TOP100 Summit“技术标兵”

京东科技开发者

DevOps 云原生 数字化

数字货币交易所系统开发功能方案

Service Mesh最火项目Istio是怎么做流量管理的?

AI乔治

Java 架构 istio

使用基于 SpringMVC 的透明 RPC 开发微服务

AI乔治

Java spring 架构 微服务 Spring Cloud

谁告诉你观察者就是发布订阅模式的!抽他!

爱笑的架构师

设计模式 23种设计模式 观察者模式 Java设计模式 七日更

【理论篇】浅析分布式中的 CAP、BASE、2PC、3PC、Paxos、Raft、ZAB

merlinfeng

大数据 分布式

做音视频最好用的几款跨平台框架

anyRTC开发者

flutter uni-app ios android WebRTC

世界之书:《麦田里的守望者》与在虚无中创造希望

lidaobing

麦田里的守望者 28天写作

生产环境全链路压测建设历程17:某快递A股上市公司的生产压测案例之前言

数列科技杨德华

全链路压测 七日更

Gridea+GitHub搭建个人博客

Simon

GitHub Pages 博客 七日更

Spring 源码学习 09:refresh 大概流程

程序员小航

spring 源码 源码阅读

OLAP计算引擎怎么选?

数据社

OLAP 七日更

得物(毒)APP,8位抽奖码需求,这不就是产品给我留的数学作业!

小傅哥

Java 小傅哥 编程开发 七日更 数学逻辑

Fair World智能合约APP系统软件开发

系统开发

小白干货奇遇记

熊斌

个人成长 七日更

堪称完美!阿里架构师用60个实战案例讲明白了Spring Boot

Java架构追梦

Java 架构 面试 微服务 springboot

发布会直播技术及业务实践

vivo互联网技术

分布式 服务器 直播技术

盘点 2020 | 鲜衣怒马少年时,不负韶华行且知!

程序员的时光

程序员 成长 编程之路 计算机 盘点2020

合成游戏app系统开发软件技术

四币连发交易所系统开发技术

Windows安装MySQL5.7教程

Simon

MySQL windows 安装 七日更

突破程序员基本功的16课

田维常

程序员

编程之美!从线程池状态管理来看二进制操作之美

Geek Tech

Java 源码分析 线程池

2020 微信头像圣诞帽来啦,快给 TA 戴帽子吧~

mghio

圣诞帽 微信头像 圣诞节

入门参考:从Go中的协程理解串行和并行

soolaugust

Go Concurrency Patterns 七日更 Go 语言

智慧社区综合信息服务平台搭建,智能社区建设解决方案

t13823115967

智慧社区系统开发

【经验分享】遵循10步法,应用系统发布效率大不同!

嘉为蓝鲸

敏捷 运维自动化 部署 发布流程 应用发布

Polkadot系列(三)——如何实现共享安全性

QTech

区块链 polkadot 跨链

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%_云计算_Renato Losio_InfoQ精选文章