写点什么

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

  • 2025-04-11
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

谷歌最近为其在 Google Cloud 上的分布式 SQL 数据库 Spanner 引入 了分层存储。这种分层存储架构包含一种新的 HDD 存储选项,比现有的 SSD 选项便宜 80%,可降低旧数据的存储成本,同时尽可能减少与传统数据迁移相关的开销。


该架构中,默认的 SSD 层是为需要高吞吐量和低延迟的数据而设计的,新的 HDD 层则是为不经常访问或对延迟不敏感的较大数据集而设计的。存储分层 架构由策略驱动:作为维护任务的一部分,异步后台进程会根据用户定义的策略自动将数据从 SSD 移动到 HDD。无论数据在哪个存储层,SQL 查询都可以访问 SSD 和 HDD 层上的数据,并且备份策略在所有数据上一致应用。


谷歌团队强调,对于大多数数据库记录而言,数据的运营价值会随着时间的推移而降低,而其报告和合规性作用则会增强。这种转变意味着旧的“冷”数据不需要像当前的“热”事务数据那样具有高性能访问能力,从而鼓励公司寻求更具成本效益的历史信息存储解决方案。



来源:Google Cloud 博客


谷歌软件工程师 Matthew Muckloo 和谷歌集团产品经理 Piyush Mathur 写道:

迁移到其他类型的存储通常需要复杂的数据管道,并且会影响操作系统的性能。手动在存储解决方案之间分离数据可能会导致读取不一致,需要应用程序级的协调。此外,这种分离对应用程序查询当前和历史数据(例如响应监管机构)的操作施加了重大限制;它还增加了需要审计的治理接触点。


现在用户可以在各种 Spanner 级别(数据库、表、列或二级索引)实施存储分层策略,并可以灵活地将特定数据移动到速度较慢但成本较低的 HDD 存储。例如,很少访问的数据(如 JSON 产品属性)可以移动到 HDD,而无需重构表,并且可以将索引保留在更快的 SSD 上,同时将实际数据存储在 HDD 上。


要启用分层存储,必须创建一个定义存储选项 [SSD(默认)/HDD] 的位置组,并可以选择定义 ssd_to_hdd_spill_timespan 来指定在压缩周期将数据移动到 HDD 之前应在 SSD 上保留数据的时间。例如:


CREATE LOCALITY GROUP recent_on_ssd OPTIONS (storage = 'ssd', ssd_to_hdd_spill_timespan = '15d');
复制代码


创建 SSD 到 HDD 溢出策略。在移动数据之前,数据必须在 SSD 中存储至少 1 小时。


Google Spanner 不是唯一提供分层存储的分布式云数据库。Amazon DynamoDB 隐藏了所使用的存储技术,提供具有不同存储和检索费用的标准和标准 IA 存储类别。


Spanner 的分层存储支持 GoogleSQL 和 PostgreSQL 方言,并且在所有提供 Spanner 的 Google Cloud 区域中都可用。可以从 System Insights 监控 HDD 使用情况。


原文链接:

Google Cloud Introduces HDD Tier for Spanner Database, Cutting Cold Storage Costs by 80%(https://www.infoq.com/news/2025/03/google-spanner-tiered-storage/)

2025-04-11 08:0010630

评论

发布
暂无评论

GitOps系列|云原生时代,你还不懂GitOps?

极狐GitLab

security CI/CD gitops

不吹不黑!阿里新产微服务架构进阶笔记我粉了!理论实战齐飞

Java 程序员 架构 面试 微服务

实用?HUAWEI高工总结出15W字的图解计算机操作系统指南手册

Java~~~

Java 架构 面试 TCP 网络协议

一个不起眼却非常实用的功能介绍

ThingJS数字孪生引擎

大前端 物联网 可视化 数字孪生

浅谈单点登录SSO实现方案 | StartDT Tech Lab 06

奇点云

模型工厂,让AI算法触手可达 | StartDT Tech Lab 05

奇点云

量化交易系统软件开发(源码)

Geek_23f0c3

量化交易机器人系统开发 量化策略 智能量化交易软件

打爆怪兽 一起来养猪 养蜂人 幸福饭店 山海经 弹球 旅行世界

游戏开发_软件开发

DataMaleon组件化开发实践 | StartDT Tech Lab 14

奇点云

灰度再度增持!!!Filecoin可投资吗?Filecoin值得投资吗?

区块链 分布式存储 IPFS 投资filecoin filecoin值得投资吗

TLS协议分析 (九) 现代加密通信协议设计

OpenIM

数据仓库领域常见建模方法及实例演示 | StartDT Tech Lab 16

奇点云

操作系统的IO模型

Java 程序员 架构 操作系统 计算机

狂刷《Java权威面试指南(阿里版)》,冲击“金九银十”有望了

Java 编程 架构 面试 程序人生

浅谈对象体系 | StartDT Tech Lab 07

奇点云

吃透HTTP原理,教你建立安全的HTTPS网站

博文视点Broadview

Rust从0到1-完结

rust

性能优化之分页查询 | StartDT Tech Lab 12

奇点云

浅谈元数据采集 | StartDT Tech Lab 10

奇点云

开源贡献分享:从网关内服务健康检查说起 | StartDT Tech Lab 09

奇点云

基于OLT(实体、关系、标签)建模方法论的最佳实践 | StartDT Tech Lab 08

奇点云

写了一年golang,来聊聊进程、线程与协程

捉虫大师

线程 进程 协程 Go 语言

分布式任务调度的应用分享 | StartDT Tech Lab 13

奇点云

分享 | RadonDB 的开源之路(4 千字长文)

RadonDB

MySQL 数据库 RadonDB

如何优雅地设计DWS层? | StartDT Tech Lab 17

奇点云

大数据安全验证之Kerberos | StartDT Tech Lab 11

奇点云

成为优秀架构师需要具备哪些能力?

卢卡多多

架构师 服务 9月日更

为什么在 Windows 下用 Ctrl+Z 退出 Python 而 Linux 下用 Ctrl+D 呢?

小拍Piper

Python Linux windows

TCP传输控制协议(二)

姬翔

9月日更

清华大牛带领20位大厂专家耗时三年整理出这份2000页Java进阶指南

Java~~~

Java 架构 面试 微服务 多线程

26岁!月薪38k,全靠这份GitHub百万下载的阿里P5-P9知识核心手册

Java~~~

Java 架构 面试 微服务 多线程

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%_云计算_Renato Losio_InfoQ精选文章