写点什么

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

  • 2025-04-11
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

谷歌最近为其在 Google Cloud 上的分布式 SQL 数据库 Spanner 引入 了分层存储。这种分层存储架构包含一种新的 HDD 存储选项,比现有的 SSD 选项便宜 80%,可降低旧数据的存储成本,同时尽可能减少与传统数据迁移相关的开销。


该架构中,默认的 SSD 层是为需要高吞吐量和低延迟的数据而设计的,新的 HDD 层则是为不经常访问或对延迟不敏感的较大数据集而设计的。存储分层 架构由策略驱动:作为维护任务的一部分,异步后台进程会根据用户定义的策略自动将数据从 SSD 移动到 HDD。无论数据在哪个存储层,SQL 查询都可以访问 SSD 和 HDD 层上的数据,并且备份策略在所有数据上一致应用。


谷歌团队强调,对于大多数数据库记录而言,数据的运营价值会随着时间的推移而降低,而其报告和合规性作用则会增强。这种转变意味着旧的“冷”数据不需要像当前的“热”事务数据那样具有高性能访问能力,从而鼓励公司寻求更具成本效益的历史信息存储解决方案。



来源:Google Cloud 博客


谷歌软件工程师 Matthew Muckloo 和谷歌集团产品经理 Piyush Mathur 写道:

迁移到其他类型的存储通常需要复杂的数据管道,并且会影响操作系统的性能。手动在存储解决方案之间分离数据可能会导致读取不一致,需要应用程序级的协调。此外,这种分离对应用程序查询当前和历史数据(例如响应监管机构)的操作施加了重大限制;它还增加了需要审计的治理接触点。


现在用户可以在各种 Spanner 级别(数据库、表、列或二级索引)实施存储分层策略,并可以灵活地将特定数据移动到速度较慢但成本较低的 HDD 存储。例如,很少访问的数据(如 JSON 产品属性)可以移动到 HDD,而无需重构表,并且可以将索引保留在更快的 SSD 上,同时将实际数据存储在 HDD 上。


要启用分层存储,必须创建一个定义存储选项 [SSD(默认)/HDD] 的位置组,并可以选择定义 ssd_to_hdd_spill_timespan 来指定在压缩周期将数据移动到 HDD 之前应在 SSD 上保留数据的时间。例如:


CREATE LOCALITY GROUP recent_on_ssd OPTIONS (storage = 'ssd', ssd_to_hdd_spill_timespan = '15d');
复制代码


创建 SSD 到 HDD 溢出策略。在移动数据之前,数据必须在 SSD 中存储至少 1 小时。


Google Spanner 不是唯一提供分层存储的分布式云数据库。Amazon DynamoDB 隐藏了所使用的存储技术,提供具有不同存储和检索费用的标准和标准 IA 存储类别。


Spanner 的分层存储支持 GoogleSQL 和 PostgreSQL 方言,并且在所有提供 Spanner 的 Google Cloud 区域中都可用。可以从 System Insights 监控 HDD 使用情况。


原文链接:

Google Cloud Introduces HDD Tier for Spanner Database, Cutting Cold Storage Costs by 80%(https://www.infoq.com/news/2025/03/google-spanner-tiered-storage/)

2025-04-11 08:0010989

评论

发布
暂无评论

行云洞见 | 为何都在将研发环境搬上云端?

行云创新

云端IDE 云原生集成开发环境

Redis连接失败问题排查和解决

沐曦与百度飞桨完成兼容性测试,助力计算机视觉应用发展

飞桨PaddlePaddle

StyleGAN 调整面部表情,让虚拟人脸更生动

江户川码农

人工智能 机器学习 图像处理 StyleGAN

小度沈健:以闭环服务赋能场景化智能家居

极客天地

低代码引擎动作编排

codebee

低代码

专业、简单、稳定,融云重新定义互联网通信云服务

融云 RongCloud

互联网 数字化 办公 泛娱乐 通讯

RabbitMq 环境搭建

流火

分片压缩、分片上传,融云 IM 视频文件高速传输方案

融云 RongCloud

视频 IM 方案

【被夸爆的教学!】ChatGPT注册全攻略!新手必看!省时省力又省心!

frank

ChatGPT

快速解决 Linux 内核问题,一站式运维工具 oc-ops 介绍

OpenCloudOS

Linux 开源 操作系统

火山引擎EMR StarRocks场景案例分享

字节跳动数据平台

EMR

软件测试/测试开发丨app自动化测试(iOS)元素定位(新手篇)

测试人

软件测试 自动化测试 测试开发

科技+卫生=智慧公厕,城市焕然一新!

光明源智慧厕所

智慧城市

基于数字孪生技术的船舶智能机舱

Openlab_cosmoplat

开源社区 数字孪生 智能制造

WorkPlus SE专业版即时通讯IM办公平台,赋能中小企业数字化转型

BeeWorks

触控板手势增强软件:Multitouch激活版

真大的脸盆

Mac Mac 软件 触控板 触控板增强

量化合约对冲交易软件|合约一键跟单社区平台系统开发源码

开发微hkkf5566

初学React useEffect Hook

devpoint

React useEffect

地表最强AI,GPT-4专治各种不服

引迈信息

AI ChatGPT

JVM 堆体系结构及其内存调优

Java JVM

数字孪生的安全挑战和机遇

Openlab_cosmoplat

开源社区 数字孪生

头部险企如何打造低代码数据集市,快速构建指标体系

Kyligence

金融科技 指标体系

类似钉钉和企微的企业IM,为什么说私有化部署是企业更好的选择?

BeeWorks

2022 年云原生安全现状报告

York

容器 云原生 安全

CCF BDCI“大数据平台安全事件检测与分类识别”赛题,奇点云夺冠

奇点云

数据安全 奇点云 个人信息保护

低内存、高性能,磁盘索引可以这样玩

Zilliz

非结构化数据 Milvus 向量数据库

老马闲评数字化【4】做数字化会不会被供应商拿捏住

行云创新

云原生 数字化转型 企业数字化

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%_云计算_Renato Losio_InfoQ精选文章