2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

  • 2025-04-11
    北京
  • 本文字数:1108 字

    阅读完需:约 4 分钟

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%

谷歌最近为其在 Google Cloud 上的分布式 SQL 数据库 Spanner 引入 了分层存储。这种分层存储架构包含一种新的 HDD 存储选项,比现有的 SSD 选项便宜 80%,可降低旧数据的存储成本,同时尽可能减少与传统数据迁移相关的开销。


该架构中,默认的 SSD 层是为需要高吞吐量和低延迟的数据而设计的,新的 HDD 层则是为不经常访问或对延迟不敏感的较大数据集而设计的。存储分层 架构由策略驱动:作为维护任务的一部分,异步后台进程会根据用户定义的策略自动将数据从 SSD 移动到 HDD。无论数据在哪个存储层,SQL 查询都可以访问 SSD 和 HDD 层上的数据,并且备份策略在所有数据上一致应用。


谷歌团队强调,对于大多数数据库记录而言,数据的运营价值会随着时间的推移而降低,而其报告和合规性作用则会增强。这种转变意味着旧的“冷”数据不需要像当前的“热”事务数据那样具有高性能访问能力,从而鼓励公司寻求更具成本效益的历史信息存储解决方案。



来源:Google Cloud 博客


谷歌软件工程师 Matthew Muckloo 和谷歌集团产品经理 Piyush Mathur 写道:

迁移到其他类型的存储通常需要复杂的数据管道,并且会影响操作系统的性能。手动在存储解决方案之间分离数据可能会导致读取不一致,需要应用程序级的协调。此外,这种分离对应用程序查询当前和历史数据(例如响应监管机构)的操作施加了重大限制;它还增加了需要审计的治理接触点。


现在用户可以在各种 Spanner 级别(数据库、表、列或二级索引)实施存储分层策略,并可以灵活地将特定数据移动到速度较慢但成本较低的 HDD 存储。例如,很少访问的数据(如 JSON 产品属性)可以移动到 HDD,而无需重构表,并且可以将索引保留在更快的 SSD 上,同时将实际数据存储在 HDD 上。


要启用分层存储,必须创建一个定义存储选项 [SSD(默认)/HDD] 的位置组,并可以选择定义 ssd_to_hdd_spill_timespan 来指定在压缩周期将数据移动到 HDD 之前应在 SSD 上保留数据的时间。例如:


CREATE LOCALITY GROUP recent_on_ssd OPTIONS (storage = 'ssd', ssd_to_hdd_spill_timespan = '15d');
复制代码


创建 SSD 到 HDD 溢出策略。在移动数据之前,数据必须在 SSD 中存储至少 1 小时。


Google Spanner 不是唯一提供分层存储的分布式云数据库。Amazon DynamoDB 隐藏了所使用的存储技术,提供具有不同存储和检索费用的标准和标准 IA 存储类别。


Spanner 的分层存储支持 GoogleSQL 和 PostgreSQL 方言,并且在所有提供 Spanner 的 Google Cloud 区域中都可用。可以从 System Insights 监控 HDD 使用情况。


原文链接:

Google Cloud Introduces HDD Tier for Spanner Database, Cutting Cold Storage Costs by 80%(https://www.infoq.com/news/2025/03/google-spanner-tiered-storage/)

2025-04-11 08:0010949

评论

发布
暂无评论

行业分享丨基于 Feko 的天线方向图近远场反演方法

Altair RapidMiner

人工智能 AI 汽车 仿真 CAE

YashanDB数据库性能瓶颈诊断及优化实战指南

数据库砖家

YashanDB数据库性能优化的5大实用策略详解

数据库砖家

YashanDB数据库应用中的常见问题解答与应对

数据库砖家

App 开发框架及特点

北京木奇科技有限公司

APP开发 软件外包公司 APP开发公司

YashanDB数据库性能监控与智能告警系统建设

数据库砖家

YashanDB数据库引领企业数据智能化3大趋势

数据库砖家

YashanDB数据库与大数据生态系统的深度融合

数据库砖家

YashanDB数据库与容器化技术的深度融合趋势

数据库砖家

一把锁的两种承诺:synchronized如何同时保证互斥与内存可见性?

poemyang

并发编程 Java并发编程

YashanDB数据库与大数据技术的结合趋势

数据库砖家

未发先火!追觅手机凭什么拿下海外亿元订单?

慢点科技SlowTech

YashanDB数据库性能瓶颈识别及优化实用技巧

数据库砖家

YashanDB数据库优化存储结构提升数据压缩率的方法

数据库砖家

YashanDB数据库与大数据生态系统的协同发展

数据库砖家

YashanDB数据库与传统数据库的5大区别分析

数据库砖家

YashanDB数据库与大数据平台集成的核心技术详解

数据库砖家

YashanDB数据库性能瓶颈诊断与调优技术

数据库砖家

YashanDB数据库异地多活部署的架构设计与实现路径

数据库砖家

YashanDB数据库与云计算的完美结合

数据库砖家

YashanDB 是一个新兴的数据库系统

数据库砖家

YashanDB数据库优化的5大关键实用技巧

数据库砖家

YashanDB数据库与机器学习结合的数据创新应用

数据库砖家

YashanDB与云原生技术的融合

数据库砖家

鸿蒙应用开发从入门到实战(十三):ArkUI组件Slider&Progress

程序员潘Sir

鸿蒙 HarmonyOS

CCE Autopilot | 华为云 Serverless 容器集群服务再进阶

华为云原生团队

云计算 容器 云原生

YashanDB数据库应用在电商数据处理中的实证研究

数据库砖家

YashanDB数据库应用中的AI智能告警系统设计思路

数据库砖家

YashanDB数据库优化的9个实用步骤

数据库砖家

YashanDB数据库与人工智能的结合展望具备广阔的前景

数据库砖家

如何优化查询速度? —— YashanDB数据库与人工智能数据处理的结合前景

数据库砖家

Google Cloud 为 Spanner 数据库引入 HDD 层,将冷存储成本降低 80%_云计算_Renato Losio_InfoQ精选文章