
近期,天翼云 HBlock 在发布的版本中,推出了多副本和纠删码双支持的“异地多活”块存储服务,在底层实现异地一致性实时落盘,保障业务高可用,该能力已在重庆的巴南区、高新区、北碚区三个资源池实现生产级部署和运营。
随着数字化的推进,“数据不丢、业务不停”已成为企业刚需,软件厂商在容灾备份方面提供了各类方案,但仍面临故障频率高、恢复时间长等问题。
传统块存储灾备方案,保障往往局限于单机柜、单机房或单可用区。为实现跨可用区容灾,需在异地构建完整的资源和数据,再通过软件进行数据同步。这种方式实时性受限、存在单点故障风险,一旦发生问题需人工介入进行服务恢复;为保障数据安全,要在多可用区保存多份冗余数据,成本也随之上升;不可控的中断时长严重影响客户体验,难以满足当下企业的要求。
HBlock 通过存储协议栈优化升级与分布式算法创新,在存储层实现跨可用区强一致性保障,构建跨可用区 RPO=0、RTO 秒级的异地多活、高性能块存储服务。系统在任意单可用区故障时,仍可达到 99.9%以上的服务可用性(SLA)。通过负载均衡与多活架构,业务流量可快速切换至健康可用区,使终端用户对单可用区故障无感知。
官方介绍,HBlock 具体实现了三个核心能力突破:
(一)统一存储底座,可靠性与效率兼得
统一元数据层,跨地域实时同步;精简配置、弹性扩容、按需伸缩;存储池可用故障域与业务 AZ 灵活对应,并采用纠删码(EC)技术与异地实时同步机制,实现了多可用区数据强一致性。

HBlock 基于纠删码(EC)的多 AZ/故障域同步机制
业务写入即在多 AZ 同步,任一区域故障可自动无感切换,保障持续可用;副本折叠(同域保存多份副本)提升小规模集群的容错能力且得盘率不变。
HBlock 基于 EC 将数据分条落盘至多个可用区,相较于传统三副本同步或异步复制方案,可获得更高的得盘率,并实现 RPO=0;支持卷级别冗余配置策略(如三副本或 EC N+M,N+M≤128)及多种写入模式(回写、绕写、透写、SSD 缓存),可自定义副本数与分片大小,提升性能和存储资源利用率。
(二)智能自愈引擎,切换全程无感
当某可用区故障时,自愈引擎即时感知并自动预分配通道,切换 I/O 至健康可用区,并触发跨 AZ 数据重建,无需人工干预,服务稳定永续;分布式多控架构实现卷连接自动迁移并重置主备优先级,保持计算与存储同域部署,优化性能损耗;故障区域恢复后,可自动将连接回切至原可用区域。


HBlock 的自愈引擎机制(以 3AZ 为例)
(三)智能感知调度,混沌环境仍服务不停,数据不丢
HBlock 特别为弱网、弱算、弱盘等混沌(chaos)环境设计并验证。不依赖时钟服务,基于强一致性仲裁快速触发秒级故障检测与数据重建;动态采集存储负载、网络性能等多维度指标,通过智能调度算法实时调整副本分布,剔除慢盘、规避瓶颈节点,保证数据一致性与高可用服务。
HBlock 是天翼云自研的业界首款轻量级存储集群控制器,可低门槛盘活异构非对称存储资源,支持从官网自助下载分钟级交付的软件定义存储产品。其灵活的特性可支持部署在物理机、虚拟机、容器等多种环境中,通过租户机 VPC 可以让用户自助体验 HBlock 灵活组网、快速交付的软件定义存储能力。
此次通过异地冗余、自愈引擎与智能调度等自研技术,将数据自动分布到多个异地可用区,实现实时异地多活协同能力,结合已具备的存储网关、快照、克隆等新特性,形成“本地高可用+异地多活+多版本备份+混合云容灾”的多维服务保障,为金融、政务、交通等行业提供新的解决方案。
评论