2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

借助数据标签实现跨区域数据的精准化迁移

  • 2019-10-17
  • 本文字数:1796 字

    阅读完需:约 6 分钟

借助数据标签实现跨区域数据的精准化迁移

熟悉 AWS 的朋友都知道,在 12 年前,AWS 发布了自己的第一款产品 – 分布式对象存储服务 Amazon S3,并借此机会开启了后来一发而不可收的云端探险之旅。Amazon S3 作为 AWS 旗舰型服务会将用户的数据保存在云端指定的区域,并且保持 11 个 9 的高持久性。随着越来越多的被使用和关注,用户已经并不满足于只将数据存储于一个区域,而是根据不同业务的不同需求,将数据保存在全球的各个需要的区域。


为了帮助用户更简单快捷地将 Amazon S3 对象副本复制到其它 AWS 区域当中,AWS 已经正式推出了 Amazon S3 跨区域复制(Cross-Region Replication,简称 CRR)功能。用户可以利用这项功能满足前面提到的各项需求,包括跨区域多副本存储以及把数据部署在与用户较接近的位置。数据在云端“搬家”已经变得只需运行几条 CLI 命令或者轻点几下鼠标就能完成的任务。


之前的 Amazon S3 CRR 虽然实现了自动化的跨区域数据复制,但是最大的局限来自于只支持 Amazon S3 存储桶或者带有某特定 prefix 前缀级别的数据迁移,对于用户需要将部分必要的数据而非全部数据进行复制备份的情况,会让用户陷入两难的境地。要么借助 Amazon S3 CRR 将全桶数据或某些前缀的数据“一锅端”通过 AWS 跨区域的高速骨干网络进行复制,再剔除多余的数据;要么自己处理整个迁移过程,为用户增加了不少工作量。


基于数据标签实现跨区域数据迁移功能的发布就是填补 Amazon S3 CRR 的这块短板,借助新发布的功能,用户可以为存储在 Amazon S3 中的对象打上标签(Tag),将标签作为数据迁移的一个过滤器,这样在迁移之前用户可以定义好指定的规则,根据业务的要求,将附着指定标签的数据自动地迁移到另一个区域。现在用户可以灵活地去选择复制那些至关重要的数据到 AWS 其他区域来满足自身的业务对数据保护和合规性的要去。云端岂无双全法,可以让用户在简便与灵活之间任意进行选择。


另外,基于数据标签的迁移功能就是基于 Amazon S3 CRR 的一个增强特性,现在还暂时只支持新增数据的自动迁移能力。如果您现在已经有了不少存量的数据等待去迁移,也没有问题,需要您联系到 AWS 支持部门,帮您先加入到存量数据迁移的白名单中,这样就可以顺利的实现新老数据的复制工作了。


下面我们来看看具体是如何对 Amazon S3 中数据进行精细化的复制控制的。


首先,我们先确认创建 Amazon S3 存储桶,并且启动版本服务(Enable Versions)



图 1 创建 Amazon S3 源存储桶



图 2 对 Amazon S3 源存储桶启用版本支持


创建完 S3 源存储桶后,点击存储桶中的管理菜单(Management)下的复制模块(Replication),创建 Amazon CRR 复制规则。



图 3 对跨区域数据复制创建复制规则


选择 Amazon S3 中的需要进行迁移的源数据桶,定义迁移的标签数据,这里我们指定标签 replication 值为 yes 的对象进行迁移。



图 4 对源数据桶迁移规则进行定义(1)- 选择标签



图 5 对源数据桶迁移规则进行定义(2)- 设定标签值


创建针对 Amazon S3 CRR 的新的 IAM Role,会自动生成包含数据迁移所需的服务权限,并且为迁移规则(Rule)进行命名,点击创建完成整个迁移策略的设置。



图 6 设置完成跨区域数据复制规则


对于不同的迁移规则,有可能彼此间存在相互冲突的条目,可以同时设置规则的优先级来解决规则间的相互冲突。优先级的数值越低优先级越高,复制过程中会保证高优先级的策略优先执行。另外,用户还可以根据业务的需要制定复制后的存储类型,使得整个迁移过程变得更加灵活。



图 7 设置迁移规则中优先级等属性


将验证的数据对象上传到源数据桶,并且打上不同的标签以示区别,其中前两个对象标签信息为 Replication=yes,第三个对象的标签信息为 Replication=no。



图 8 源存储桶中上传打标签的数据


观察目的区域目标存储桶,验证标签 Replication 的值为 yes 的对象是否迁移成功。



图 9 目标存储桶中迁移指定标签下的对象


如上是整个基于标签化跨区域数据迁移的全部过程,我们也提供了基于 CLI 和 API 的方式来实现此功能。通过精细化控制,我们可以实现数据迁移的细粒度控制,将迁移的控制权完全交还给用户,按照用户实际的业务需求来进行自动且灵活的迁移工作。


相关功能使用成本


基于数据标签的跨区域数据迁移功能并不会收取用户额外的费用,您将会为 S3 的请求、跨区域数据传输以及对象存储付费。另外对于对象标签也会存在一部分的费用。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/data-precise-move/


2019-10-17 08:00855
用户头像

发布了 1955 篇内容, 共 165.9 次阅读, 收获喜欢 82 次。

关注

评论

发布
暂无评论
发现更多内容

几个常见的js手写题,你能写出来几道

helloworld1024fd

JavaScript

Baklib知识分享|企业文档管理的一些策略

Baklib

从React源码来学hooks是不是更香呢

goClient1992

React

Angular 内容投影出现 No provider for TemplateRef found 错误的单步调试

汪子熙

typescript Web 前端开发 angular 10月月更

【LeetCode】使括号有效的最少添加Java题解

Albert

LeetCode 10月月更

大数据培训靠谱吗?

小谷哥

web前端开发技术培训机构怎么选

小谷哥

前端培训怎么系统学习开发技术呢?

小谷哥

react源码中的hooks

flyzz177

React

这可能是你需要的React实战技巧

夏天的味道123

React

Collections之Arraylist源码解读(四)

知识浅谈

ArrayList 10月月更

【SSM】Spring系列——AOP面向切面编程

胖虎不秃头

spring ssm 10月月更

2022前端培训学习过程中需要掌握哪些技术点?

小谷哥

【Nacos源码之配置管理 二】Nacos中的事件发布与订阅--观察者模式

石臻臻的杂货铺

nacos 10月月更

Java 属性文件乱码问题

HoneyMoose

React性能优化的8种方式

xiaofeng

React

Vue.$nextTick的原理是什么-vue面试进阶

bb_xiaxia1998

Vue

【SSM】SpringMVC系列——SpringMVC概述

胖虎不秃头

spring ssm 10月月更

手写现代前端框架diff算法-前端面试进阶

helloworld1024fd

JavaScript

react的useState源码分析

flyzz177

React

React中常见的TypeScript定义实战

xiaofeng

React

Docker下的Nacos环境开发

程序员欣宸

Docker nacos spring cloud alibaba 10月月更

同事嫌我改Bug慢,原来是没掌握这些代码Debug技巧

慕枫技术笔记

debug 后端 10月月更

【Nacos源码之配置管理 一】阅读源码第一步,本地启动Nacos

石臻臻的杂货铺

10月月更 nacso

【SSM】Spring系列——Spring集成MyBatis

胖虎不秃头

spring ssm 10月月更

Servlet规范中的监听器-Listener

楠羽

Servlet 笔记 10月月更

深入React源码揭开渲染更新流程的面纱

goClient1992

React

React组件复用的技巧

夏天的味道123

React

java开发技术培训应该怎么学习呢

小谷哥

React源码解读之任务调度

flyzz177

React

一文搞懂XaaS

俞凡

架构 云原生

借助数据标签实现跨区域数据的精准化迁移_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章