NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

借助数据标签实现跨区域数据的精准化迁移

  • 2019-10-17
  • 本文字数:1796 字

    阅读完需:约 6 分钟

借助数据标签实现跨区域数据的精准化迁移

熟悉 AWS 的朋友都知道,在 12 年前,AWS 发布了自己的第一款产品 – 分布式对象存储服务 Amazon S3,并借此机会开启了后来一发而不可收的云端探险之旅。Amazon S3 作为 AWS 旗舰型服务会将用户的数据保存在云端指定的区域,并且保持 11 个 9 的高持久性。随着越来越多的被使用和关注,用户已经并不满足于只将数据存储于一个区域,而是根据不同业务的不同需求,将数据保存在全球的各个需要的区域。


为了帮助用户更简单快捷地将 Amazon S3 对象副本复制到其它 AWS 区域当中,AWS 已经正式推出了 Amazon S3 跨区域复制(Cross-Region Replication,简称 CRR)功能。用户可以利用这项功能满足前面提到的各项需求,包括跨区域多副本存储以及把数据部署在与用户较接近的位置。数据在云端“搬家”已经变得只需运行几条 CLI 命令或者轻点几下鼠标就能完成的任务。


之前的 Amazon S3 CRR 虽然实现了自动化的跨区域数据复制,但是最大的局限来自于只支持 Amazon S3 存储桶或者带有某特定 prefix 前缀级别的数据迁移,对于用户需要将部分必要的数据而非全部数据进行复制备份的情况,会让用户陷入两难的境地。要么借助 Amazon S3 CRR 将全桶数据或某些前缀的数据“一锅端”通过 AWS 跨区域的高速骨干网络进行复制,再剔除多余的数据;要么自己处理整个迁移过程,为用户增加了不少工作量。


基于数据标签实现跨区域数据迁移功能的发布就是填补 Amazon S3 CRR 的这块短板,借助新发布的功能,用户可以为存储在 Amazon S3 中的对象打上标签(Tag),将标签作为数据迁移的一个过滤器,这样在迁移之前用户可以定义好指定的规则,根据业务的要求,将附着指定标签的数据自动地迁移到另一个区域。现在用户可以灵活地去选择复制那些至关重要的数据到 AWS 其他区域来满足自身的业务对数据保护和合规性的要去。云端岂无双全法,可以让用户在简便与灵活之间任意进行选择。


另外,基于数据标签的迁移功能就是基于 Amazon S3 CRR 的一个增强特性,现在还暂时只支持新增数据的自动迁移能力。如果您现在已经有了不少存量的数据等待去迁移,也没有问题,需要您联系到 AWS 支持部门,帮您先加入到存量数据迁移的白名单中,这样就可以顺利的实现新老数据的复制工作了。


下面我们来看看具体是如何对 Amazon S3 中数据进行精细化的复制控制的。


首先,我们先确认创建 Amazon S3 存储桶,并且启动版本服务(Enable Versions)



图 1 创建 Amazon S3 源存储桶



图 2 对 Amazon S3 源存储桶启用版本支持


创建完 S3 源存储桶后,点击存储桶中的管理菜单(Management)下的复制模块(Replication),创建 Amazon CRR 复制规则。



图 3 对跨区域数据复制创建复制规则


选择 Amazon S3 中的需要进行迁移的源数据桶,定义迁移的标签数据,这里我们指定标签 replication 值为 yes 的对象进行迁移。



图 4 对源数据桶迁移规则进行定义(1)- 选择标签



图 5 对源数据桶迁移规则进行定义(2)- 设定标签值


创建针对 Amazon S3 CRR 的新的 IAM Role,会自动生成包含数据迁移所需的服务权限,并且为迁移规则(Rule)进行命名,点击创建完成整个迁移策略的设置。



图 6 设置完成跨区域数据复制规则


对于不同的迁移规则,有可能彼此间存在相互冲突的条目,可以同时设置规则的优先级来解决规则间的相互冲突。优先级的数值越低优先级越高,复制过程中会保证高优先级的策略优先执行。另外,用户还可以根据业务的需要制定复制后的存储类型,使得整个迁移过程变得更加灵活。



图 7 设置迁移规则中优先级等属性


将验证的数据对象上传到源数据桶,并且打上不同的标签以示区别,其中前两个对象标签信息为 Replication=yes,第三个对象的标签信息为 Replication=no。



图 8 源存储桶中上传打标签的数据


观察目的区域目标存储桶,验证标签 Replication 的值为 yes 的对象是否迁移成功。



图 9 目标存储桶中迁移指定标签下的对象


如上是整个基于标签化跨区域数据迁移的全部过程,我们也提供了基于 CLI 和 API 的方式来实现此功能。通过精细化控制,我们可以实现数据迁移的细粒度控制,将迁移的控制权完全交还给用户,按照用户实际的业务需求来进行自动且灵活的迁移工作。


相关功能使用成本


基于数据标签的跨区域数据迁移功能并不会收取用户额外的费用,您将会为 S3 的请求、跨区域数据传输以及对象存储付费。另外对于对象标签也会存在一部分的费用。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/data-precise-move/


2019-10-17 08:00567
用户头像

发布了 1836 篇内容, 共 92.5 次阅读, 收获喜欢 73 次。

关注

评论

发布
暂无评论
发现更多内容

云上开发如何实现持续代码提交

华为云开发者联盟

云计算 后端 代码

第一时间快速了解 Kubernetes 1.25

云原生技术社区

容器 云原生 kubernetes入门 kubenetes Kubernetes, 云原生, eBPF

2000字带您了解什么是 SD-WAN,它是如何工作的?

wljslmz

SD-WAN 网络技术 8月月更

翻译|是否应该在 Kubernetes 上运行数据库

RadonDB

MySQL Kubernetes RadonDB 数据库·

开源一夏 | MySQL 事务的隔离级别

六月的雨在InfoQ

开源 mysql事务 MySQL 数据库 8月月更

阿里三面被面试官狂问Redis,简历上再也不敢写"精通"了

退休的汤姆

面试题 阿里 秋招 redis 底层原理

如何实现跨数百个K8s集群的管理

云原生技术社区

istio 服务网格 K8s 多集群管理 Istio流量管理

即刻报名|汽车制造行业如何玩转大数据分析?

Kyligence

数据分析 汽车制造

翻译 | Kubernetes Operator 对数据库的重要性

RadonDB

Kubernetes operator RadonDB 数据库·

天翼云TeleDB系列产品升级发布会开幕在即,精彩邀您共鉴

天翼云开发者社区

“客户体验管理”这么热,究竟能给企业带来什么变化?

科技怪咖

2022“易观之星”年度奖项启动征集,发现卓越数智力量

易观分析

报名 数智化 易观之星

青软集团蝉联华为云「千万俱乐部奖」「最佳销售黑钻奖」两大奖项

神奇视野

工业智能化转型升级难?华为云这三招,加速商业变现

华为云开发者联盟

云计算 后端 华为云 工业智能化

"教练,我想打篮球!" —— 给做系统的同学们准备的 AI 学习系列小册

Zilliz

人工智能开源

天翼云为这场酷炫的元宇宙会议做了这件事

天翼云开发者社区

Mysql和Redis数据如何保持一致

京东科技开发者

数据 数据一致性 MySQL 数据库 数据库· redis 底层原理

兆骑科创创新创业服务平台,云路演,人才引进平台

兆骑科创凤阁

RT-Thread记录(十三、I/O 设备模型之PIN设备)

矜辰所致

RT-Thread 8月月更 I/O设备模型

使用 Canonical MAAS 部署 openEuler 测试

openEuler

centos 开源 操作系统 openEuler MaaS

实践基地+新工科实训 青软与西南大学展开多元校企合作

神奇视野

参与开源共建,你不可不知的贡献技巧

OpenHarmony开发者

OpenHarmony

天翼云入选可信边缘计算推进计划与分布式云扬帆计划首批成员单位!

天翼云开发者社区

DPDK技术原理与架构

C++后台开发

虚拟化 DDoS DPDK VPP NFV

企业搭建知识库的重要性,你了解多少?

Geek_da0866

金融机构求索数据价值,“数牍方案”提供可行解 数牍科技

Jessica@数牍

隐私计算 金融行业 数据隐私安全

关于Copy On Write Array List,你会安全使用么

华为云开发者联盟

List 开发

Bytebase 1.3.1 - 2022.8.18

Bytebase

SQL优化 database SQL审批

Golang 使用过程中遇到的小技巧(一)

皮特王

重庆邮电大学新工科训练营 实践Java和大数据方向全真产业项目

神奇视野

如何让工业制造拥有更强的“数字内核”?

天翼云开发者社区

借助数据标签实现跨区域数据的精准化迁移_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章