2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

借助数据标签实现跨区域数据的精准化迁移

  • 2019-10-17
  • 本文字数:1796 字

    阅读完需:约 6 分钟

借助数据标签实现跨区域数据的精准化迁移

熟悉 AWS 的朋友都知道,在 12 年前,AWS 发布了自己的第一款产品 – 分布式对象存储服务 Amazon S3,并借此机会开启了后来一发而不可收的云端探险之旅。Amazon S3 作为 AWS 旗舰型服务会将用户的数据保存在云端指定的区域,并且保持 11 个 9 的高持久性。随着越来越多的被使用和关注,用户已经并不满足于只将数据存储于一个区域,而是根据不同业务的不同需求,将数据保存在全球的各个需要的区域。


为了帮助用户更简单快捷地将 Amazon S3 对象副本复制到其它 AWS 区域当中,AWS 已经正式推出了 Amazon S3 跨区域复制(Cross-Region Replication,简称 CRR)功能。用户可以利用这项功能满足前面提到的各项需求,包括跨区域多副本存储以及把数据部署在与用户较接近的位置。数据在云端“搬家”已经变得只需运行几条 CLI 命令或者轻点几下鼠标就能完成的任务。


之前的 Amazon S3 CRR 虽然实现了自动化的跨区域数据复制,但是最大的局限来自于只支持 Amazon S3 存储桶或者带有某特定 prefix 前缀级别的数据迁移,对于用户需要将部分必要的数据而非全部数据进行复制备份的情况,会让用户陷入两难的境地。要么借助 Amazon S3 CRR 将全桶数据或某些前缀的数据“一锅端”通过 AWS 跨区域的高速骨干网络进行复制,再剔除多余的数据;要么自己处理整个迁移过程,为用户增加了不少工作量。


基于数据标签实现跨区域数据迁移功能的发布就是填补 Amazon S3 CRR 的这块短板,借助新发布的功能,用户可以为存储在 Amazon S3 中的对象打上标签(Tag),将标签作为数据迁移的一个过滤器,这样在迁移之前用户可以定义好指定的规则,根据业务的要求,将附着指定标签的数据自动地迁移到另一个区域。现在用户可以灵活地去选择复制那些至关重要的数据到 AWS 其他区域来满足自身的业务对数据保护和合规性的要去。云端岂无双全法,可以让用户在简便与灵活之间任意进行选择。


另外,基于数据标签的迁移功能就是基于 Amazon S3 CRR 的一个增强特性,现在还暂时只支持新增数据的自动迁移能力。如果您现在已经有了不少存量的数据等待去迁移,也没有问题,需要您联系到 AWS 支持部门,帮您先加入到存量数据迁移的白名单中,这样就可以顺利的实现新老数据的复制工作了。


下面我们来看看具体是如何对 Amazon S3 中数据进行精细化的复制控制的。


首先,我们先确认创建 Amazon S3 存储桶,并且启动版本服务(Enable Versions)



图 1 创建 Amazon S3 源存储桶



图 2 对 Amazon S3 源存储桶启用版本支持


创建完 S3 源存储桶后,点击存储桶中的管理菜单(Management)下的复制模块(Replication),创建 Amazon CRR 复制规则。



图 3 对跨区域数据复制创建复制规则


选择 Amazon S3 中的需要进行迁移的源数据桶,定义迁移的标签数据,这里我们指定标签 replication 值为 yes 的对象进行迁移。



图 4 对源数据桶迁移规则进行定义(1)- 选择标签



图 5 对源数据桶迁移规则进行定义(2)- 设定标签值


创建针对 Amazon S3 CRR 的新的 IAM Role,会自动生成包含数据迁移所需的服务权限,并且为迁移规则(Rule)进行命名,点击创建完成整个迁移策略的设置。



图 6 设置完成跨区域数据复制规则


对于不同的迁移规则,有可能彼此间存在相互冲突的条目,可以同时设置规则的优先级来解决规则间的相互冲突。优先级的数值越低优先级越高,复制过程中会保证高优先级的策略优先执行。另外,用户还可以根据业务的需要制定复制后的存储类型,使得整个迁移过程变得更加灵活。



图 7 设置迁移规则中优先级等属性


将验证的数据对象上传到源数据桶,并且打上不同的标签以示区别,其中前两个对象标签信息为 Replication=yes,第三个对象的标签信息为 Replication=no。



图 8 源存储桶中上传打标签的数据


观察目的区域目标存储桶,验证标签 Replication 的值为 yes 的对象是否迁移成功。



图 9 目标存储桶中迁移指定标签下的对象


如上是整个基于标签化跨区域数据迁移的全部过程,我们也提供了基于 CLI 和 API 的方式来实现此功能。通过精细化控制,我们可以实现数据迁移的细粒度控制,将迁移的控制权完全交还给用户,按照用户实际的业务需求来进行自动且灵活的迁移工作。


相关功能使用成本


基于数据标签的跨区域数据迁移功能并不会收取用户额外的费用,您将会为 S3 的请求、跨区域数据传输以及对象存储付费。另外对于对象标签也会存在一部分的费用。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/data-precise-move/


2019-10-17 08:00846
用户头像

发布了 1950 篇内容, 共 164.7 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

谷歌面试题:如何从无序链表中移除重复项?

田维常

面试

第一章作业

tera

PostgreSQL中Oid和Relfilenode的映射

PostgreSQLChina

数据库 postgresql 开源 软件

应对新冠病毒传播-粤政协委员建议构建公共卫生区块链平台

CECBC

区块链 公共卫生

数据库表数据量大读写缓慢如何优化(3)【Elasticsearch的使用】

我爱娃哈哈😍

大数据 elasticsearch 架构 优化 死磕Elasticsearch

重学JS | Set和Map是如何过滤重复值的?

梁龙先森

面试 大前端 编程语言 28天写作

软件架构模式之分层架构

架构精进之路

架构设计 七日更 28天写作

都在用Kafka ! 消息队列序列化怎么处理?

李尚智

Java kafka 架构 消息队列 消息中间件

见证产品成长,共享AI力量!

百度大脑

想学AI开发很简单:只要你会复制粘贴

华为云开发者联盟

GitHub 开源 AI mindspore 推理

测试一下

TJJ

区块链挖矿到底是什么,该怎么挖?

v16629866266

Java 程序经验小结: 慎用可变参数

后台技术汇

28天写作

目标岗位差异化对比

Geek_6a8931

红河州加速区块链等新技术与实体经济的深度融合

CECBC

数字经济

别让假“努力”毁掉了你!面试了10家企业软件测试岗位,面试题整理

程序员阿沐

程序员 面试 软件测试 自动化测试 测试工程师

【面试必备】Swift 面试题及其答案

ios swift

第四周作业

oooh-la

LocalDateTime、OffsetDateTime、ZonedDateTime互转,这一篇绝对喂饱你

YourBatman

LocalDateTime OffsetDateTime ZonedDateTime

Java程序员福音!阿里最新产物分布式小册:存储+计算+通信+资源调度

Java架构追梦

Java 阿里巴巴 架构 面试 分布式

图解 | 原来这就是TCP

程序员 网络协议 架构师

常见运维监控系统的技术选型

OpsMind

运维 监控系统

产品思维和产品意识

ALone

高承实:区块链是一个技术结构组织 而不是技术

CECBC

大数据

用APICloud开发iOS App Clip(苹果小程序)详细教程

YonBuilder低代码开发平台

小程序云开发 大前端 移动开发 APP开发

喜讯 | 拍乐云Pano荣获「2020大数据产业创新技术突破」奖

拍乐云Pano

大数据 音视频 RTC 拍乐云

拍乐云技术分享 | 美术教学中视频矫正是怎么做的?

拍乐云Pano

音视频 RTC 图像处理 拍乐云 视频处理

老熟人,新朋友!写作平台邀新季!

InfoQ写作社区官方

热门活动

Hbase内核剖析

永健_何

大数据 HBase 底层技术 分布式数据储存

第一周作业-产品备忘录

Eva

架构师训练营第九周作业

zamkai

借助数据标签实现跨区域数据的精准化迁移_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章