从 SQL Server 到多数据库,微软数据库迁移全攻略

阅读数:5059 2019 年 6 月 18 日 09:16

从SQL Server到多数据库,微软数据库迁移全攻略

据了解,截止到 2022,云迁移市场规模将达到 1290 亿美元,云迁移服务市场的利润率达 26.7%。数据库作为企业迁移上云的关键环节,自然成为了各大云厂商关注的重点,除了提供各种各样的云端数据库,迁移服务也是云厂商发力的重点。

近日,微软宣布 Azure SQL Database Managed Instance(SQL Database 托管实例)服务正式登陆由世纪互联运营的 Microsoft Azure。

SQL Database 托管实例 +Azure 数据迁移服务(DNS)

SQL Database 托管实例是一项 PaaS 服务,以全托管的形式在云端提供 SQL Sever 几乎全部的功能,是对现有 Azure SQL 数据库服务的增强和扩展。

据了解,SQL Database 托管实例至少提供 8 个核心和最多 35 TB 的存储,并通过独立虚拟网络部署,适合于希望快速上云且想要避免虚拟机开销的用户。托管实例的方式满足了多个部署在不同位置的本地 SQL Sever 迁移上云的需求,并且云端 SQL Database 托管实例会同步提供最新版 SQL Server 2019 的全部功能。

想要完成本地 SQL Server 数据库迁移到 Azure SQL Database 托管实例服务,还需要另一个工具助力,就是 Azure Data Migration(Azure 数据迁移)服务。

Azure 数据迁移服务是一种完全托管的迁移服务,能够实现从多个数据库源到 Azure 数据平台的无缝迁移。为了满足多种场景需求,Azure 数据迁移服务还集合了多个 Microsoft 迁移引擎,例如数据迁移助手、数据库实验助手以及 SQL Sever 迁移助手。

SQL 数据库迁移

以 SQL Server 为例,Azure 数据迁移服务支持将本地数据库迁移到 Azure SQL 数据库的所有服务选项(单库、弹性池和托管实例)以及 Azure IaaS 虚拟机上的 SQL Server。

在实际数据库的过程中,大致会经历以下 5 个步骤:启动和发现、评估、计划、转换和优化以及迁移、验证和修复。

  • 启动和发现:是为了了解数据库占用空间和潜在的迁移方案;
  • 评估:评估已发现工作负载的要求和任何依赖关系;
  • 计划:规划和描述要迁移的工作负载、用于迁移的工具以及工作负载的目标平台;
  • 转换和优化:转换目前与现代数据平台不兼容的任何工作负载。优化工作负载以利用新功能;
  • 迁移、验证和修复:执行迁移、验证成功的迁移,并根据需要修复应用程序。

通常情况下,Azure SQL Database 的迁移周期是 4 到 6 个月。迁移之后,成本可以节约多少呢?微软给大家算了一笔账,以 3 年为期计算,客户在硬件、网络、维护投入方面节约的成本 3 年现值约为 180 万美元;迁移上云之后,生产效率提升约 40%,产生的 3 年现值收益约为 68.8 万美元;因为托管实例提供的各种服务,企业内部各团队的效率也将实现 20% 的提升,3 年现值收益约为 69.8 万美元。

整体来看,Azure SQL Database 在 3 年内的投资回报率约为 212%,且在迁移完成的 6 个月内,即可回收全部投资。

Azure 数据工厂 + X,多种数据库迁移之路

对于很多企业来说,只把 SQL Sever 迁移上云是远远不够的,他们还有很多其它类型的本地数据库也想要享受云端 PaaS 服务,而这就不得不提到我们接下来的主角 Azure 数据工厂。

Azure 数据工厂(ADF)是基于云的数据集成服务,用于在云中创建数据驱动型工作流,以协调和自动完成数据移动和数据转换;将复杂的混合提取 - 转换 - 加载(ETL)、提取 - 加载 - 转换(ELT)和数据集成项目,部署到托管云服务平台。

据了解,Azure 数据工厂目前支持的连接器有 80 多个,包括 Azure 云服务 15 个,数据库 / 数据仓库 25 个,文件存储 6 个,NoSQL 3 个,服务 / 应用 28 个,通用 4 个。

Azure 云服务 数据库 / 数据仓库 数据库 / 数据仓库 文件存储 NoSQL 服务 / 应用 服务 / 应用 通用
Blob Storage DB2 Oracle Amazon S3 Cassandra Amazon AWS Oracle Service Cloud HTTP
Cosmos DB-SQL API Amazon Redshift Impala File System Couchbase CDS for Apps Paypal OData
Cosmos DB-MongoDB API Drill Informix FTP MongoDB Dynamics 365 Salesforce ODBC
ADLS Gen1 Google BigQuery MariaDB Google Cloud Storage Jira SAP C4C REST
ADLS Gen2 Greenplum Access HDFS Office 365 SAP ECC
Data Explorer HBase MySQL SFTP Oracle Eloqua Square
SQL Database 等 Hive PostgreSQL 等 Oracle Responsys Zoho 等

除了单兵作战,Azure 数据工厂还可以和 Azure 其它服务组团打怪,例如 Azure 数据工厂 +Azure SQL Database 托管实例,可以将各种各样的数据整合、清洗、转化存到 SQL 托管实例中;Azure 数据工厂 + 数据迁移助手、数据迁移服务,可以实现多种数据源迁移上云;Azure 数据工厂 +Azure SQL DW,可以集成到企业数据仓库,实现现代数据仓库技术与机器学习、深度学习、人工智能等技术融合。

据微软团队介绍,在过去的 12 个月中,共有超千万个 Azure 数据工厂项目被创建;每个月,有近 5 亿个活动在运行;而每个星期,有 PB 级的数据通过 Azure 数据工厂在移动。

关于微软数据库迁移的几个小问题

很多企业都有数据库迁移上云的需求,但同时对于迁移过程和迁移解决方案也有很多担心。所以,为了减少大家的疑虑,我们专门采访了微软全球数据平台解决方案总监 Jack C.Tang 和微软中国数据与人工智能产品负责人林默。

1. 企业为什么要选择迁移云端,而不是选择升级本地数据库到 SQL Server 2019 呢?

Jack C.Tang:首先,要明确一点迁移云端和本地升级这两种方式,我们都是支持的。至于为什么要迁移云端,因为云上能够跑的更好、跑的更快,如果要扩充商业模式,或者是要将产品扩充到新的国家或地区,我们建议放在云上。从管理层面来讲,客户不用在花时间思考硬件的更新,不必再增强现有的机房或数据中心。

2. 迁移过程是否是可逆的?

林默:我们有个产品叫 Database Migration service,它会帮忙做数据同步,如果您对云上不满意,那么可以切换回本地,线下数据库都还在。

3.SQL Server 2019 拥有了很多新的能力,例如 AI 能力、大数据能力等等,那么随着 **** 新技术的不断增多,会不会让数据库越来越臃肿?

林默:首先不会增加数据库的臃肿程度,反而是在减轻。举个典型案例,就是 SQL Sever Manager Studio 管理器。原来要管理 SQL Server 要做很多事情,要下载 SQL Server Manager Studio,它有几个 G 的数据量,安装之后会发现很重。但是现在,我们做的 Data Studio 是开源的,非常轻便,效率非常快。对于原先的数据库管理员来说,如果愿意还可以嵌入自己的代码,它已经变成了一个非常好的扩展的东西。

4.SQL Database 托管实例是自动升级新功能吗?新功能是否收费?

林默:没错,新功能是自动升级的,不过还是需要客户手动勾选自动升级的选项。至于收费,我们是按照计算和存储收费,只要不增加数据库级别,新功能就不收费。

收藏

评论

微博

用户头像
发表评论

注册/登录 InfoQ 发表评论