春争日,夏争时,扫码抽取夏日礼包!!! 了解详情
写点什么

深读 Microsoft Ignite China | 云端之上,六大数据能力论短长

  • 2021 年 12 月 29 日
  • 本文字数:4901 字

    阅读完需:约 16 分钟

深读 Microsoft Ignite China | 云端之上,六大数据能力论短长

在过去的两年里,数字化转型骤然加速;而在转型过程中,云战略至关重要。那么,如何选择正确的云平台呢?


来自某跨国企业的领导人的一席话,为云平台“选择困难症”指明了方向:“上云的本质其实就是数据上云,因此,考量一个能够真正商用的云,其是否可以真正实现数据的核心价值,是做出云平台选择的关键。”


如果用数据能力评价云平台上数据能力的短长,究竟需要考量哪些方面呢?我们在这里总结了六大因素,供您参考。

考量一 云端的数据是否安全?


云端数据的安全问题是首要考量的因素,云平台必须实现安全加固,解决不同应用层面上安全的碎片化,以及安全管理、合规层面的问题。


开源生态的蓬勃发展带来了数字化技术的多样性,云计算作为其中翘楚体现出了其巨大的商业潜力。然而,当技术的获取甚至计算能力不再是那么稀缺的时候?我们应该思考的是,在新时代的技术和经济结构中,最稀缺的会是什么东西?


安全和信任将成为最稀缺的资源之一,微软智能云 Azure 在这一领域进行了巨大的投资:


微软雇佣了 3700 多名安全专家,每年在安全上花费超过 10 亿美元。

微软智能云 Azure 每天分析超过 24 万亿个安全信号。

仅在 2020 年,Microsoft 365 Defender 就屏蔽了 60 亿个恶意软件威胁。


为了保护客户的云端创新成果,微软智能云 Azure 在架构的每一层都内置了安全功能,包括运行时的安全级别与编写代码时都内置安全性功能。例如,GitHub 高级安全功能使开发人员能够提供更安全的代码,如漏洞代码扫描、私密扫描,以避免将密钥和密码等私密信息放入代码存储库。


同时,微软更利用人工智能来提升云安全,Azure 安全解决方案中使用的人工智能分析每天数万亿个安全信号,向安全团队提出最需要优先处理的安全事件,大幅减少安全噪音,并节省 SecOps 的宝贵时间。


从具体的安全产品上看,Azure 内置有大量安全解决方案。例如,在身份管理方面,拥有 Azure Active Directory(基于混合云身份管理的云端活动目录)等产品,解决了应用层面的安全碎片化;在管理层面上通过数字身份认证等措施,解决了数字身份方面的安全问题;在网络安全领域,通过 Defender for Cloud 等保护网络安全体系;在合规层面,通过 90 多项产品和服务,保障了数据合规性等。


同时,如何有策略地对数据进行保护呢?以 Azure 数据保护方案为例,它拥有深度和全面的保护措施


对敏感数据进行发现、分类和标记

监视针对敏感数据的异常和威胁

加密传输中的敏感数据

在默认情况下启用静态数据加密

在需要时在静态数据中使用客户托管的密钥选项

使用安全密钥管理过程

使用安全证书管理过程

确保密钥和证书存储库的安全性


2020 年,Gartner 发布《Solution Comparison for the Native Security Capabilities》报告,首次全面评估了全球六大云厂商的整体安全能力。


从整体安全能力看,微软排名第一。此次评估维度包括“基础设施安全,云治理和合规,网络安全,应用和容器安全,数据安全,日志和预警,应用和工作负载保护”等,这一评估结果更佐证了微软在云安全方面的成就。

考量二 是否支持数据架构融合?


云计算领域正在向融合式发展演进。


在微软看来,应用、数据和业务的共存共生,最终会朝着相同的方向演进,数字化技术的结构,决定了它需要构建反馈循环来实现进化自身的目的,生物学上把这称为趋同性演化(Convergence)。这是一种源自进化论的概念,意思是说:一些原本不相关的生物,在受到相似外界作用的影响下,会进化出相同或相近的功能或器官。


在云计算领域,企业将不同来源的数据资产放到云端之后,数据资产通过数据应用的作用,针对客户所需求的业务,最终演进为微软一直倡导的“Digital Feedback Loop(企业数字化闭环)”这一理念。



曾几何时,很多企业投入巨大,建设了很多数据仓库、数据湖、大数据平台等系统,数据库或许采用了 SQL、NoSQL 等,但今天正在走向融合——实现湖仓一体和流批一体,即在一个体系框架内用多样化的数据引擎进行分析,例如 Azure Synapse Data Explorer(数据浏览器)。


微软 Azure Synapse Data Explorer(数据浏览器)最新发布的公开预览,补充了现有的 SQL 池和 Apache Spark 引擎。微软从产品层面,对新的数据浏览器的运行引擎进行了优化,并使用强大的索引技术,自动索引自由文本和半结构化数据,让它可以近乎实时的速度查询大量的结构化、半结构化、自由文本遥测和时间序列数据等。



其关键功能包括:


强大的分布式查询引擎,索引所有数据,包括自由文本和半结构化数据。数据被自动压缩、索引、自动优化,缓存在 SSD 上,并持久化在存储上。计算和存储是分离的,这给了用户充分的弹性,实现自动伸缩,而不需要停机。

直观的 Kusto 查询语言(KQL),使用 Synapse 数据浏览器的最佳文本索引来探索原始遥测和时间序列数据,用于高效的自由文本搜索、正则表达式和对跟踪\文本数据的解析。

全面的 JSON 解析功能,用于查询半结构化数据,包括数组和嵌套结构。

原生、高级时间序列支持创建、操作和分析多个时间序列,引擎内 Python 和 R 执行支持模型评分。

考量三 是否支持行业数据分析的融合?


随着科技的发展,分析的操作难度不断降低,真正实现技术的“平民化”。


凭借多年深耕不同行业的知识积累,微软将行业知识固化到了产品中,在 Azure Synapse 推出了行业数据分析模板——标准化的数据库模型,方便用户随时根据组织需求使用和创建数据库模型。


这些模型包含丰富的元数据,可以逐步增强对数据模型的理解。使用这些模型创建湖数据库,并使用 Azure Synapse 在运行分析时为业务用户提供见解。



在 Synapse 中,有专门针对行业的数据分析模版,例如银行、保险、零售业等等。行业数据分析模版具有十分领先的意义,其核心关键就是解决了当下很多企业存在的竖井式数据平台的分离问题,这一问题最终导致企业内部生产、零售、财务等部门各行其是,给数据整合和数据分析造成了巨大阻碍。


如果使用微软的行业数据分析模版,企业各个部门将从源头将数据彻底打通;同时更可利用微软强大的行业生态与 Dataverse,融合来自本地、跨云端、应用程序与物联网等的数据,实现真正的上下游数据融合。

考量四 是否支持数据的统一治理和分析的自助服务?


云端的数据更需要支持“多元化消费”,主要包括数据治理能力和数据可视化能力。


数据治理能力


在今天这个多云和混合云的时代里,客户对全面数据治理服务的需求从未如此强烈。微软智能云 Azure 拥有业界先进的数据治理工具 Purview ,可以与微软现有系统进行深度整合。



Azure Purview 是微软的统一数据治理服务,可帮助企业管理和治理其本地、多云和软件即服务 (SaaS) 数据。自 Azure Purview 全面上市以来,已经产生了超过 570 亿的数据资产


Azure Purview 通过与 Azure、Microsoft 365、Microsoft Power Platform 等平台数据服务的深度集成,确保数据资产得到管理。每个组织现在都可以构建统一的数据治理解决方案,以最大限度地发挥其云中数据的价值。


数据可视化能力

鼠标拖拽,即可轻松实现数据分析


今天,无代码化的趋势也同样反映在云端的数据平台应用中。随着数据量级的不断扩大,需要一种机制来确保用户可以无缝使用更新后的内容,不应该有等待的期间;于此同时,对 BI 创建来说,也应该具有更好的协同机制。


Power BI 部署管道应运而生,它诞生的目的就是进一步提升效率并解决重用问题。它可以用于 Premium 容量,管理内容生命周期,允许内容在正式使用前得到充分的开发和测试。


在此之前,实现数据管道方面的应用,需要巨大的开发投入。而如今,通过鼠标拖拽就能完成数据集成工作,这集中呈现了云端数据平台的无代码/低代码化趋势,也就是数据分析的自服务能力在微软智能云 Azure 之上,很多功能都已经实现了无代码化——用户只需拖拽鼠标就可实现数据集成、数据可视化、数据分析、数据虚拟化等功能:


数据集成

无需自行编写代码,就能在数据工厂视觉环境中构建混合 ETL 和 ELT 管道,摄取近 100 个本地连接器的数据;单击几下即可引入、移动、准备、转换和处理数据。还可以将现有 SSIS 包直接迁移到 Azure,并在 ADF 中运行它们。


数据分析

作为首个能在千万亿字节规模级别运行所有 TPC-H 查询的分析系统,企业可以使用 Azure Synapse 在生产环境中运行其现有的数据仓库工作负载,将来自所有数据源、数据仓库和大数据分析系统的见解汇集在一起。再结合 Dynamics 365 最新的 Customer Insights 模块,帮助销售和服务人员获得他们进行个性化互动所需的指导。


数据可视化

利用微软的 Power BI,可以连接到任何位置的数据,通过交互式可视化效果来浏览;发布报表和仪表板与团队协作,并在组织内外共享见解;通过应用中提供的内置业务分析,推动发现更多见解。用户也能从集成的人工智能和商业智能工具中获益,包括 Azure 机器学习、Azure 认知服务等。


数据虚拟化

过去连接 SQL Server 数据与外部数据的难度很大;现在只需借助 PolyBase,Azure 数据仓库就可处理从 Hadoop 中读取数据的 Transact-SQL 查询, 同一查询还可以访问 SQL Server 中的关系表。


数据分析的自服务能力对企业而言,非常关键——有了数据分析的自服务能力,可以节省大量的人力资源投入,全面提升分析效率。


与其他类似云平台企业相较而言,微软的 Power BI 是自有产品,可以与微软 Azure 进行深度融合,而无需额外的数据汇集的开发工作。微软 Azure Synapse 拥有自服务平台 Workspace,搭配 Databricks 和 Power BI,就形成了一个云端的自助式数据生产力工厂。

考量五 是否支持软件定义一切的运维托管能力?


用软件定义一切,实现自动化和自服务,标准化、规范化管理软件供应链。


便捷性配置


对于很多 Azure 的客户而言,他们往往会忽视 Azure 一个重要的优势——操作便捷性

例如,在云端配置、变更参数或发布,在 Azure 上只需要轻点鼠标、选择下拉列表,几分钟内,一切功能就都实现了。而无需像其他一些云平台那样,每次发布和配置,都需要登陆终端进行各种复杂操作,甚至重启系统等,需要花费数个小时不等。


软件定义一切


作为混合云方案的重要组成部分,软件定义数据中心,以及基于软件定义数据中心软件的超融合基础设施/集成系统,是企业建设私有云以及推动数字化转型所需要的关键技术。


微软希望客户能够用一个架构、一个管理工具来管理全部的混合云,最大限度地为客户的云设备管理省时、省力、省钱。



微软 Azure Stack HCI 超融合基础架构通过 Windows Admin Center(WAC)连入 Azure 公有云,企业可以通过自己所熟悉的 Azure 门户,统一管理包括 Azure Stack HCI 在内的各种 Azure 资源;而且,通过使用 Azure Arc 还能管理其他云服务。


低运维成本


云端的数据平台是一个复杂的系统化工程。以本地的数据仓库为例,如果用户建设了一个大型数据仓库项目,那么厂商将会每年收取高昂的运维和调优费用。


但如果在 Azure 云端托管数据仓库服务,由于 Synapse 或 SQL MI 是微软的自有产品,无论是虚拟化、数据库引擎,或者调度等等,都可以交由微软进行运维,这一点是微软相比其他云平台的独特优势,能为客户节约大笔资金。

考量六 数据云平台是否拥有强大的生态整合能力


内部生态+外部生态的协同创新力量。


微软智能云 Azure 的独到之处,在于其强大的生态能力


从内部生态来看,微软 Azure 拥有 60+数据中心、100+合规能力、35 个国家建设有数据中心,每天分析约 24 万亿安全信号



同时,在微软智能云 Azure 身后,有一个智能云矩阵,包括 Microsoft Office 365 生产力云平台等。

Microsoft Dynamics 365 全面整合了人工智能与商业智能,Microsoft Power Platform 提供了无需专业编程、即可快速便捷实现全民开发的低代码应用开发工具。



在高速成长的行业云领域,微软还陆续推出了微软金融服务云、微软医疗云、微软制造云、微软非营利组织云以及微软零售云等云产品,受到大量全球客户的追捧。


从外部生态来看,微软智能云 Azure 拥有强大的跨云管理能力,微软云市场支持着拥有成千上万的合作伙伴的生态系统,具备强大的延展性和扩展性。


在微软云生态系统中,有 800 多个独立软件供应商、17 个设备合作伙伴和 1000 多个系统集成商。他们可以在微软云 Marketplace 上方便迅捷地发布解决方案和服务,合作伙伴可以由此接触到来自 140 多个国家的近 400 万用户。此外,合作伙伴还可以通过参与微软的联合销售计划,来创造新的机会。



2021 年 12 月 29 日 11:524227

评论

发布
暂无评论
发现更多内容

架构师训练营第十一周作业2

韩儿

架构训练营第十一周作业

一期一会

高可用架构

甲方日常 78

句子

工作 随笔杂谈 日常

编程常用的加密方式

皮蛋

加密 加解密 加密技术

架构师培训第一周学习总结

跳蚤

第六周命题作业

cc

架构师训练营第 11 周课后练习

菜青虫

AOP的姿势之 简化 MemoryCache 使用方式

八苦-瞿昙

C# aop cache

性能优化-1-压测

raox

架构师训练营第一周作业-命题作业

阿德儿

食堂就餐卡系统设计

跳蚤

LeetCode题解:264. 丑数 II,二叉堆,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

架构师训练营 1 期:大作业(一)

piercebn

架构师训练营第 1 期

Week11总结

lggl

知识改变命运,你相信这句话吗?

熊斌

成长 演讲 教育

辞幕2020,前行2021

iHTC

程序员 中年危机 提升自我 年终总结 技术学习

第十一周课后练习

晴空万里

架构师训练营第 11 周学习总结

菜青虫

架构师训练营第一周作业-学习总结

阿德儿

[架构师训练营] 食堂就餐卡系统设计

Fango

架构师训练营 4 期

第一周架构方法-周总结

潘涛

架构师第一周总结

永不言弃

物联网基础知识整理及实战

garlic

物联网

指令重排序、内存屏障很难?看完这篇你就懂了!

Java鱼仔

Java 程序员 面试 JMM 指令重排序

架构师训练营第十一周作业1

韩儿

最全总结 | 聊聊 Python 数据处理全家桶(Mysql 篇)

星安果

Python MySQL 数据库 最全总结

第六周学习心得

cc

SAML和OAuth2这两种SSO协议的区别

程序那些事

权限系统 OAuth2 程序那些事 SAML SSO

架构师训练营第六周课后作业

万有引力

食堂就餐卡系统设计

永不言弃

架构

[架构师训练营] 第一周学习总结

Fango

架构师训练营 4 期

WAVE SUMMIT 2022 深度学习开发者峰会

WAVE SUMMIT 2022 深度学习开发者峰会

深读 Microsoft Ignite China | 云端之上,六大数据能力论短长_云计算_微软中国_InfoQ精选文章