【ArchSummit架构师峰会】探讨数据与人工智能相互驱动的关系>>> 了解详情
写点什么

疏通数据链条上的每个“堵点”,企业该如何利用端到端解决方案释放数据价值?

  • 2023-01-18
    北京
  • 本文字数:1714 字

    阅读完需:约 6 分钟

疏通数据链条上的每个“堵点”,企业该如何利用端到端解决方案释放数据价值?

2020 年 4 月,国家发展改革委、中央网信办联合印发《关于推进“上云用数赋智”行动培育新经济发展实施方案》,鼓励在具备条件的行业领域和企业范围内,探索大数据、人工智能、云计算、数字孪生、5G、物联网和区块链等新一代数字技术应用和集成创新,为企业数字化转型提供技术支撑。

 

上云、用数、赋智,精炼地描述了企业上云的三个阶段,三重境界。上云可以相对容易,“用数”学问则比较大,“赋智”是更高的境界。在“用数”方面,数据中台的概念曾经在国内大行其道,很快又跌落神坛。很大一部分原因就在于业界没有完全准备好能让数据中台落地的技术。

 

事实上,让数据更好地在企业内部流通,可以有多种解决方案。

 

亚马逊云科技 CEO Adam Selipsky 曾在 2022 re:Invent全球大会的主题演讲中提到,“企业需要不断从数据获得洞察,指导业务决策。”

 

Adam 指出,就像我们不断寻找新的方法来理解宇宙空间的浩瀚和复杂,比如在不同的光谱中观察同一个星云,数据的庞大和复杂也需要新的工具,将不断扩展的信息世界转化为洞察。这些工具需要有最好的性价比,需要最多的功能以支持所有用例,需要可扩展的工具以便处理如此庞大且不断增长的数据量,需要所有这些工具与零 ETL 一起工作,并且有强大的治理以便在访问和控制之间取得平衡。当企业拥有所有这些工具时,就可以构建一个完整的端到端数据策略,涵盖所有数据类型、用户需求和工作负载。亚马逊云科技是执行此操作的最佳场所,正在投资整个数据之旅,从数据的摄取、存储、查询,到分析、可视化和运行机器学习,以及端到端治理,使客户更容易释放数据的价值。”

 

当前,企业收集的数据达到 PB 甚至 EB 级别,这些数据来自多个部门、多项云服务、众多本地数据库以及第三方数据源(如来自合作伙伴解决方案和公共数据集)。在企业可以释放数据的全部价值之前,管理员和数据管理者作为数据生产者与管理者,需要在保障数据的管控和治理的前提下允许数据访问,确保数据只能由正确的人在正确的情境下访问。

 

另一方面,整个公司的员工(作为数据消费者)都希望发现和分析来自数据生产者的信息,以推动决策制定。数据需要被管控以保证安全,产生新的洞察需要允许数据访问,企业必须在二者之间寻求平衡。然而企业内数据多样,部门林立,用例不同,这些都对治理策略的落实提出挑战。

 

一些企业通过建立目录来管理信息,但这些目录系统维护起来相当耗时,需要数据生产者手动标记每个数据集,额外添加来源或描述等情境信息来保证数据可以被检索和发现,同时缺乏内嵌的访问控制来简化数据治理。企业很难保持数据分级分类的一致性,以及各个数据生产者必须保持自己的信息实时更新,这使得在整个企业中搜索数据变得非常困难,并可能导致数据过时。在这种情况下,数据消费者即使找到了所需信息,也无法快速通过目录直接向数据所有者请求访问权限,也就无法加载数据分析服务以及与他人协作。最终,决策者无法及时获得所需信息,或者可能根据不完整或过时的数据做出欠佳的决策。

 

针对上述挑战,亚马逊云科技发布了全新数据管理服务 Amazon DataZone,帮助客户在整个企业内对数据进行编目、发现、共享和治理。

 

Amazon DataZone 的作用是打通、盘活企业内的数据。首先,让管理员可以使用精细的控制工具,管理数据访问权限,确保数据不被滥用、不被非正常使用。这样,整个企业的工程师、数据科学家、产品经理、分析师和业务用户就都可以轻松访问整个企业的数据,挖掘数据价值。

 

数据生产者可以通过 Amazon DataZone 定义数据分级分类,配置治理策略,连接一系列亚马逊云科技服务(如 Amazon S3 和 Amazon Redshift)、合作伙伴解决方案(如 Salesforce 和 ServiceNow)和本地系统,从而创建自己的业务数据目录。Amazon DataZone 使用机器学习为每个数据集收集和建议元数据信息(如数据来源和数据类型),并根据客户的分级分类和偏好进行模型训练,不断优化,从而消除数据目录维护的繁重工作。设置目录后,数据消费者可以使用 Amazon DataZone 搜索和发现数据资产,检查元数据使用情境,请求数据集访问权限。当数据消费者开始分析数据,他们会创建一个 Amazon DataZone 数据项目,即门户系统中的一个共享空间,用户可以在其中提取不同的数据集、与同事共享访问权限、进行分析协作。


2023-01-18 17:188665
用户头像
李冬梅 加V:busulishang4668

发布了 808 篇内容, 共 377.5 次阅读, 收获喜欢 998 次。

关注

评论

发布
暂无评论
发现更多内容

从内存管理原理,窥探OS内存管理机制

华为云开发者联盟

cpu 内存 内存管理 应用程序 OS

Java开发Redis面试题分享

@零度

redis Java 开发

深入理解百度在离线混部技术

百度Geek说

云计算 云原生 后端

Ubuntu LNMPR环境搭建(Ubuntu 20.04 + Nginx1.8 + PHP 7.3 + Mysql8.0 + Redis5.0)

Owen Zhang

ubuntu LNMPR

Hadoop中mapreduce作业日志是如何生成的

华为云开发者联盟

hadoop hdfs mapreduce YARN 作业日志

微服务分布式架构中,如何实现日志链路跟踪

华为云开发者联盟

微服务 日志 分布式架构 logback 链路跟踪

Ubuntu 基于Nginx1.8的Golang环境搭建(Ubuntu 20.04 + Nginx1.8 + Golang 1.17 )

Owen Zhang

golang nginx ubuntu

抢占先机!为何说区块链通证经济象征未来?

CECBC

深入解析Kafka的offset管理

编程江湖

kafka

如何打造一款三消类游戏

Shopee技术团队

算法 前端 游戏 Shopee Candy

Linux之|etc|group文件

入门小站

Linux

在线HTTP/HTTPS协议GET,POST,RESTful接口测试

入门小站

工具

Hyperf结合PhpOffice/PhpSpreadsheet实现Excel&CSV文件导出导入

Owen Zhang

php hyperf php扩展 PhpOffice/PhpSpreadsheet

阿里云何川:开放兼容的云,计算巢帮助合作伙伴云化升级

阿里云弹性计算

弹性计算 年度峰会 计算巢

评委拍案叫绝、项目惊喜不断,这是一届怎样的 Hackathon ?丨TiDB Hackathon 2021 回顾

PingCAP

在Mac上运行Rainbond,10分钟快速安装

北京好雨科技有限公司

城墙上的“云镜派”,如何守护云上资产安全?

白洞计划

Golang:定时器的终止与重置

恒生LIGHT云社区

golang 定时器 语言 Go 语言

缓存一致性最佳实践

得物技术

缓存 分布式 数据 一致性 实践

新能力让数据多端协同更便捷,数据跨端迁移更高效!|HDC2021技术分论坛

HarmonyOS开发者

HarmonyOS

大搜车面向复杂业务场景的研发运维体系治理实践

阿里云弹性计算

弹性计算 运维峰会 研发运维

发挥好数字人民币促“双碳”作用

CECBC

在Windows上运行Rainbond,10分钟快速安装

北京好雨科技有限公司

『征文精选』技术翻译与术语管理技术:专业人说专业话

SphereEx

数据库 翻译 ShardingSphere 征文 SphereEx

区块链,元宇宙时代的“基础设施”

CECBC

2021关键词:重新起航

faiting

数据结构算法 盘点 2021

2021 OceanBase 年度报告 | 用技术让海量数据的管理和使用更简单!

OceanBase 数据库

开源 年度报告 oceanbase 成绩单

C语言-函数的可变形参(不定形参)

DS小龙哥

C语言

最佳实践:青藤云安全发布国内首个K8S ATT&CK攻防矩阵

青藤云安全

企业管理系统可视化权限功能设计

雯雯写代码

可视化 权限 企业管理系统

跨平台技术实战!百度文库跨平台技术快速落地全过程

百度Geek说

跨平台 PC 百度文库

疏通数据链条上的每个“堵点”,企业该如何利用端到端解决方案释放数据价值?_文化 & 方法_李冬梅_InfoQ精选文章