写点什么

数据网格平台如何连接数据生产者和消费者

  • 2024-07-11
    北京
  • 本文字数:1347 字

    阅读完需:约 4 分钟

大小:658.17K时长:03:44
数据网格平台如何连接数据生产者和消费者

公司在利用数据仓库或数据湖中的数据时经常会面临的一个挑战,那就是分析数据的所有权很弱或根本不存在,因此质量可能会受到影响。数据网格是公司如何从数据中创造价值的组织范式转变,责任又重新回到了生产者和消费者手中。

 

Matthias Patzak 在法国FlowCon大会上发表了关于数据网格平台的演讲。

 

正如 Patzak 所解释的那样,当公司想要利用数据并实现数据驱动时,他们面临的最大挑战之一就是他们所收集的数据的质量:

 

你听过“数据就是新石油”这句话吗?在 21 世纪末,人们认为所有的数据都应该被存储,因为它是一种宝贵的资源。但是,当你不知道是谁存储了什么数据以及为什么存储时,谁会信任一个 5 年前的 S3 存储桶呢?

 

Patzak 认为数据更像是葡萄酒。他说,有些数据就像是葡萄酒一样,必须迅速消耗掉,否则就会变质。其他数据,如果存储和处理得当,可以很好地保存,甚至随着时间的推移,其价值和质量也会提高。

 

Patzak 提到,根本问题是分析数据的所有权往往很弱或根本不存在,因此质量可能会受到影响。分析数据由事务系统生成的。然而,Patzak 说,了解并拥有这些系统和底层流程的人不负责对其数据进行分析的应用程序。它通常被提取、转换、加载到数据仓库或数据湖中,并由中心化的、高度专业化的部门使用。他补充道,这些专家通常也没有真正的主人翁意识。

 

Patzak 说到,数据网格是一种分布式数据基础设施,它将使用数据并从数据中创造价值的责任重新交到数据的生产者和消费者手中。它消除了专门的数据组织作为在生产者和消费者之间通信的的代理和瓶颈。这种分布式数据基础设施的核心是数据产品,它们本身就可以创造切实的商业价值。

 

要构建一个数据网格,你需要创建一个面向领域的架构,在该架构中,每个业务单元都将其数据作为一种产品进行管理,使用自助服务基础设施和工具进行编排、共享和治理,正如 Patzak 所解释的那样:

 

这种自助服务基础设施由数据网格平台构建,包括云服务、数据编排工具和 CI/CD 管道,并由用于安全和质量的联邦治理策略以及用于监控的可观测性系统来支持。

 

Patzak 提到,访问由强大的安全机制控制,整个数据基础设施是自动化的,并通过“基础设施即代码”实践进行维护。他补充道,至关重要的是,通过平台团队提供的有针对性的支持和培训计划,领域团队具备了必要的技能,确保技术设置促进了自主、质量和协作的文化。

 

Patzak 总结道,数据网格的好处是实施时间更快,生产者和消费者的认知负荷更少,为公司提供了一致的工具和标准。

 

InfoQ 就创建数据网格平台一事采访了Matthias Patzak

 

InfoQ:创建数据网格平台需要什么?平台能带来什么好处?

 

Matthias Patzak:从技术角度来看,一切都可以用来构建数据网格平台的核心服务。这只是一项繁重的工作。与任何平台一样,挑战在于确保平台服务被用户接受和使用。这是通过让平台用户优先处理平台积压的工作,并通过轮岗的方式让用户团队的开发人员参与平台服务的开发来实现的。

 

InfoQ:对于那些希望使用数据网格来利用数据的组织来说,你有什么建议嘛?

 

Patzak:不要大费周章!从一个特定的用例开始,将开放的生产者和消费者配对,并利用数据网格的去中心化方法。甚至在你准备好之前就开始,并通过开始来做好准备。最后,与特定的用例并行开发平台。

 

原文链接:

https://www.infoq.com/news/2024/06/data-mesh-platforms/

2024-07-11 08:007240

评论

发布
暂无评论
发现更多内容

性能卓越 全栈自主 HashData与华为金融数仓一体机联合方案全面解读

酷克数据HashData

为什么要学音视频?

X2Rtc

开源 音视频 RTC 就业

第13期 | GPTSecurity周报

云起无垠

SQLSmith: Databend 如何利用随机化测试检测 Bug

Databend

PostgreSQL基于Patroni方案的高可用启动流程分析

谐云

APP移动出海必备神器,MobPush提供海外消息智能推送一站式解决方案

MobTech袤博科技

智能推送

腾讯Ckafka队列使用测评

查拉图斯特拉说

kafka 消息中间件

博睿数据亮相GOPS全球运维大会上海站!

博睿数据

国内有哪些做的比较好的云教室厂商?

青椒云云电脑

云教室 云教室厂商 云教室解决方案

跨语言高性能 RPC 框架 Focus 架构解析

dinstone

RPC 高性能 跨语言 focus

企业如何安全跨国传输30T文件数据

镭速

跨国数据传输 跨境数据传输

深度解读MediaBox SDKs如何实现技术架构升级

阿里云CloudImagine

云计算 视频云

LLM 大语言模型应用的分段策略

Tiger Wang

LLM 大语言模型 langchain

Kafka 在分布式系统中的 7 大应用场景

越长大越悲伤

Java kafka

Kubernetes跨StorageClass迁移,切换Rainbond默认SC

北京好雨科技有限公司

云原生 #Kubernetes# 企业号10月PK榜

产研团队必看!3款在线白板工具助你轻松改善工作!

彭宏豪95

产品经理 科技 产品研发 在线白板 效率软件

云教室如何部署?云教室使用教程

青椒云云电脑

云教室 云教室厂商

如何选择向量数据库|Weaviate Cloud v.s. Zilliz Cloud

Zilliz

非结构化数据 Zilliz 向量数据库 zillizcloud

应用容器化转型系列-容器部署的常见形态

品高云计算

一招教会跨国企业如何解决跨境数据传输的丢包和延迟问题

镭速

跨境数据传输

为什么C4D能成为电商设计的王者?

Finovy Cloud

C4D 电商设计

推送内容有误怎么办?MobPush撤回/取消推送为您排忧解难

MobTech袤博科技

智能推送

数智化推送助力用户精准分层,MobPush是如何实现用户价值变现的

MobTech袤博科技

智能推送

免费活动-11月4日敏捷武林上海站 | Scrum.org CEO 亲临现场

顿顿顿

Scrum 敏捷开发 敏捷项目管理 敏捷活动 scrum活动

数据网格平台如何连接数据生产者和消费者_管理/文化_Ben Linders_InfoQ精选文章