写点什么

NoSQL 数据库敏捷数据模型

  • 2018-11-05
  • 本文字数:1922 字

    阅读完需:约 6 分钟

NoSQL 数据库敏捷数据模型

在近日举行的 2018 年数据架构峰会上, Hackolade 首席执行官 Pascal Desmarets谈了 NoSQL 数据库的敏捷建模。他说,在 NoSQL 数据库中,由于没有规范化约束,数据建模变得更加重要。非结构化的多态大数据在数据治理和监管( GDPR 和 PII)以及利用积累的信息的能力方面都提出了挑战。

Desmarets 还谈到了数据建模如何帮助企业从 RDBMS 迁移到 NoSQL。在关系数据库和 NoSQL 数据库中,数据建模的好处包括提高应用程序质量,改善数据质量、GDPR& 隐私身份信息以及商业智能。

团队应该根据需求选择合适的NoSQL 数据库。例如,如果你需要管理简单的模式和快速地读写而不需要频繁地更新,那么就选择键- 值存储。如果你需要支持复杂查询的灵活模式,请选择文档数据存储。面向列的数据库很适合读取速度相对较低而写入速度极高的情况。图数据库更适合于需要在数据点之间进行遍历的应用程序,因为你需要能够存储每个数据点的属性以及它们之间的关系。

他谈到了传统的数据建模过程以及我们如何从数据建模过渡到模式设计方法。概念数据模型已经被领域驱动设计(DDD)所取代,不再需要逻辑数据模型,物理数据模型则被物理模式设计所取代。

在敏捷开发过程中,数据建模在过程的每个步骤中都有作用,包括在生产环境中。数据建模工作成为多个项目涉众之间的共享责任和对话。

他还说,领域驱动设计(DDD)和NoSQL 像是为彼此量身设计的,DDD 语言和NoSQL 数据库的概念直接吻合。他认为,在整个的策略、过程、体系结构和技术中,一致性是必要的,因为将所有这些原则一起应用比孤立地应用一两项原则更可取:领域驱动设计、敏捷开发、“以数据为中心(Data-Centricity)”、微服务、事件驱动的体系结构、NoSQL、DevOps 和云。

InfoQ 采访了 Desmarets,内容涉及 NoSQL 数据库数据建模及大数据管理的最佳实践。

InfoQ:每种 NoSQL 数据库类型的数据建模方法都不同吗,比如像 Cassandra 这样的时间序列数据库和像 Neo4j 这样的图数据库?

Pascal Desmarets:总体的方法非常相似,但是实现可能有很大的不同。为了利用 NoSQL 的优点,设计特定于应用程序的数据模型是非常重要的,这样就可以以优化查询性能的方式存储信息。对于那些几十年来一直使用与应用程序无关的数据建模原则的人来说,这种思维转变可能是一个挑战。对于我们中的许多人来说,规范化规则已经成为第二天性,我们必须强迫自己应用查询驱动的方法来为 NoSQL 数据库进行模式设计。

查询驱动的方法对于所有 NoSQL 数据库家族都非常相似。但是,当涉及到每种技术的模式设计的具体方面时,区别最大的是图数据库和 NoSQL DB 其他三个家族之间的差异。图数据库的特点是:在执行查询时,图遍历性能要求任何其他技术中的属性在图数据库中都可以提升为实体(或节点)的状态。

另外,每个 NoSQL 数据库家族中也存在差异。例如,对于图数据库,属性图 DB 和 RDF 三元存储之间有根本的区别。在 JSON 文档数据库中,你会发现 Couchbase MongoDB 之间的存储结构存在差异。类似地, HBase Cassandra 有非常不同的数据存储方法。

InfoQ:您能谈谈 NoSQL 数据库敏捷建模中的一些最佳实践吗?

Desmartes:几十年来,正如我们所熟知的那样,数据建模在敏捷开发环境中承受着巨大的压力。尽管试图使数据建模更加敏捷,但它经常被视为两周冲刺中速度和节奏的瓶颈。世界各地的数据建模者都感觉被排除在这个过程之外。事实上,某种形式的模式设计是必不可少的,就是说,需要重新设计数据建模以保持其重要意义。

首先,在整个开发冲刺和应用程序生命周期中,数据建模需要成为一个迭代过程,而不是一项繁重的前端任务。

数据建模还需要成为数据建模者(他们擅长抽象他们对业务的理解)和开发人员(他们真正理解如何将需求转换成代码)之间的协作过程。

这就要求数据建模人员成为 Scrum 团队不可或缺的一部分。

该方法需要适应开发技术和技术栈,特别是前面描述的查询驱动和特定于应用程序的方法。它必须结合领域驱动设计、用户体验和业务规则流程图以及屏幕线框图和报表,才能获得在设计模式时需要考虑的应用程序查询。

最后,我们需要能够灵活适应新环境的下一代工具!

他还说,在相当长的一段时间里,NoSQL 数据库供应商通过使用“无模式”或“非关系型”等术语创造了一种差异化和轰动效应。但是,NoSQL 数据库是如此的灵活和强大,没有经验的用户如果不应用一些严格的技术,就很容易陷入麻烦。现在,供应商意识到,为了将他们的解决方案卖给企业,更明智的做法是使用术语“动态模式”。在使用 NoSQL 时,数据建模(或模式设计)实际上比关系数据库更重要。我们只是需要一种不同于以往的数据建模方法。数据建模者应该拥抱敏捷开发,并学习新技术栈,证明它们在这个过程中增加了价值。

查看英文原文: Agile Data Modeling for NoSQL Databases

2018-11-05 07:592252
用户头像

发布了 1008 篇内容, 共 419.7 次阅读, 收获喜欢 346 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

现代JavaScript:ES6+ 中的 Imports,Exports,Let,Const 和 Promise

葡萄城技术团队

Java ES6

手写线程池,对照学习ThreadPoolExecutor线程池实现原理!

小傅哥

Java 小傅哥 线程池 七日更 ThreadPoolExecutor

30G 上亿数据的超大文件,如何快速导入生产环境?

楼下小黑哥

Java MySQL 并发编程 线程池

引领云原生发展浪潮 阿里云开启云原生大规模落地元年

阿里巴巴云原生

云计算 阿里巴巴 阿里云 最佳实践 云原生

如何在 20 分钟内给你的 K8s PaaS 上线一个新功能?

阿里巴巴云原生

阿里云 容器 运维 云原生

Nginx常见典型故障|Linux干货

赖猫

c++ nginx Linux

MySQL字符集修改实战教程

Simon

MySQL 字符集 七日更

如何破解AI数据困境?京东智联云联邦学习平台有良方

京东科技开发者

人工智能 大数据 学习

Go中的Channel背后的设计哲学

soolaugust

Go Concurrency Patterns 七日更 CSP Go 语言

Android uni-app实现音视频通话

anyRTC开发者

uni-app android 音视频 WebRTC 跨平台

揭秘大流量场景下发布如丝般顺滑背后的原因

阿里巴巴中间件

阿里巴巴

《数据分析》PDF免费下载

计算机与AI

数据分析

生产环境全链路压测建设历程 18:某快递 A 股上市公司的生产压测案例之中篇

数列科技杨德华

全链路压测 七日更

TypeScript | 第三章:函数、泛型和枚举

梁龙先森

typescript 编程 大前端 七日更

JDK 16 即将发布,新特性速览!

xcbeyond

Java 七日更

世界之书:《禅与摩托车维修艺术》与发现良质

lidaobing

禅与摩托车维修艺术 28天写作

Spring Cloud 2020.0.0正式发布,再见了Netflix

YourBatman

Spring Cloud Spring Boot netflix 2020.0.0

单点破局思维|技术人应知的创新思维模型(8)

Alan

个人成长 技术人应知的创新思维模型 七日更 28天写作

代码零改动Serverless架构升级?这家在线编程教育企业是这么做的

阿里巴巴中间件

Python Serverless

夜莺二次开发指南-监控系统(1)

ning

滴滴夜莺 夜莺监控

附PPT丨AWS基于数据湖构建云上的数据分析架构

dbaplus社群

数据湖 AWS

语音助手中的复杂语义表达方法

DataFunTalk

AI nlp

XRP瑞波币系统软件开发|XRP瑞波币APP开发

系统开发

wildfly 21的domain配置

程序那些事

程序那些事 wildfly wildfly21 配置管理 domain模式

Serverless 落地之痛怎么解?

阿里巴巴中间件

Serverless

最有技术含量的面试

escray

面试 面经 七日更 十日谈

任务发布系统软件开发|任务发布APP开发

系统开发

揭开阿里巴巴复杂任务资源混合调度技术面纱

阿里巴巴云原生

云计算 阿里云 性能优化 云原生 资源调度

12张图带你彻底理解分布式事务!!

冰河

分布式事务 BASE理论 TCC ACID CAP理论

Shell简介

入门小站

Shell

夜莺二次开发指南-监控系统(2)

ning

滴滴夜莺 夜莺监控

NoSQL 数据库敏捷数据模型_文化 & 方法_Srini Penchikala_InfoQ精选文章