AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

NoSQL 数据库敏捷数据模型

  • 2018-11-05
  • 本文字数:1922 字

    阅读完需:约 6 分钟

NoSQL 数据库敏捷数据模型

在近日举行的 2018 年数据架构峰会上, Hackolade 首席执行官 Pascal Desmarets谈了 NoSQL 数据库的敏捷建模。他说,在 NoSQL 数据库中,由于没有规范化约束,数据建模变得更加重要。非结构化的多态大数据在数据治理和监管( GDPR 和 PII)以及利用积累的信息的能力方面都提出了挑战。

Desmarets 还谈到了数据建模如何帮助企业从 RDBMS 迁移到 NoSQL。在关系数据库和 NoSQL 数据库中,数据建模的好处包括提高应用程序质量,改善数据质量、GDPR& 隐私身份信息以及商业智能。

团队应该根据需求选择合适的NoSQL 数据库。例如,如果你需要管理简单的模式和快速地读写而不需要频繁地更新,那么就选择键- 值存储。如果你需要支持复杂查询的灵活模式,请选择文档数据存储。面向列的数据库很适合读取速度相对较低而写入速度极高的情况。图数据库更适合于需要在数据点之间进行遍历的应用程序,因为你需要能够存储每个数据点的属性以及它们之间的关系。

他谈到了传统的数据建模过程以及我们如何从数据建模过渡到模式设计方法。概念数据模型已经被领域驱动设计(DDD)所取代,不再需要逻辑数据模型,物理数据模型则被物理模式设计所取代。

在敏捷开发过程中,数据建模在过程的每个步骤中都有作用,包括在生产环境中。数据建模工作成为多个项目涉众之间的共享责任和对话。

他还说,领域驱动设计(DDD)和NoSQL 像是为彼此量身设计的,DDD 语言和NoSQL 数据库的概念直接吻合。他认为,在整个的策略、过程、体系结构和技术中,一致性是必要的,因为将所有这些原则一起应用比孤立地应用一两项原则更可取:领域驱动设计、敏捷开发、“以数据为中心(Data-Centricity)”、微服务、事件驱动的体系结构、NoSQL、DevOps 和云。

InfoQ 采访了 Desmarets,内容涉及 NoSQL 数据库数据建模及大数据管理的最佳实践。

InfoQ:每种 NoSQL 数据库类型的数据建模方法都不同吗,比如像 Cassandra 这样的时间序列数据库和像 Neo4j 这样的图数据库?

Pascal Desmarets:总体的方法非常相似,但是实现可能有很大的不同。为了利用 NoSQL 的优点,设计特定于应用程序的数据模型是非常重要的,这样就可以以优化查询性能的方式存储信息。对于那些几十年来一直使用与应用程序无关的数据建模原则的人来说,这种思维转变可能是一个挑战。对于我们中的许多人来说,规范化规则已经成为第二天性,我们必须强迫自己应用查询驱动的方法来为 NoSQL 数据库进行模式设计。

查询驱动的方法对于所有 NoSQL 数据库家族都非常相似。但是,当涉及到每种技术的模式设计的具体方面时,区别最大的是图数据库和 NoSQL DB 其他三个家族之间的差异。图数据库的特点是:在执行查询时,图遍历性能要求任何其他技术中的属性在图数据库中都可以提升为实体(或节点)的状态。

另外,每个 NoSQL 数据库家族中也存在差异。例如,对于图数据库,属性图 DB 和 RDF 三元存储之间有根本的区别。在 JSON 文档数据库中,你会发现 Couchbase MongoDB 之间的存储结构存在差异。类似地, HBase Cassandra 有非常不同的数据存储方法。

InfoQ:您能谈谈 NoSQL 数据库敏捷建模中的一些最佳实践吗?

Desmartes:几十年来,正如我们所熟知的那样,数据建模在敏捷开发环境中承受着巨大的压力。尽管试图使数据建模更加敏捷,但它经常被视为两周冲刺中速度和节奏的瓶颈。世界各地的数据建模者都感觉被排除在这个过程之外。事实上,某种形式的模式设计是必不可少的,就是说,需要重新设计数据建模以保持其重要意义。

首先,在整个开发冲刺和应用程序生命周期中,数据建模需要成为一个迭代过程,而不是一项繁重的前端任务。

数据建模还需要成为数据建模者(他们擅长抽象他们对业务的理解)和开发人员(他们真正理解如何将需求转换成代码)之间的协作过程。

这就要求数据建模人员成为 Scrum 团队不可或缺的一部分。

该方法需要适应开发技术和技术栈,特别是前面描述的查询驱动和特定于应用程序的方法。它必须结合领域驱动设计、用户体验和业务规则流程图以及屏幕线框图和报表,才能获得在设计模式时需要考虑的应用程序查询。

最后,我们需要能够灵活适应新环境的下一代工具!

他还说,在相当长的一段时间里,NoSQL 数据库供应商通过使用“无模式”或“非关系型”等术语创造了一种差异化和轰动效应。但是,NoSQL 数据库是如此的灵活和强大,没有经验的用户如果不应用一些严格的技术,就很容易陷入麻烦。现在,供应商意识到,为了将他们的解决方案卖给企业,更明智的做法是使用术语“动态模式”。在使用 NoSQL 时,数据建模(或模式设计)实际上比关系数据库更重要。我们只是需要一种不同于以往的数据建模方法。数据建模者应该拥抱敏捷开发,并学习新技术栈,证明它们在这个过程中增加了价值。

查看英文原文: Agile Data Modeling for NoSQL Databases

2018-11-05 07:592304
用户头像

发布了 1008 篇内容, 共 424.1 次阅读, 收获喜欢 346 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

GitHub标星159K的Java学习手册,太香了!

互联网架构师小马

Java

麒麟操作系统是什么?和linux的区别是什么?

行云管家

信创 麒麟操作系统

清爽快速全面的网址导航(cooltools.top)

Yongqiang

人工智能 AI AIGC ChatGPT

字节算法中了80%!靠着这份GitHub上的算法小抄,成功斩获Offer

互联网架构师小马

Java 数据结构 算法 LeetCode

重磅再推 | 基于OpenSearch向量检索版+大模型,搭建对话式搜索

阿里云大数据AI技术

人工智能 搜索引擎 企业号 6 月 PK 榜

Python的离线安装

Geek_7ubdnf

我的多巴胺回来了!双手奉上在rumble上下载视频的最佳秘诀!

frank

数据库的 Schema 变更实现

KaiwuDB

KaiwuDB Schema 锁表

软件测试 | Selenium-Grid架构

测吧(北京)科技有限公司

测试

NFTScan 与 SPACE ID 达成合作伙伴,支持 .bnb / .arb 域名搜索!

NFT Research

域名 NFT\

软件测试/测试开发丨Pytest测试框架学习笔记

测试人

程序员 软件测试 pytest

连续两年!PingCAP 入选 Gartner 云数据库“客户之声”,获评“卓越表现者”最高分

PingCAP

Bartender 4 for Mac(菜单栏应用管理软件) 中文

背包客

macos Mac 软件 mac软件下载 MacBook Pro Bartender

体验昇腾Ascend C 编程语言极简易用的算子开发

华为云开发者联盟

人工智能 华为云 昇腾AI 华为云开发者联盟 企业号 6 月 PK 榜

TiDB x Catalyst丨秒级洞悉数据价值,TiDB 帮助“客户成功 SaaS 厂商”提升用户体验

PingCAP

数据库 分布式 TiDB

GitHub热榜,亿级流量并发手册彻底揭开阿里高流量的秘密

互联网架构师小马

软件测试 | Dalvik虚拟机是如何执行程序的

测吧(北京)科技有限公司

测试

2023 可信数据库发展大会:近百位行业大咖将出席演讲

KaiwuDB

KaiwuDB TDBC 2023可信数据库发展大会

Tower for Mac:强大的Git客户端

背包客

macos git Tower Mac 软件 mac软件下载

卡奥斯正式加入开放原子开源安全委员会

Openlab_cosmoplat

开源社区 开放原子全球开源峰会

深入学习 Linux 操作系统的存储 IO 堆栈

KaiwuDB

KaiwuDB Linux存储 IO堆栈

MySQL读取的记录和我想象的不一致

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 6 月 PK 榜

卡奥斯联合开放原子开源基金会倡议发起“云原生工作委员会”

Openlab_cosmoplat

开源社区 开放原子全球开源峰会

Pycharm配置远程调试

Geek_7ubdnf

华为云企业快成长安全技术创新论坛广州站举办在即 都有哪些亮点干货?

说山水

卡奥斯获开放原子开源基金会黄金捐赠人授牌

Openlab_cosmoplat

开放原子全球开源峰会

百度沈抖:大模型 产业智能化时代的新引擎

飞桨PaddlePaddle

百度 算法

火山引擎金融专区通过安全等保四级资质测评

科技热闻

KaiwuDB 数据库高可用方案及落地实现

KaiwuDB

KaiwuDB 数据库高可用

NoSQL 数据库敏捷数据模型_文化 & 方法_Srini Penchikala_InfoQ精选文章