【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

James Phillips 谈从关系型数据库转到 NoSQL

  • 2011-12-13
  • 本文字数:1225 字

    阅读完需:约 4 分钟

James Phillips, Couchbase 的创始人之一。他最近的一场演讲谈到分布式面向文档的数据库和关系型数据库模型之间的差别,以及从关系型数据库转到NoSQL 时数据库开发者需掌握的知识。InfoQ 就面向文档的NoSQL 的优缺点采访了James。

InfoQ:在谈及数据持久和数据管理时,您提到了“大数据 (Big Data)”和“大用户 (Big User)”,可否解释这两个概念之间的区别以及如何在二者之间做选择?

James Phillips大数据:需要收集并存储大量信息,然后对信息进行分析和学习。它需要持续的高吞吐的写(收集信息时)和读(分析信息时)。数据本地化模型的优化方法是将“关联的数据”放在物理上临近的地方,从而确保分析的高效性。通常来说,它需要少量做数据插入的同步写和少量做信息分析的同步读。

大用户:需要为随机的读和写,以及大量并发读和写提供服务。数据本地化模型的优化方法则应该将“关联的数据”尽可能地分散开,从而将读和写操作最大限度地分散到不同的服务器和转轴之上。

InfoQ:NoSQL 数据库与关系型数据库相比,在数据建模和应用开发上其最主要的差别是什么?

James:关系型数据模型(及其数据建模)关注的是数据规范化的过程——将“记录”分解成许多表以及表之间的关系,降低数据冗余。在过去,系统资源有限时,其意义非常大,因为每个字节的处理效率都很关键。而面向文档的方式存储数据则是更加自然的方式。其缺点是在某些情况下,数据要冗余,查询模型也自然更复杂一些。但是,数据建模要简单得多,因为现实世界中,信息并不总需要规范。而且,因为限制少了,应用开发者的生产力也提高了。

InfoQ:在演讲中您谈到面向文档的数据库。在哪些情况下,用面向文档的数据库优于关系型数据库?

James:面向文档的数据库在以下场景中更胜一筹:需要数据模型的灵活性(数据管理过程中,需求变更无需变更 schema);低延迟、持久、高吞吐的读写性能;通过将数据和 I/O 方便地分散到廉价服务器和虚拟机之上,使基础设施费用与应用程序性能成正比。

InfoQ:面向文档的数据库支持哪些数据持久和数据管理的架构模式?

James:大多数 NoSQL 及面向文档的数据库都支持多种持久化模型:从完全的同步策略(比如,只有当数据写入磁盘或持久设备之后才报告写操作成功)到多种异步存储策略(比如,接受写请求之后,在实际写入磁盘之前就报告成功;或者,仅仅在完成数据备份之后即报告成功)。

InfoQ:面向文档的数据库有哪些缺点?应用架构师和开发者在使用这类数据库时应考虑哪些问题?

James:目前,面向文档的数据库不直接支持连接(join),事务的支持通常只针对单个文档,之前提到的数据持久灵活性也可算作缺点。它产生了数据冗余,在某些情况下,当数据变更时需要在多处更新数据。所以,基于面向文档数据库的应用要为处理相互依赖的更新做更多事情。将来,我们会看到使用外部事务监控器来填补目前对事务支持上的断层。同样,在应用层也有办法实现诸如连接查询之类的功能。


查看英文原文: James Phillips on Moving from Relational to NoSQL Databases

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2011-12-13 04:234449
用户头像

发布了 184 篇内容, 共 76.4 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

探索大模型在端侧应用的新形态

百度开发者中心

人工智能 图像识别 大模型

服务器里面打开浏览器访问不了会是什么原因

德迅云安全杨德俊

AI时代我们的IT团队架构应该如何应变

Onegun

人工智能 AI 团队组织

小程序能否成为移动应用实现动态更新与敏捷迭代的突破口?

Geek_2305a8

2024提升计划|优秀程序员的10大共性特征

SoFlu软件机器人

程序员 软件开发 代码 测试 单元测试 构架

Capture One Pro 22 for Mac(RAW图像处理软件) v15.4.2.12永久激活版

mac

苹果mac Windows软件 Capture One Pro 22 RAW文件转换器

【Spring技术专题】「实战开发系列」保姆级教你SpringBoot整合Mybatis框架实现多数据源的静态数据源和动态数据源配置落地

洛神灬殇

spring mybatis springboot 数据源切换 2024年第六篇文章

请重视你的简历

老张

面试 简历优化 简历

软件测试开发/全日制/测试管理丨测试左移和测试右移

测试人

软件测试 测试开发

Hackathon | Mint Blockchain 启动全球 NIP 创意提案黑客松活动!

NFT Research

blockchain 黑客松 NFT\

数据资产入表“倒计时”,企业该如何抓住红利?

用友BIP

数据资产

简单聊聊数据库可以做什么,有什么用?

行云管家

数据库 云计算 大数据

2023 CSIG青年科学家会议丨多模态大模型时代下的文档图像处理

热爱编程的小白白

新特性速览!Sermant重磅更新,1.3.0 release版本发布

华为云开源

微服务治理 sermant 字节码增强框架

GraphPad Prism 10 for mac激活版下载

影影绰绰一往直前

身为程序员,你很有必要了解一下提效工具“JNPF”

互联网工科生

程序员 软件开发 低代码 JNPF

数据如何驱动AI大模型的竞争优势

百度开发者中心

人工智能 AI 大模型

三步快速制作数字人视频!

青否数字人

数字人

小度推出小度学习机K16:内容、AI功能、软硬件配置全面升级

新消费日报

好用的鼠标键盘记录工具:Mouse And Keyboard Recorder激活中文

胖墩儿不胖y

Mac软件 鼠标管理工具 Mac软件鼠标辅助

小程序怎样成为平台““破壁人”?全网引流的3种姿势!

Geek_2305a8

快手商品详情数据接口(ks.item_get)丨快手API接口

tbapi

快手商品详情数据接口 快手API接口 快手商品数据接口 快手数据采集

SQLPro Studio for Mac 2023.55激活版下载

影影绰绰一往直前

VRRP协议是什么?详解它的工作原理

百度搜索:蓝易云

云计算 Linux 运维 云服务器 VRRP

shell脚本中注意事项详解。

百度搜索:蓝易云

Linux 运维 Shell 云服务器 ECS

亿级流量摩擦出来的 ES 稳定性之道

常清静

方法论 ES 建模 Elastic Search ES优化

助力 AI 技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”

机器智能社区

人工智能 机器学习 开源

探索跨语言、跨模态、跨任务的大模型驱动应用生态繁荣

百度开发者中心

人工智能 大模型

软件测试/测试开发/岗位内推丨字节跳动岗位开放

测试人

软件测试

深入理解 Docker 核心原理:Namespace、Cgroups 和 Rootfs

EquatorCoco

Docker 容器化 项目开发

Java爬虫与Python爬虫有什么区别

百度搜索:蓝易云

Java Python Linux 运维 云服务器

James Phillips谈从关系型数据库转到NoSQL_DevOps & 平台工程_Srini Penchikala_InfoQ精选文章