NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Michael Stonebraker:主要的 RDBMS 都是过时的技术

  • 2007-09-12
  • 本文字数:1470 字

    阅读完需:约 5 分钟

Michael Stonebraker ——Ingres 和 Postgres 关系型数据库管理系统(RDBMS)的创造者之一, Vertica Systems 的 CTO——在数据库社区里提出了一个争议性的观点,他认为现在主要的数据库中,大部分都属于过时的技术

Stonebraker 首先分析了主要的关系数据库(IBM 的 DB2 、Microsoft 的 SQL server Oracle ),它们基础是在 25 年前架构的两个平台( System R Ingres ),这两个平台的目标都是成为通用的工具而非某个特定行业的产品。他还指出它们当初设计的环境跟今天的环境很不同,硬件的特点和数据库的使用场景也很不一样。特别是当初 Online Transaction Processing (OLTP)是数据库的唯一的使用领域——现在则出现了数据仓库、半结构化的数据等不相关的应用。

他接着说,“普适”的设计路线如今不再正确,而且“我能想到的每个主要应用领域,都可构建出以特定垂直市场需要为内核的 SQL DBMS 引擎,而且性能会比‘普适’引擎强上 50 倍的样子”。他还说:

[……] 我预测列存储会逐渐占领数据仓库市场,完全取代行存储。因为许多数据仓库用户都正经历着相当的困扰(无法再装载时间段内完成数据装载,不支持临时查询,无法改善性能除非进行大规模升级),我认为向列存储转换的过程将会很快完成,客户正在寻求改善性能的更好方式。从长期来看,我认为在其它市场上也会发生同样的转换,因为用户也在经历同样的困扰,一个特化的软件架构将可能从根本上改善性能。

ComputerWorld 的 Erik Lai 提供了一些列存储数据库背景资料

  • 列数据库按照列来存储数据,与按行存储相对。
  • 由于相似的数据彼此接近,列数据库减少了多种类型的查询的磁盘读取时间(如数据仓库查询)。
  • Google’s BigTable is a column-oriented database which powers many Google applications (e.g. Google Maps and Google Reader)

Lai 还指出行数据库也有优于列数据库的地方,比如将数据写入磁盘——写入一行数据只需单次操作,而多个列则需要多次分别写入。

Slashdot 上也有很多关于这个主题的争论,有些人并不同意 “普适”数据库的概念已经死了。

这是个老问题,“普适”数据库在未来一段时间里还是足够的。越来越多的人喜欢轻量的选择,即使性能稍微低一点;他们硬塞进去的持久化层对性能影响更大,仅仅是因为持久化层能给他们自动生成无聊的数据处理代码。因为不需要自行编写数据处理代码,数据库是如何工作的就没有关系了,你可以专注于如何使用数据,而不必操心表、行、ACID 属性之类。让机器自动生成与数据库交互的代码,你就可以随意操弄生成出来的代码和底下的其他层次。

其他人则同意 Stonebraker 的观点

如果你只想读一大堆数据,列存储很好(比行存储好);但如果你想写一大堆数据,列存储比行存储成本高得多。因此,根据你的需要来选择。你需要存储海量数据吗?列存储可能不适合你……行存储会让你的应用运行得更好,因为向行存储中写入只是简单地在文件里增加一条记录,而向列存储写入通常意味着要在很多个文件里增加记录……显然更昂贵。

另一方面,你面对的是一组相对稳定的数据,读的次数远多于写的次数吗?那么行存储并不是好选择,你应该时时列存储。在行存储里,查询是整行整行的,这意味着你常常碰上那些你一点都不关心的字段。而在列存储里,你可以忽略任何查询中没有提到的字段……另外,在列存储里,数据是同质的,因此不需要再为数据类型的差异付出额外代价,而且可以根据字段来选择最佳的数据压缩方式而不是按照数据块。

为什么人们还坚持用一种方式对付所有的情况?

这场争论才算是刚刚开始。你的观点如何?

查看英文原文: Michael Stonebraker: Major RDBMSes are legacy technology

2007-09-12 00:402248
用户头像

发布了 225 篇内容, 共 60.9 次阅读, 收获喜欢 50 次。

关注

评论

发布
暂无评论
发现更多内容

玄铁VirtualZone:基于RISC-V架构的安全扩展

Roy夹馍

cpu 物联网 嵌入式开发

极光笔记丨Locust性能测试工具的使用

极光JIGUANG

软件测试 测试工具

在线考试系统有哪些?快考题|企考云,高频互动的培训功能免费用

亿欧之

从芯片到云全链路高效设计 一文了解YoC基础软件平台

Roy夹馍

物联网 risc-v 嵌入式开发

支持HDMI-IN接口的安卓工控主板有哪些?

双赞工控

一文看懂RISC-V代码密度

Roy夹馍

物联网 risc-v 嵌入式开发

filecoin全网有效算力突破10EiB?Filecoin挖矿现在还有机会入场吗?

区块链 分布式存储 IPFS filecoin挖矿 filecoin矿机

平头哥剑池CDK 更新重磅来袭!三大亮点速看!

Roy夹馍

物联网 risc-v 嵌入式开发 软件模拟

ipfs挖矿是什么意思?ipfs挖矿靠谱吗?

ipfs挖矿靠谱吗 ipfs挖矿是什么意思

辅导班用什么管理系统?染书CRMA,课时班级信息自动罗列

亿欧之

如何创建网上试卷?快考题|企考云,专项练习降低人工阅卷失误率

亿欧之

【GaussDB精品课第1期】GaussDB(for openGauss)数据库,打造自研世界级产品

华为云数据库小助手

GaussDB 课程 GaussDB(for openGauss) 华为云视频 华为云数据库

fil矿机8T多少钱?fil矿机多少钱一台?

FIL矿机多少钱一台 fil矿机多少钱

微信朋友圈高性能复杂度架构设计

Imaginary

平头哥玄铁CPU调试系统介绍

Roy夹馍

cpu risc-v 嵌入式开发 调试系统

Application.mk

Changing Lin

9月日更

二叉树层次遍历及应用

高性能架构探索

面试 二叉树 遍历

元宇宙基础设施提供商【时空云】将承办【博鳌亚洲论坛区块链分论坛】

时空云

分布式存储 IPFS Filecoin 元宇宙

图像之场景分类 实验研究

毛显新

人工智能 神经网络 深度学习 图像识别 PyTorch

Vector向量计算技术与SIMD技术的对比

Roy夹馍

cpu IoT 芯片 risc-v

EMQ X VS RabbitMQ:两大消息服务器 MQTT 性能对比全解(上)

EMQ映云科技

RabbitMQ 物联网 IoT mqtt emq

ipfs矿机工作原理是什么?ipfs矿机多少钱一台?

IPFS矿机多少钱一台 ipfs矿机工作原理是什么

补课班用什么管理系统?染书CRMA,赋能教培机构信息化

亿欧之

如何建立微信考试?快考题|企考云,轻松拥有HR在线测评系统

亿欧之

极狐GitLab 和 ArgoCD 的集成实践

极狐GitLab

Kubernetes gitlab 极狐GitLab ArgoCD

Paxos理论介绍(2): Multi-Paxos与Leader

OpenIM

托管班用什么管理系统?染书CRMA,自带营销工具提升续班率

亿欧之

澳鹏Appen收购Quadrant:移动定位数据业务进一步增强

澳鹏Appen

人工智能 大数据 企业 收购

人工智能是下一个“新生代农民工”吗?

澳鹏Appen

人工智能 大数据 AI 数据标注 训练数据

RISC-V工具链简介

Roy夹馍

物联网 risc-v 嵌入式开发

中断实时性及处理技术简介

Roy夹馍

物联网 risc-v 嵌入式开发

Michael Stonebraker:主要的RDBMS都是过时的技术_Java_Ryan Slobojan_InfoQ精选文章