写点什么

MapReduce 是倒退:拿它与关系数据库比较公平吗?

  • 2008-01-19
  • 本文字数:661 字

    阅读完需:约 2 分钟

最近 David J. DeWitt 和 Michael Stonebraker 在 the Database Column 上写了一篇文章试图将日益流行的 MapReduce 编程范式与关系数据库进行比较。该文章说道:

……作为数据处理范式,MapReduce 代表着一个巨大退步。数据库社区已经学到了如下三个经验,这些经验从 40 年前 IBM 第一次在 1968 年发布 IMS 时就已经揭示出来了……根据迄今为止的评估实验,我们严重怀疑 MapReduce 应用程序能有多大伸缩性。此外,MapReduce 的实现者应该好好学习近 25 年来的并行 DBMS 研究文献。

文章接着给罗列了如下判据:

  • MapReduce 是一个糟糕的实现(与 B-trees 相比)
  • MapReduce 不是革新
  • MapReduce 缺乏某些特性(如装载和索引)
  • MapReduce 与 DBMS 工具不兼容

博客界很快就声称这一比较及其理由都是漏洞百出的。Greg Jorgensen 进行了逐条反驳。在这些条目中,他指出 MapReduce 不是数据库,而是用于分布式处理的算法技术,不能这么比较。Jorgensen 建议更好的比较对象应该是 SimpleDB:

……作者真正想抱怨的是分布式“云”数据管理系统,如亚马逊的 SimpleDB;实际上,如果你将“MapReduce”换为“SimpleDB”,原文差不多就有意义了……

Rich Skrenta 从打破习惯的角度发表了评论:

……打破了你的习惯的东西总是有些地方看不顺眼的。功能不足,发展得也不成熟。但要是在价格上能赢 10 倍,不牢靠的廉价货最终也会胜出。想想 Linux 对阵 AT&T 的 Unix,或 mysql 对阵 Oracle……

关于这篇文章冗长的争论和评论还可以从 reddit ycombinator 上找到。

查看英文原文: MapReduce A Step Backwards: Is Comparison to Relational Databases Fair?

2008-01-19 04:381761
用户头像

发布了 150 篇内容, 共 43.4 次阅读, 收获喜欢 9 次。

关注

评论

发布
暂无评论
发现更多内容

Elasticsearch 写入流程 Making Changes Persistent

escray

elastic 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 3月日更

英文IT数码类播客学习笔记

SilentMacUser

红帽 互联网 播客 计算机历史

操作系统的内存管理(上)

鲁米

内存管理

android基础教程!字节跳动+京东+360+网易面试题整理,附答案

欢喜学安卓

android 程序员 面试 移动开发

数据采集之Flume采集及点击流模型详解

五分钟学大数据

大数据 28天写作 3月日更 flume 点击流模型

【得物技术】前端微服务

得物技术

微服务 大前端 得物技术

还原五百丁APP需求文档

林亚超

net.coobird.thumbnailator.tasks.UnsupportedFormatException: No suitable ImageReader found for source data.

wjchenge

我的学习笔记

SilentMacUser

Python JavaScript 学习 大前端 开发

androidjson解析!跟我一起手写EventBus吧,不吃透都对不起自己

欢喜学安卓

android 程序员 面试 移动开发

第十一周作业

MR.X

张开怀抱迎接Golang

Kylin

读书笔记 语法 3月日更 Java转go Go 语言

基于 SparkMLlib 智能课堂教学评价系统-系统设计(三)

大数据技术指南

大数据 spark 智能时代 28天写作 3月日更

场景化面试:Kafka 为何有如此高的吞吐量和性能

面试官问

kafka 零拷贝 PageCache

「架构师训练营 4 期」 第十周 - 001&2

凯迪

架构师训练营 4 期

MySQL调优

Sakura

28天写作 3月日更

React 中 useContext 和 useMemo 一般性使用

sadhu

React useContext useMemo React Hooks

人社部拟发10几个新职业,区块链行业占两个

CECBC

区块链人才

Vue3源码 | 深入理解响应式系统下篇-effect

梁龙先森

源码分析 大前端 Vue3

【笔记】第七周 第 2 课

Geek_娴子

简述软件不可用性及解决办法

跳蚤

Flink SQL 如何实现列转行?

JasonLee实时计算

flink

散列表-hashTable

x-arts

散列函数

雄岸科技区块链布局价值待考

CECBC

区块链 科技

员工遇到问题 - 是给答案还是给引导?

石云升

项目管理 28天写作 职场经验 管理经验 3月日更

「架构师训练营 4 期」 第十一周 - 001&2

凯迪

架构师训练营 4 期

架构师是什么?

ES_her0

28天写作 3月日更

又一款Nginx 管理可视化神器!通过界面完成配置监控,一条龙!

Java小咖秀

nginx 运维 后端

安全架构学习总结

跳蚤

产品经理训练营大作业

隋泽

第10周课后练习-模块分解

潘涛

架构师训练营 4 期

MapReduce是倒退:拿它与关系数据库比较公平吗?_Java_Scott Delap_InfoQ精选文章