【AICon】探索RAG 技术在实际应用中遇到的挑战及应对策略!AICon精华内容已上线73%>>> 了解详情
写点什么

MapReduce 是倒退:拿它与关系数据库比较公平吗?

  • 2008-01-19
  • 本文字数:661 字

    阅读完需:约 2 分钟

最近 David J. DeWitt 和 Michael Stonebraker 在 the Database Column 上写了一篇文章试图将日益流行的 MapReduce 编程范式与关系数据库进行比较。该文章说道:

……作为数据处理范式,MapReduce 代表着一个巨大退步。数据库社区已经学到了如下三个经验,这些经验从 40 年前 IBM 第一次在 1968 年发布 IMS 时就已经揭示出来了……根据迄今为止的评估实验,我们严重怀疑 MapReduce 应用程序能有多大伸缩性。此外,MapReduce 的实现者应该好好学习近 25 年来的并行 DBMS 研究文献。

文章接着给罗列了如下判据:

  • MapReduce 是一个糟糕的实现(与 B-trees 相比)
  • MapReduce 不是革新
  • MapReduce 缺乏某些特性(如装载和索引)
  • MapReduce 与 DBMS 工具不兼容

博客界很快就声称这一比较及其理由都是漏洞百出的。Greg Jorgensen 进行了逐条反驳。在这些条目中,他指出 MapReduce 不是数据库,而是用于分布式处理的算法技术,不能这么比较。Jorgensen 建议更好的比较对象应该是 SimpleDB:

……作者真正想抱怨的是分布式“云”数据管理系统,如亚马逊的 SimpleDB;实际上,如果你将“MapReduce”换为“SimpleDB”,原文差不多就有意义了……

Rich Skrenta 从打破习惯的角度发表了评论:

……打破了你的习惯的东西总是有些地方看不顺眼的。功能不足,发展得也不成熟。但要是在价格上能赢 10 倍,不牢靠的廉价货最终也会胜出。想想 Linux 对阵 AT&T 的 Unix,或 mysql 对阵 Oracle……

关于这篇文章冗长的争论和评论还可以从 reddit ycombinator 上找到。

查看英文原文: MapReduce A Step Backwards: Is Comparison to Relational Databases Fair?

2008-01-19 04:381741
用户头像

发布了 150 篇内容, 共 43.1 次阅读, 收获喜欢 9 次。

关注

评论

发布
暂无评论
发现更多内容

eKuiper 1.5.0发布:实现无缝式工业数据采集+边缘流处理

EMQ映云科技

物联网 IoT emq 开源之夏 5月月更

IoT技术的最后决战!百万大奖究竟花落谁家?

华为云开发者联盟

IoT 华为云 iotda NSBD-IOT

Java Core「4」java.util.concurrent 包简介

Samson

学习笔记 5月月更 Java core

英特尔开源项目推动SYCL标准采用,打破单个厂商封闭生态系统

科技之家

Scrum实施的8个步骤

PingCode

又一国际知名律师事务所选择福昕PDF

联营汇聚

开发一个社区网站,只要20分钟?

华为云开发者联盟

ide 敏捷开发 devcloud 网站开发

没有店面店铺可以做自助洗车吗?

共享电单车厂家

自助洗车加盟 自助洗车店面

PingCAP Clinic 服务:贯穿云上云下的 TiDB 集群诊断服务

PingCAP

大数据学习必备 | 推荐几个牛X 的 github 项目,助你事半功倍

大数据梦想家

大数据 学习资料 Github'

聚焦无障碍阅读,福昕捐出2000套福昕高级PDF编辑器

联营汇聚

6月月更“粽”头戏,大家一起来参与吧!

InfoQ写作社区官方

热门活动 6月月更

平衡人工智能的性能要求,实现可信AI在银行业务场景的高质量应用

易观分析

人工智能

「v2.4」千呼万唤的图形化编排,来了!

Jianmu

持续集成 低代码 开发工具 开源项目 节点编排

末流985,秋招斩获多家大厂offer 经验分享

大数据梦想家

面经分享 大数据开发

HDFS 细粒度锁优化,FusionInsight MRS有妙招

华为云开发者联盟

hdfs NameNode 元数据 FusionInsight MRS FGL

Kube-OVN v1.10.0:新增Windows节点支持,用户自定义子网ACL等10+硬核功能

York

云原生 网络 cni

十一、云原生网络微隔离

穿过生命散发芬芳

5月月更 微隔离

数据行业中的建模是什么?

清林情报分析师

数据分析 行业分析 数据建模 业务思维 模型思维

云原生时代,热门监控工具对比与使用场景分析

云智慧AIOps社区

云原生 监控 Grafana Prometheus 监控宝

Linux 使用 cp 命令强制覆盖功能

AlwaysBeta

Linux 运维

技术立根,行业立范,发展立本:中国工业互联网的2.0新征程

脑极体

避免惊群以及负载均衡的原理与具体实现

C++后台开发

nginx 负载均衡 后端开发 C++后台开发 惊群

百度智能小程序巡检调度方案演进之路

百度Geek说

TiDB 查询优化及调优系列(四)查询执行计划的调整及优化原理

PingCAP

7 款最棒的开源 React UI 库测评 - 特别针对国内使用场景推荐

蒋川

JavaScript react.js 开源 UI 组件库

深入 HTTP/3(2)|不那么 Boring 的 SSL

SOFAStack

互联网 TLS HTTP3.0 QUIC协议 HTTP API

使用 awk 命令统计文本

程序员小航

后端 awk Linxu

企业的文档管理策略

小炮

文档管理

为什么穷人越穷,富人越富?

大数据梦想家

程序人生

前沿聚焦:2022最受关注的六大技术热词,你都知道吗?

华为云开发者联盟

零代码 NFT 数字人 元宇宙 云边端协同

MapReduce是倒退:拿它与关系数据库比较公平吗?_Java_Scott Delap_InfoQ精选文章