文章:分布式计算开源框架 Hadoop 介绍

阅读数:529 2008 年 8 月 4 日

话题:JavaDevOps语言 & 开发架构

Hadoop 是 Apache 开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook 和 Yahoo 等等。本文是 Hadoop 入门实践三部曲的第一部,主要讲述了 What 和 Why 的问题。

什么是 Hadoop 呢?

Hadoop 框架中最核心的设计就是:MapReduce 和 HDFS。MapReduce 的思想是由 Google 的一篇论文所提及而被广为流传的,简单的 一句话解释 MapReduce 就是“任务的分解与结果的汇总”。HDFS 是 Hadoop 分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。

为什么要使用 Hadoop 呢?

1、可扩展:不论是存储的可扩展还是计算的可扩展都是 Hadoop 的设计根本。

2、经济:框架可以运行在任何普通的 PC 上。

......

......

详细内容,请阅读全文分布式计算开源框架 Hadoop 介绍


作者介绍:岑文初,就职于阿里软件公司研发中心平台一部,任架构师。当前主要工作涉及阿里软件开发平台服务框架(ASF)设计与实现,服务集成平台(SIP)设计与实现。没有什么擅长或者精通,工作到现在唯一提升的就是学习能力和速度。个人 Blog 为:http://blog.csdn.net/cenwenchu79

参与 InfoQ 中文站内容建设,请邮件至editors@cn.infoq.com。也欢迎大家到InfoQ 中文站用户讨论组参与我们的线上讨论。