时隔16年JeffBarr重返10.23-25 QCon上海站,带你看透AI如何重塑软件开发! 了解详情
写点什么

20 个大数据必知领域之「HDFS」

  • 2020-05-29
  • 本文字数:462 字

    阅读完需:约 2 分钟

20个大数据必知领域之「HDFS」


Hadoop 分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS 是一个高度容错性的系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS 放宽了一部分 POSIX 约束,来实现流式读取文件系统数据的目的。HDFS 在最开始是作为 Apache Nutch 搜索引擎项目的基础架构而开发的。HDFS 是 Apache Hadoop Core 项目的一部分。


HDFS 有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS 放宽了(relax)POSIX 的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。

一线实践案例


2020-05-29 11:001526

评论

发布
暂无评论
发现更多内容

双非渣硕的我是如何拿到字节跳动研发岗SP

阿霜

c++ 字节跳动 互联网 计算机 校园招聘

C++后台开发必看,这个学习路线必须收藏

赖猫

c++ Linux 后台开发 服务器开发

能进BAT、TMD的C++学习过程大分享

阿霜

c++ 字节跳动 计算机 BATJMD

第八章作业

流浪猫

第八章作业 - 用户路径

Au revoir

计算机组成原理--主存储器

风骨散人

作业 - 第九周

eva

如何判断自己是否适合当前公司?

石云升

离职 28天写作 职场经验 3月日更

【Axure9百例NO.46】中继器多条件判断的优雅处理

zhuchuanming

原型设计 Axure 交互原型

『C++』我想学C++,C++太难了,那我想入门,给我10分钟我带你入门

风骨散人

华为与开发者的“情谊”,在HDC.Cloud 2021上书写智能时代新篇

脑极体

墨迹天气成长中心页用户路径分析(模拟)

🙈🙈🙈

极客大学产品经理训练营

一份百投百中的计算机校招简历是如何迭代足足26版的?

阿霜

c++ 字节跳动 计算机 简历 校招

软件工程是否可以指导小团队的建设

风翱

软件工程 3月日更

互联网HR黑话指南

这就是编程

再推荐一款小众且好用的 Python 爬虫库 - MechanicalSoup

星安果

Python 自动化 爬虫 MechanicalSoup 小众

ARTS-Week-0

绝影

ARTS 打卡计划 ARTS活动

产品经理训练营 - 第八章作业

joelhy

产品经理训练营

[老孟Flutter] Stateful 组件的生命周期

老孟Flutter

flutter

Flutter 中与平台相关的生命周期

老孟Flutter

flutter

推荐几本 Go 相关书籍

roseduan

书籍推荐 Go Concurrency Patterns Go web 书籍 Go 语言

文档是给未来自己的珍贵礼物

steve_lee

文档

操作系统--死锁避免(银行家算法)

风骨散人

银行家算法

数据分析(第八章作业)

Deborah

产品 0 期 - 第九周作业

vipyinzhiwei

如何提高Flutter应用程序的性能

老孟Flutter

flutter

产品经理面试常见问题总结 3

lenka

3月日更

『计算机组成原理』 计算机系统概述(考研、面试必备)

风骨散人

JavaEE知识体系梳理

空城机

Java Java介绍 Java EE 大学作业

Python救救我!如何连接串口实现一个报警灯报警器

ucsheep

Python websocket 串口 报警器 报警灯

图论--网络流最大流问题

风骨散人

20个大数据必知领域之「HDFS」_大数据_闫佳忆_InfoQ精选文章