写点什么

20 个大数据必知领域之「HDFS」

  • 2020-05-29
  • 本文字数:462 字

    阅读完需:约 2 分钟

20个大数据必知领域之「HDFS」


Hadoop 分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS 是一个高度容错性的系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS 放宽了一部分 POSIX 约束,来实现流式读取文件系统数据的目的。HDFS 在最开始是作为 Apache Nutch 搜索引擎项目的基础架构而开发的。HDFS 是 Apache Hadoop Core 项目的一部分。


HDFS 有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS 放宽了(relax)POSIX 的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。

一线实践案例


2020-05-29 11:001699

评论

发布
暂无评论
发现更多内容

知识经济时代,企业应该如何进行知识管理?

Baklib

知识管理

数据驱动科研,清华大学中国新型城镇化研究院使用 ModelWhale 云端协同创新平台

ModelWhale

人工智能 新基建 云平台 数据科学 学科交叉

第四次工业革命的“知识力”,流淌在百度这条创新流水线上

脑极体

应对大规模的资产扫描一些小Tips

穿过生命散发芬芳

11月月更 资产扫描

一步步带你设计MySQL索引数据结构

程序知音

Java MySQL 数据库 编程 后端技术

Spring Boot「25」外部配置元数据

Samson

Java spring 学习笔记 spring-boot 11月月更

前端食堂技术周刊第 58 期:TypeScript 4.9 RC、10 月登陆浏览器的新功能、Turbopack 真的比 Vite 快 10 倍吗?100 天 Modern CSS 挑战

童欧巴

typescript chrome

CSS学习

Studying_swz

CSS 前端 11月月更

手写vue-router核心原理

hellocoder2029

JavaScript

六大招式,修炼极狐GitLab CI/CD “快” 字诀

极狐GitLab

DevOps CI/CD 持续交付 runner 极狐GitLab

联通DataOps和MLOps:将机器学习推理作为新的数据源

Baihai IDP

人工智能 大数据 AI DataOps MLOps

Vue自定义指令(一)初识

Augus

vuejs 11月月更

python如何处理程序异常

芥末拌个饭吧

Python 11月月更

IDC MarketScape :百度安全位居NESaaS市场领导者位置

百度安全

安全 云安全

vue_Promise学习

Studying_swz

前端 11月月更

袋鼠云陈吉平:深耕国产自研数字化技术与服务,持续为客户创造价值

袋鼠云数栈

从oracle到mysql模型转换的自动化实现

鲸品堂

语言 & 开发

Java For Data Science

Mahipal_Nehra

java; data-science java client Java core Java static

HTML5学习

Studying_swz

html 前端 11月月更

Verilog语法之测试文件

芯动大师

Verilog 11月月更 测试文件

CSS学习笔记(一)

lxmoe

CSS 前端 学习笔记 11月月更

K8s 有损发布问题探究

阿里巴巴云原生

阿里云 Kubernetes 云原生

阿里云丁宇:云原生激活应用构建新范式,Serverless奇点已来

阿里巴巴云原生

阿里云 Serverless 容器 RocketMQ 云原生

一年经验年初被裁面试1月有余无果,还遭前阿里面试官狂问八股,人麻了

程序员小毕

Java spring 程序员 面试 程序人生

涛思数据杨攀:如何寻求产品、商业与技术的平衡

GGV

产品 技术 开发者 商业 SaaS

重磅|九科信息企业级超级自动化平台通过“信息系统安全等级保护三级认证”

九科Ninetech

【愚公系列】2022年11月 微信小程序-app.json配置属性之entryPagePath

愚公搬代码

11月月更

设计千万级学生管理系统的考试试卷存储方案

Geek_1264yp

技术新风口:超级App

FinFish

数字化转型 数字化 技术趋势 Gartner预测

SPL比SQL更难了还是更容易了?

石臻臻的杂货铺

sql SPL 11月月更

一步步带你设计MySQL索引数据结构

程序知音

Java MySQL 数据库 后端技术

20个大数据必知领域之「HDFS」_大数据_闫佳忆_InfoQ精选文章