2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

20 个大数据必知领域之「HDFS」

  • 2020-05-29
  • 本文字数:462 字

    阅读完需:约 2 分钟

20个大数据必知领域之「HDFS」


Hadoop 分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS 是一个高度容错性的系统,适合部署在廉价的机器上。HDFS 能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS 放宽了一部分 POSIX 约束,来实现流式读取文件系统数据的目的。HDFS 在最开始是作为 Apache Nutch 搜索引擎项目的基础架构而开发的。HDFS 是 Apache Hadoop Core 项目的一部分。


HDFS 有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS 放宽了(relax)POSIX 的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。

一线实践案例


2020-05-29 11:001083

评论

发布
暂无评论
发现更多内容

灵犀平台—API的全可视化开发

鲸品堂

开发者 工具

HBase 基础及核心架构解析

五分钟学大数据

11月日更

智慧园区综合管理平台系统开发,智慧园区综合能源管理系统方案

电微13828808271

公布半小时下载量达10W:阿里大牛出品「MyCat笔记」真香

热爱java的分享家

Java 面试 编程语言 经验分享 mycat

深入理解 WKWebView(入门篇)

百度开发者中心

Webkit WKWebView

学不懂Netty?看不懂源码?不存在的,手把手带你阅读Netty源码

热爱java的分享家

Java 架构 程序人生 编程语言 经验分享

深入理解 WKWebView(入门篇)—— WebKit 源码调试与分析

百度Geek说

Webkit

恒源云(GPUSHARE)_长尾分布的多标签文本分类平衡方法(论文学习笔记)

恒源云

人工智能 深度学习 算力

太完整了!阿里内部热捧“Spring全线笔记”,不止是全家桶

热爱java的分享家

Java 面试 编程语言 springboot 经验分享

“阿里爸爸”又爆新作!Github新开源303页Spring全家桶高级笔记

热爱java的分享家

Java 面试 编程语言 经验分享 Spring全家桶

如何利用EasyRecovery恢复c盘已删文档

淋雨

数据恢复

TDSQL Server产品新特性

腾讯云数据库

数据库 tdsql

Tapdata 在线研讨会:DaaS vs 大数据平台,是竞争还是共处?

tapdata

数据库

深圳企业办理等保备案流程详细说明

行云管家

网络安全 深圳 等级保护 等保备案

观测云产品更新|新增场景笔记、监控SLO、升级场景视图、异常检测库等功能

观测云

功能更新

我以为自己MySQL够牛逼了,直到看到了Alibaba的面试题

热爱java的分享家

Java 面试 程序人生 编程语言 经验分享

【概率】抽屉中的袜子

潮汐朝夕

概率

TDSQL-C for MySQL版产品新特性

腾讯云数据库

tdsql 国产数据库

打造一个物联网平台真的工程巨大吗?

Speedoooo

容器 ios开发 APP开发 Andriod开发

CSS布局(三)之等分布局

Augus

CSS 11月日更

第二届腾讯“开悟”大赛初赛放榜,强化学习研究还能这么快乐?

科技热闻

Forrester发布首份《中国低代码平台发展报告》,有多少企业应用低代码?

J2PaaS低代码平台

敏捷开发 低代码 低代码开发 低代码平台 低代码报告

企业云资源管理系统着重推荐-行云管家!

行云管家

云计算 服务器 云资源

索信达控股:四大策略、五大行动,新趋势下数字生态的落地策略及行动路径

索信达控股

金融科技 数字化转型 数字金融 银行业 金融机构

保姆级神器 Maven,再也不用担心项目构建搞崩了

沉默王二

Java maven

一文带你快速掌握PTN网络的路由计算

鲸品堂

【可观测之路】“观测云”CSDN技术专区正式上线!

观测云

可观测 CSDN

Flink CDC 2.0 数据处理流程全面解析

大数据技术指南

11月日更

质量基础设施一站式服务平台开发,国家NQI一站式云平台搭建

电微13828808271

提升软件开发效率,企业数字化转型更轻松?

行云创新

技术 云原生 开发 数字化转型

100行代码,轻松搞定文本编辑器中草稿箱

Tom弹架构

Java 架构 设计模式

20个大数据必知领域之「HDFS」_大数据_闫佳忆_InfoQ精选文章