Hadoop

收录了Hadoop频道下的 58 篇内容
Hadoop生态系统经过多年的发展,俨然已经成为大数据平台的事实标准。
  • 全部
  • 文章
  • 迷你书
迁移了几十家企业之后,我们总结了如何在云中构建成功的现代数据分析平台
迁移了几十家企业之后,我们总结了如何在云中构建成功的现代数据分析平台

这样一套强大的数据平台已经成为企业所不可或缺的数字化与 AI 转型基础。

Hadoop or TDengine,如何做物联网大数据平台的选型?
Hadoop or TDengine,如何做物联网大数据平台的选型?

本文介绍物联网大数据处理中可能遇到的问题,分析 TDengine、InfluxDB、ClickHouse、Hadoop、MySQL 等系统在处理时序数据时的优缺点。

怎样用Hadoop保护大数据?
怎样用 Hadoop 保护大数据?

通过本文,你可以了解 Hadoop 如何通过网络安全的方法来保护大数据。

深度分析数据科学流水线和Hadoop生态系统
深度分析数据科学流水线和 Hadoop 生态系统

数据科学流水线是一种教学模型,用于教授对数据进行全面统计分析所需的工作流。

如何使用Hadoop构建大规模数据产品?
如何使用 Hadoop 构建大规模数据产品?

大多数数据科学家会采用典型的分析工作流:采集 → 整理 → 建模 → 报告和可视化。然而,这种所谓的数据科学流水线完全由人力驱动,再辅以脚本语言(如 R 和 Python)的使用。流水线的每一个环节都需要人类的知识和分析技能,意在产生独特且不可泛化的结果。

Hadoop迎来3.x时代,昔日大数据霸主如何应对云计算挑战?
Hadoop 迎来 3.x 时代,昔日大数据霸主如何应对云计算挑战?

本文将按照存储和计算两个方向,分别介绍 Hadoop 社区当前的热点话题及后续规划。

除了实时性,你还应该关注的三个数据科学改进方向
除了实时性,你还应该关注的三个数据科学改进方向

近来,我一直在思考过去几年当中我们在数据工程方面取得的进展,以及这个领域接下来的发展方向。