写点什么

20 个大数据必知领域之「Hive」

  • 2020-05-29
  • 本文字数:280 字

    阅读完需:约 1 分钟

20个大数据必知领域之「Hive」


Hive 是基于 Hadoop 的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。hive 数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供 SQL 查询功能,能将 SQL 语句转变成 MapReduce 任务来执行。Hive 的优点是学习成本低,可以通过类似 SQL 语句实现快速 MapReduce 统计,使 MapReduce 变得更加简单,而不必开发专门的 MapReduce 应用程序。hive 是十分适合数据仓库的统计分析和 Windows 注册表文件。

一线实践案例


2020-05-29 09:001410

评论

发布
暂无评论
发现更多内容

用户密码验证函数

任小龙

java安全编码指南之:拒绝Denial of Service

程序那些事

Java 安全编码指南 java安全编码 DOS攻击 zip炸弹

架构师训练营 Week 11 总结

Wancho

系统稳定高可用的方案以及用户密码验证函数

Acker飏

极客大学架构师训练营 0 期 week 11 学习笔记

chun1123

安全 高可用系统的架构

架构师训练营第 0 期第 11 周作业

无名氏

高可用的系统架构

莫莫大人

极客大学架构师训练营

Week 11 作业

鱼_XueTr

Flink算子状态-9

小知识点

scala 大数据 flink

用户密码验证函数

周冬辉

加密

Apache Pulsar 社区周报:08-15 ~ 08-21

Apache Pulsar

云原生 Apache Pulsar 消息系统 消息中间件

第十一周命题作业

菲尼克斯

安全架构和高可用系统的架构

周冬辉

高可用系统的架构

第十一周学习总结

菲尼克斯

云上度假村木莲庄酒店助你远离城市的喧嚣

InfoQ_967a83c6d0d7

极客时间架构师训练营 - week11 - 作业 2

jjn0703

极客大学架构师训练营

系统不可用的原因和解决方案

极客李

Week11总结

熊威

架构师训练营 第十一周 作业

CR

【高并发】高并发秒杀系统架构解密,不是所有的秒杀都是秒杀!

冰河

高并发 分布式限流 秒杀系统 异步削峰 签约计划第二季

架构师训练营 - 第 11 周作业

Jam

Week 11命题作业

Jeremy

架构师训练营 Week 11 作业

Wancho

etcd的高可用

李小匪

Newbe.Claptrap 框架入门,第四步 —— 利用 Minion,商品下单

newbe36524

云计算 微服务 dock .net core ASP.NET Core

【华为云数据库技术大公开】机房失火后,还能拯救你的数据吗?

华为云开发者联盟

数据库 机房 华为云 数据存储 云数据库

奈学:Executor线程池的概述

奈学教育

线程池 Executor

极客大学架构师训练营 0 期 week 11 作业

chun1123

高可用 密码校验

架构师训练营 第十一周 总结

CR

Week11作业1

熊威

漫画解读:唐僧师徒如何帮助大唐官网打造CDN+OSS完美架构?

阿里云Edge Plus

20个大数据必知领域之「Hive」_大数据_闫佳忆_InfoQ精选文章