2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

20 个大数据必知领域之「Hive」

  • 2020-05-29
  • 本文字数:280 字

    阅读完需:约 1 分钟

20个大数据必知领域之「Hive」


Hive 是基于 Hadoop 的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。hive 数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供 SQL 查询功能,能将 SQL 语句转变成 MapReduce 任务来执行。Hive 的优点是学习成本低,可以通过类似 SQL 语句实现快速 MapReduce 统计,使 MapReduce 变得更加简单,而不必开发专门的 MapReduce 应用程序。hive 是十分适合数据仓库的统计分析和 Windows 注册表文件。

一线实践案例


2020-05-29 09:001568

评论

发布
暂无评论
发现更多内容

小游戏如何应对大流量?Shopee Shake 的大促实践

Shopee技术团队

后端 高并发 游戏 电商大促 Shopee

开放原子全球开发者峰会「开源治理」论坛预告(更新中)

开放原子开源基金会

MYSQL离线迁移至分布式TDSQL

腾讯云数据库

数据库 tdsql

TDSQL 全时态数据库系统 -- 典型案例

腾讯云数据库

数据库 tdsql

分布式TDSQL的实践

腾讯云数据库

数据库 tdsql

数字化转型的终局:赛博朋克?社会主义?

龙归科技

数字化 软件系统 软件经济 赛博朋克

酷家乐 UI 自动化测试平台实践

CPPAlien

测试框架 selenium BDD UI测试 活文档

马某兵VIP资料惨遭泄露,Java大厂面试手册,21年高频题版

Java架构师迁哥

张宏江出席HICOOL 2021全球创业者峰会,阐述AI研究与创业新机遇

硬科技星球

人工智能 大模型时代 悟道2.0

Tensorflow保存神经网络参数有妙招:Saver和Restore

华为云开发者联盟

神经网络 tensorflow 变量 Saver Restore

统信软件张磊:国产操作系统如何获得大众市场的认可?

Jessie

开源 最佳实践 新基建 企业动态 文化 & 方法

简化IT运维工作,就要学会使用自动化运维工具!

行云管家

运维 云服务 IT运维

「TEG+系列」破局者 - 腾讯金融级数据库TDSQL

腾讯云数据库

数据库 tdsql

GraphQL 快速入门【2】环境设置

码语者

Rest graphql

SpringBoot 如何进行对象复制,老鸟们都这么玩的

Java 架构 后端 计算机 框架

华为云GaussDB:发挥生态优势,培养应用型DBA

华为云开发者联盟

数据库 开源 GaussDB 云数据库 dba

TDSQL金融级特性之:数据强一致性保障

腾讯云数据库

数据库 tdsql

常见的安全应用识别技术有哪些?

郑州埃文科技

明道云在工程项目行业中的应用场景

明道云

TDSQL核心架构

腾讯云数据库

数据库 tdsql

吊打面试官必备-阿里内部性能优化实战手册

Java架构师迁哥

鲲鹏展翅|SphereEx 获华为鲲鹏技术认证

SphereEx

云资源生命周期管理怎么做?用什么软件好?

行云管家

云计算 云服务 云资源 生命周期管理

TDSQL数据同步和备份

腾讯云数据库

数据库 tdsql

淘宝网 Java 千亿级并发系统架构设计笔记(全彩版小册开源)

Java 架构 面试 后端 高并发

快速提升Golang编程能力:那就一起用Go做项目吧

博文视点Broadview

TDSQL inside之路

腾讯云数据库

数据库 tdsql

TDSQL是什么:腾讯如何打造一款金融级分布式数据库

腾讯云数据库

数据库 tdsql

华为云与北大BIOPIC联合发布蛋白质多序列比对开源数据集

华为云开发者联盟

AI 华为云 蛋白质 多序列 开源数据集

TDSQL核心特性:极具挑战的“四高”服务与安全可运维

腾讯云数据库

数据库 tdsql

代理服务器转发消息时的相关头部(qbit)

qbit

正向代理与反向代理 Proxy

20个大数据必知领域之「Hive」_大数据_闫佳忆_InfoQ精选文章