2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

云中巨象——作为一种服务的 Hadoop

  • 2016-05-15
  • 本文字数:698 字

    阅读完需:约 2 分钟

Ashish Thusoo, Qubole 的 CEO 和联合创始人,最近在 Enterprise Data World Conference (EDW) 谈到了作为一种服务产品的“云中巨象” Hadoop 。大数据作为服务而不是一个产品会成为一个趋势,Hadoop 作为一种服务提供,旨在帮助机构处理大规模运行的Hadoop 服务的挑战和成本。这些基于云服务的解决方案也可以从云服务的其他功能中获益,如动态配置、计算和存储的灵活性以及在多个地区的可用性。

Ashish 在开始谈论时说到,现在数据的性质,包括海里的交互数据,都是非结构化的。而不仅仅是我们长期以来传统应用程序里处理数据结构化数据。

分析的性质也发生了改变。Ashish 谈到了分析值从描述性向规范性分析的发展。

  • 描述性分析(发生了什么?)
  • 诊断性分析(为什么发生?)
  • 预测性分析(将会发生什么?)
  • 规范性分析(我们怎样才会让它发生?)

云提供很多好处,如按需和弹性扩展架构,高可扩展的对象存储和处理,和自适应的基础设施。使用云大数据平台提供更快的生产时间、敏捷和基础设施的灵活性以及显著降低成本。

Virtual Private Cloud (VPC) 提供隔离访问计算和存储,以及提供安全实践。VPC 的安全性包括云存储中的数据和网络数据,以及基于访问计算和存储的角色加密选项。

现代数据处理平台包括多个处理引擎,可以处理各种案例,如下面列举出:

  • 复杂批次处理 SQL,Hive
  • 数据科学,Spark
  • 简单交互 SQL 查询,Presto
  • 批量数据清洗(ETL),Map Reduce

Ashish 还谈论了基于云平台的大数据参考架构,包括多租户数据访问、引擎统一、云计算服务和可移植性服务等。他总结报告说,Hadoop 作为一种服务提供在大数据架构决策时是一个吸引人眼球的选择。

查看英文原文 Elephant in the Cloud - Hadoop as a Service

2016-05-15 19:002652
用户头像

发布了 43 篇内容, 共 30.0 次阅读, 收获喜欢 7 次。

关注

评论

发布
暂无评论
发现更多内容

2023年语言和框架我们值得关注什么?

阿里巴巴终端技术

框架 语言 & 开发

太强了!终于有人整理出了仿京东电商项目,再次开源了

钟奕礼

Java 编程 架构 项目 java程序员

RxJS 全面解析

PingCode研发中心

响应式编程 RXJS reactivex

极客时间架构训练营模块五作业

李晨

架构

【C语言】for 关键字

謓泽

11月月更

互联网公司网络堡垒机首选哪家品牌?有什么优势?

行云管家

互联网 网络安全 信息安全 堡垒机

Kubectl 命令总结

蜗牛也是牛

Docker发布/上传镜像到dockerhub&&下载/拉取镜像&&删除dockerhub镜像

A-刘晨阳

Docker Linux 运维 11月月更

RxJS 全面解析

阿杰

JavaScript 响应式编程 RXJS

Dragonfly 中 P2P 传输协议优化

SOFAStack

开源

Alibaba最新推出的Spring Cloud手册惨遭开源

小小怪下士

Java 程序员 阿里 SpringCloud

手慢无!清华大牛熬夜整理Spring微服务架构设计第2版文档,限时删

钟奕礼

Java 编程 架构 计算机 java程序员

比DataX快20%!SeaTunnel同步计算引擎性能测试全新发布

Apache SeaTunnel

spark DataX Seatunnel 数据集成平台 数据引擎

技术分享 | 测试人员必须掌握的测试用例

霍格沃兹测试开发学社

docker修改容器的端口、容器名、映射地址......

A-刘晨阳

Docker Linux 运维 11月月更

高可用性集群软件就选Skybility HA!优势多多!

行云管家

高可用 双机热备

Docker——denied: requested access to the resource is denied问题以及解决方法

A-刘晨阳

Docker Linux 运维 11月月更

华为云开发者日震撼来袭!11月20日,上海见!

华为云开发者联盟

开发者 华为云

制造业行业现状及智能生产管理系统一体化解决方案

优秀

制造业 生产管理系统

python小知识-python时间操作

AIWeker

Python python小知识 11月月更

想要设计一个良好的接口至少要考虑这14点!

程序员小毕

Java 编程 程序员 程序人生 java面试

这次,听人大教授讲讲分布式数据库的多级一致性|TDSQL关键技术突破

腾讯云数据库

腾讯云 tdsql 腾讯云数据库 多级一致性 中国人民大学

web技术分享| 日期选择限制组件二次封装

anyRTC开发者

Vue 前端 Web Element

全国首个AIGC创作大赛开赛,创作者可靠“AI打工人”躺赚

科技热闻

自制操作系统日记(7):字符串显示

操作系统

Kotlin函数声明与闭包

子不语Any

android kotlin 11月月更

微服务熔断限流的一些使用场景

Java永远的神

Java 程序员 微服务 程序人生 架构师

从零到一构建完整知识体系!阿里巴巴Java并发编程技术内幕全网首次公开

Java全栈架构师

源码 程序员 程序人生 Java并发 java面试

追求极致性能!RocketMQ消息通信详解

Java全栈架构师

Java 程序员 面试 RocketMQ 消息中间件

如何杜绝 spark history server ui 的未授权访问?

明哥的IT随笔

hadoop spark

OpenHarmony开发之MQTT讲解

OpenHarmony开发者

OpenHarmony

云中巨象——作为一种服务的Hadoop_服务革新_Srini Penchikala_InfoQ精选文章