【ArchSummit】如何通过AIOps推动可量化的业务价值增长和效率提升?>>> 了解详情
写点什么

Hadoop 即服务提供商 Qubole 现在运行在 Google Compute Engine 上

  • 2013-12-29
  • 本文字数:1088 字

    阅读完需:约 4 分钟

Qubole 是一家托管的 Hadoop 即服务提供商,用户现在能够在 Google Compute Engine(GCE)上使用该服务了。在这之前 Qubole 只能在 Amazon 的 AWS 上使用,在 Google 宣布对公众开放 GCE 之后不久 Qubole 就宣布了这一消息。

社区对该消息的反映大部分都是积极的,人们好像认为大数据主题会成为 GCE 潜在的杀手级应用。来自于 DataStax 的 Alex Popescu 这样写道:

如果你仔细看看这些内容,那么你将会注意到这样一个主题:覆盖来自于任意角度的数据;使用 DataStax 的 Cassandra/DSE 处理 OLTP,使用 DataTorrent 进行流处理,Qubole 用于 Hadoop,MapR 用于 Hadoop 这样的解决方案。我能够看见这种情况持续了一段时间,同时正在让 Google Compute Engine 成为 Amazon Web 服务的一个强力竞争者。

Hadoop 即服务(HaaS 也被称为云端 Hadoop)也带来了一些不同的选项:

  • 动摇你自己的部署,也就是在一个像 GCE 或者 EC2 这样的 IaaS 平台上安装 Apache Hadoop 或者一个分布式服务(例如 Cloudera、Hortonworks、MapR)。这样能够对运行的服务进行细粒度的控制,但是也带来了部署和管理上的复杂性。
  • 预打包的服务,例如 Amazon 的 EMR 或者 Savvis 的大数据服务,该服务有助于降低部署复杂性并且为已安装的服务提供中层控制。
  • 托管的 HaaS,例如 Qubole 和 Mortar ,有希望降低部署和管理的复杂性

与本地部署相比 HaaS 的关键区别在于:弹性、现货定价、计算和存储之间的分离(例如像Amazon S3 或者 Google 云存储这样的最终一致性对象存储)和增强的安全标准。像 Qubole 这样的托管 HaaS 服务往往用于开发场景,用于评估和测试、短暂运行的分析工作以及实现混合云设置。但是它们也有各自的一些限制:

  • 将数据放入云端同时再次将其从云端取出都有它们各自的价格标记。
  • 由于法律规定可能会涉及到隐私和数据保护问题,这可能会阻止或者限制用例。
  • 24/7 操作的 TCO 必须在具体分析的基础上进行计算。
  • Hadoop、Hive 等服务和最终一致性对象存储一般会存在不匹配的情况。

Ashish Thusoo 和 Joydeep Sen Sarma 在 Facebook 工作期间丰富了自己运行 Hadoop 和 Hive 的经验,在那里他们管理着一个数据基础设施团队。然后,在 2012 年 6 月,他们创建了 Qubole ,并且在 2013 年 4 月获得了 700 万美元的 A 轮融资。Joydeep 深入介绍了他们在实现自己的 HaaS 服务时所面对的挑战,同时在他的 Hive London Meetup 谈话“云友好的Hadoop 和Hive ”中还对内部原理做了讲解。另外,Christian Prokopp (Rangespan 的数据科学家) 最近还写了一个详细的纲要以及Qubole 与EMR 之间的对比。

查看英文原文: Hadoop-as-a-Service Provider Qubole Now Runs on Google Compute Engine

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2013-12-29 22:151387
用户头像

发布了 321 篇内容, 共 116.1 次阅读, 收获喜欢 18 次。

关注

评论

发布
暂无评论
发现更多内容

Python 疑难问题:[] 与 list() 哪个快?为什么快?快多少呢?

Python猫

Python 学习 编程 程序员

Underlay网络:如何立住可靠又支持大规模无收敛的“人设”

华为云开发者联盟

云服务 交换机

4年Java经验,备战两月成功拿到美团、京东、字节offer

Java架构之路

Java 程序员 面试 编程语言

详细分析定制企业应用的价格

Philips

敏捷开发 快速开发

Kubeless 函数部署遇到了问题,如何 Debug? | 玩转 Kubeless

donghui

Serverless kubeless

惊险的B站Java后端岗面试之旅,复盘面试经历及面试真题

Java架构之路

Java 程序员 面试 编程语言

手把手带你玩转 openEuler | 如何安装 openEuler

openEuler

Linux 开源 操作系统 openEuler

解释一下==和equals的区别,你以为就这么简单?那你就草率了

小Q

Java 学习 架构 面试 基础

面向对象编程会被抛弃吗?这五大问题不容忽视

Java架构师迁哥

UBBF2020:智能联接,共创行业价值新增长

DT极客

腾讯技术官又曝神作,两份堪称‘千古绝唱’操作系统笔记现已被全网疯传

编程 操作系统 计算机

Anaconda安装使用和akshare库使用

MySQL从删库到跑路

Python 数据分析 Windows 10 Anaconda akshare

2020年第三季度《全国移动App 风险监测评估报告》

InfoQ_11eaedef67e9

App 移动安全 个人隐私安全

月薪60k的Java开发在阿里是什么级别?对技术能力有哪些要求?

Java架构之路

Java 阿里巴巴 程序员 面试 编程语言

教育场景方案升级| 打通业务前后端,少量开发快速上线(一):互动小班

ZEGO即构

在线教育 低代码

BATJ内部Java求职面试宝典,尤其应届生如果还没有学过那后悔去吧,也许你已经错过N多家大厂offer;

Java架构师迁哥

详细讲解:python中的lambda与sorted函数

计算机与AI

Python

图解 K8S 源码 - QoS 篇

郭旭东

Kubernetes Kubernetes源码

推荐一款MySQL开源客户端,免费+跨平台+使用便捷!

王磊

MySQL

netfilter/iptables 原理

为为

Service Mesh Linux Kenel

甲方日常 30

句子

工作 随笔杂谈 日常 心情

【全球案例】ESL 游戏公司如何通过 Jira 定制化解决方案连接全球团队

Atlassian

项目管理 敏捷 Atlassian Jira

vidyo在数字化办公中提供了什么便利?

dwqcmo

音视频 集成架构 解决方案 智能硬件

极客时间架构师培训 1 期 - 第 4 周总结

Kaven

随机森林原理介绍与适用情况(综述篇)

计算机与AI

数据挖掘 学习 数据科学 随机森林

远程触发Jenkins的Pipeline任务的并发问题处理

小Q

Java 学习 编程 架构 并发

「红黑树」背了又忘?深入本质,他也不过是一棵二叉树

小松漫步

容器技术为什么会这么流行

架构师修行之路

Docker 容器 分布式 微服务

打通Docker镜像发布容器运行流程

架构师修行之路

Docker 容器 分布式 微服务

技术心得丨一种有效攻击BERT等模型的方法

华为云开发者联盟

学习 AI

Tensorflow2.0安装使用

MySQL从删库到跑路

人工智能 tensorflow Anaconda Jupyter Notebook

Hadoop即服务提供商Qubole现在运行在Google Compute Engine上_DevOps & 平台工程_Michael Hausenblas_InfoQ精选文章