写点什么

Cloudera 果然向云出手了!新机器学习服务采用云原生路径!

  • 2018-12-24
  • 本文字数:1157 字

    阅读完需:约 4 分钟

Cloudera果然向云出手了!新机器学习服务采用云原生路径!

今年 10 月份,Cloudera 宣布与 Hortonworks 合并,这两家 Hadoop 领域的头部厂商为了抗住主流云供应商亚马逊、微软和谷歌的压力不得不走到一起,根据当时的报道,双方之后会将重心转移到云上。在预计与 Hortonworks 合并之前的最后一份季度报告中,Cloudera 终于向云平台出手,公开 DSW 的全新云原生预览版并附带原生机器学习服务 Cloudera ML,这是 Cloudera 的首个百分百 Kubernetes 产品。


Cloudera 认为市场的一个重要趋势是迁移到云端,虽然只有大约 25-30%的 Cloudera 基础服务在云中运行工作负载,但云采用的趋势是明确无误的。Ovum 预测,明年将有一半新大数据服务在云上运行;第二个趋势是 AI,更具体地说是机器学习。Cloudera 最初发布 DSW 就是为了构建、更改和部署数据科学模型,只是最初的 DSW 没有云端版本。


传统意义上,机器学习服务通常运行在 Hadoop 之上,但 Apache Hadoop 社区已着手将 Hadoop 与 HDFS 分离,以便云对象存储也可成为一流公民。由于 Hadoop 不再是运行大数据或机器学习的唯一场所,所以 Cloudera ML 无论是在 Kubernetes 集群、本地还是公有云上运行都可以。


考虑到 Databricks(适用于 Spark),Amazon SageMaker,Azure 机器学习和 Google Cloud AutoML 等服务早已大规模推广,Cloudera 现在推出该服务也是有些晚。Cloudera ML 通过基于 Kubernetes 的新架构运行,该架构绕过了内部部署 Hadoop 集群时的资源调度工具 Yarn。需要说明的是,这并不能取代在 Hadoop 和 YARN 上运行现有 DSW 的方式,只是提供了另一个在 Kubernetes 环境中运行的版本。


这不是 Cloudera 第一次支持数据科学或 ML 工作的容器,通过使用容器,Cloudera 可以打包物理部署所需的相互依赖性。鉴于最初的 DSW 针对运行 Hadoop 集群的用户,因此云原生版本同样如此,其实在 YARN 上运行 Spark 也可适应相同的部署,但随着 Kubernetes 成为云原生计算的事实标准,如果 Cloudera 真的想向云下手必须接受 Kubernetes,而不是 Yarn。


Cloudera ML 目前处于有限的预览状态,且不对所有人开放预览版本,支持访问云对象存储、HDFS 和外部数据库中的数据,部署在公有云中或最终通过 OpenShift 部署在私有云中均可。


显然,Cloudera 还将继续支持内部部署的大数据服务,毕竟这是当前服务的核心。作为一个向云计算扩展的内部部署供应商,Cloudera 将通过类似的混合支持开始,并逐渐向云平台过渡。支持混合就意味着添加云原生选项,数据仓库等其他工作也可能从运行 Kubernetes 集群中受益。


这就不禁激起用户对 Hadoop 问题的讨论,其实 Apache 社区也在努力让 Hadoop 平台更加适合云平台,从分离存储到容纳容器化工作负载,这些都需要一定时间才可以完成。一旦你用云对象存储替代 HDFS,用 Spark 替换 MapReduce,也没有什么是无法在云平台上运行的,这就是云对多种类型工作负载的管理和支持。


2018-12-24 09:391800
用户头像
赵钰莹 InfoQ 主编

发布了 882 篇内容, 共 644.3 次阅读, 收获喜欢 2679 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

Django组队学习Task0

IT蜗壳-Tango

IT蜗壳教学 6月日更 Datawhale

给dubbo贡献源码,做梦都在修bug

捉虫大师

dubbo

并发王者课-黄金1:两败俱伤-互不相让的线程如何导致了死锁僵局

MetaThoughts

Java 多线程 并发

马丁策略量化交易系统搭建,网格量化策略系统

GitHub已霸榜!阿里技术官肝了3个月才完成的20万字Java面试手册

Java 程序员 架构 面试

Windows 使用 PowerShell 来管理另外一台 Windows 机器

HoneyMoose

图解 SQL,这也太形象了吧!

xcbeyond

MySQL 6月日更

Python——列表元素的排序

在即

6月日更

小型电商微服务架构拆分

Simon

架构实战营

Java Shutdown Hook 场景使用和源码分析

陈皮的JavaLib

Java 线程安全 Thread

系统设计系列之任务队列

看山

MQ 6月日更

【Flutter 专题】106 图解 AnimatedWidget & AnimatedBuilder 动画应用

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 6月日更

读深入ES6记[五]

蛋先生DX

ES6 6月日更

kubelet分析-pvc扩容源码分析

良凯尔

Kubernetes 源码分析 kubelet Ceph CSI

深入SpringBoot的异常处理(一)

卢卡多多

异常 SpringBoot 2 全局异常 6月日更

2021年最新阿里巴巴Java面试权威指南(泰山版)震撼来袭

Java 程序员 架构 面试 计算机

颠覆与创新,区块链将成音乐产业的下一个风口

CECBC

Windows PowerShell ISE 是什么和 PowerShell 有什么区别

HoneyMoose

三步教你编写一个Neumorphism风格的小时钟

空城机

JavaScript Vue 大前端 6月日更

职场礼仪之坐车礼仪

石云升

6月日更 职场礼仪

NQI国家质量基础设施“一站式”公共服务平台开发建设

源中瑞-龙先生

开发 NQI 质量基础设施“一站式”

Kubernetes手记(9)- Ingress 控制器

雪雷

k8s 6月日更

🌏【架构师指南】带你分析认识缓存穿透/雪崩/击穿

洛神灬殇

缓存穿透 缓存击穿 缓存雪崩 6月日更

JAVA对象直接输出的打印结果是什么?

加百利

Java 后端 字符串 6月日更

区块链行业的《高考志愿填报指南》

CECBC

22 图 |M1 和 Docker 谈了个恋爱

悟空聊架构

Mac M M1 Dock 6月日更 dokcer

如何拆分大型单体系统为微服务

Zhang

微服务

🌏【架构师指南】教你如何设计和规划系统架构(13条)

洛神灬殇

架构设计 架构设计原则 架构师技能 6月日更

网络攻防学习笔记 Day42

穿过生命散发芬芳

网络攻防 6月日更

栈和队列没想象中那么难

北游学Java

Java 数据结构 队列

金三银四跳槽季,美团、字节、阿里、腾讯Java面经,终入字节

Java 程序员 架构 面试

Cloudera果然向云出手了!新机器学习服务采用云原生路径!_服务革新_赵钰莹_InfoQ精选文章