NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

Cloudera 果然向云出手了!新机器学习服务采用云原生路径!

  • 2018-12-24
  • 本文字数:1157 字

    阅读完需:约 4 分钟

Cloudera果然向云出手了!新机器学习服务采用云原生路径!

今年 10 月份,Cloudera 宣布与 Hortonworks 合并,这两家 Hadoop 领域的头部厂商为了抗住主流云供应商亚马逊、微软和谷歌的压力不得不走到一起,根据当时的报道,双方之后会将重心转移到云上。在预计与 Hortonworks 合并之前的最后一份季度报告中,Cloudera 终于向云平台出手,公开 DSW 的全新云原生预览版并附带原生机器学习服务 Cloudera ML,这是 Cloudera 的首个百分百 Kubernetes 产品。


Cloudera 认为市场的一个重要趋势是迁移到云端,虽然只有大约 25-30%的 Cloudera 基础服务在云中运行工作负载,但云采用的趋势是明确无误的。Ovum 预测,明年将有一半新大数据服务在云上运行;第二个趋势是 AI,更具体地说是机器学习。Cloudera 最初发布 DSW 就是为了构建、更改和部署数据科学模型,只是最初的 DSW 没有云端版本。


传统意义上,机器学习服务通常运行在 Hadoop 之上,但 Apache Hadoop 社区已着手将 Hadoop 与 HDFS 分离,以便云对象存储也可成为一流公民。由于 Hadoop 不再是运行大数据或机器学习的唯一场所,所以 Cloudera ML 无论是在 Kubernetes 集群、本地还是公有云上运行都可以。


考虑到 Databricks(适用于 Spark),Amazon SageMaker,Azure 机器学习和 Google Cloud AutoML 等服务早已大规模推广,Cloudera 现在推出该服务也是有些晚。Cloudera ML 通过基于 Kubernetes 的新架构运行,该架构绕过了内部部署 Hadoop 集群时的资源调度工具 Yarn。需要说明的是,这并不能取代在 Hadoop 和 YARN 上运行现有 DSW 的方式,只是提供了另一个在 Kubernetes 环境中运行的版本。


这不是 Cloudera 第一次支持数据科学或 ML 工作的容器,通过使用容器,Cloudera 可以打包物理部署所需的相互依赖性。鉴于最初的 DSW 针对运行 Hadoop 集群的用户,因此云原生版本同样如此,其实在 YARN 上运行 Spark 也可适应相同的部署,但随着 Kubernetes 成为云原生计算的事实标准,如果 Cloudera 真的想向云下手必须接受 Kubernetes,而不是 Yarn。


Cloudera ML 目前处于有限的预览状态,且不对所有人开放预览版本,支持访问云对象存储、HDFS 和外部数据库中的数据,部署在公有云中或最终通过 OpenShift 部署在私有云中均可。


显然,Cloudera 还将继续支持内部部署的大数据服务,毕竟这是当前服务的核心。作为一个向云计算扩展的内部部署供应商,Cloudera 将通过类似的混合支持开始,并逐渐向云平台过渡。支持混合就意味着添加云原生选项,数据仓库等其他工作也可能从运行 Kubernetes 集群中受益。


这就不禁激起用户对 Hadoop 问题的讨论,其实 Apache 社区也在努力让 Hadoop 平台更加适合云平台,从分离存储到容纳容器化工作负载,这些都需要一定时间才可以完成。一旦你用云对象存储替代 HDFS,用 Spark 替换 MapReduce,也没有什么是无法在云平台上运行的,这就是云对多种类型工作负载的管理和支持。


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-12-24 09:391713
用户头像
赵钰莹 InfoQ 主编

发布了 875 篇内容, 共 606.1 次阅读, 收获喜欢 2671 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

北大&腾讯打造多模态15边形战士!语言作“纽带”,拳打脚踢各模态,超越Imagebind

Openlab_cosmoplat

情感语音识别的技术挑战与解决方案

来自四九城儿

Last Week in Milvus

Zilliz

Milvus Zilliz 向量数据库

情感语音识别在人机交互中的应用与挑战

来自四九城儿

OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?

Zilliz

openai 向量数据库 ChatGPT zillizcloud rag

软件测试|教你拿捏Python运算符(二)

霍格沃兹测试开发学社

【2023云栖】黄博远:阿里云人工智能平台PAI年度发布

阿里云大数据AI技术

人工智能

Redis 桌面管理器:Redis Desktop Manager for Mac激活版下载

iMac小白

软件测试/测试开发丨接口自动化测试,接口鉴权的多种方式

测试人

软件测试

中国唯一!华为入选Gartner®企业低代码应用平台魔力象限

华为云PaaS服务小智

云计算 低代码 华为云

item_review-获得淘宝商品评论api接口步骤

技术冰糖葫芦

API 文档

JNPF低代码,发挥软件定制的威力

互联网工科生

软件开发 低代码 开发平台 JNPF

LTV预测算法从开发到上线,浅谈基于奇点云DataSimba的MLOps实践

奇点云

算法 奇点云 数据研发

软件测试/测试开发丨接口自动化测试学习笔记,加密与解密

测试人

软件测试

Sketch for mac(矢量绘图软件) 99.1永久激活版

mac

Sketch 苹果mac Windows软件 矢量编辑工具

软件测试|数据可视化神器——pyecharts教程(五)

霍格沃兹测试开发学社

MacOS虚拟定位工具AnyGo永久激活版下载

iMac小白

item_get_app-获得淘宝app商品详情原数据api接口的步骤

技术冰糖葫芦

API 文档

Mosaic for Mac(mac多窗口整理) v1.4永久激活版

mac

窗口管理工具 苹果mac Windows软件 MosAIc

百度搜索智能化算力调控分配方法

百度Geek说

人工智能 深度学习 算法 企业号11月PK榜

docker上安装的jenkins容器内访问不了外网

伤感汤姆布利柏

代码安全之代码混淆及加固(Android)🔒

软件测试|教你拿捏Python运算符(一)

霍格沃兹测试开发学社

软件测试| 教你拿捏Python运算符(三)

霍格沃兹测试开发学社

Bartender for mac(菜单栏图标管理软件) 5.0.44激活版

iMac小白

腾讯云大数据流计算 Oceanus 在 MySQL CDC Connector 的核心优化

腾讯云大数据

流计算 Oceanus

特权账号管理之风险检测

尚思卓越

网络安全 特权账号 风险检测

情感语音识别技术的现状与未来

来自四九城儿

软件测试/测试开发丨接口自动化测试学习笔记,数据库操作与断言

测试人

软件测试

DeFi和NFT融合:去中心化金融的新领域

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

区域巡查二维码系统:扫码记录巡查结果,异常情况及时上报

草料二维码

二维码 知识分享 二维码生成 草料二维码 区域巡查

Cloudera果然向云出手了!新机器学习服务采用云原生路径!_服务革新_赵钰莹_InfoQ精选文章