写点什么

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

作者:Claudio Masolo

  • 2023-09-13
    北京
  • 本文字数:1015 字

    阅读完需:约 3 分钟

大小:549.18K时长:03:07
开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

云原生计算基金会(CNCF)最近宣布,在技术监督委员会(TOC)投票后,已接受Kubeflow,用于在Kubernetes上部署机器学习(ML)工作流的工具包,成为 CNCF 孵化项目。

 

Kubeflow 提供了一个开源的 Kubernetes 原生 MLOps 平台,用于为最流行的框架来开发和部署分布式机器学习(ML):TensorFlowPyTorchXGBoostApache MXNet等等。

 

Kubeflow 由谷歌于 2017 年创建,自 2017 年以来,该社区现拥有 150 家公司、28K+ GitHub Stars、15+ 提交者以及 15 个版本。该项目分为六个半独立的小组:

 

  • Notebooks 工作组:负责开发界面和交互式部署环境

  • 训练 Operator 小组:开发并训练 operator,以便在 Kubernetes 上进行分布式 ML 训练

  • AutoML 小组:开发了自动化模型开发软件 Katib

  • Kubeflow Pipeline 工作组:开发了将 Python ML 脚本转换为工作流模板的软件

  • Manifest 工作组:开发安装过程

  • KServe 项目:在 Kubernetes 上开发了高度可扩展的模型推理平台

 

当前 Kubeflow 的架构如下图所示:

 


Kubeflow架构

 

使用 Kubeflow 配置接口,可以指定工作流所需的 ML 工具,并且可以将其部署到各种云、本地和 on-premises 平台上,用于实验和生产。

 

TOC 赞助商 Ricardo Rocha 表示:

 

Kubernetes 环境提供了可重复性、可扩展性和快速交付,使其成为运行 AI 和 ML 计划的完美场所。Kubeflow 通过提供机器学习管道和 MLOps 来填补了这一空白,同时与其广泛的社区和其他工具及计划密切合作,以创建一个更具凝聚力的生态系统。我们很高兴看到 Kubeflow 项目在 CNCF 中的发展,并看到它在 MLOps 领域的进步。

 

云原生计算基金会为项目定义了三个成熟度级别:沙箱阶段、孵化阶段和毕业阶段。

 


项目阶段

 

每个被提议的项目都要经过一个后备(fallback)投票过程,该过程由TOC毕业标准来描述:

 

一个项目需要有高于三分之二的绝对多数赞成才能被接受为孵化或毕业。如果没有绝对多数的赞成选票来支持项目进入毕业阶段,那么任何毕业的选票都会被重新计算为项目进入孵化阶段的选票。如果没有绝对多数的选票来支持项目进入孵化阶段,那么任何毕业或孵化的选票都会被重新计算为项目进入沙箱阶段的赞成选票。如果没有足够的赞成选票来支持项目进入沙盒阶段,该项目将被拒绝。

 

云原生计算基金会(CNCF)生态系统负责人 Taylor D.在 LinkedIn 上发表了一篇专门的帖子,以庆祝 Kubeflow 作为孵化项目加入 CNCF。

 

Kubeflow 的主要替代方案是亚马逊的Sagemaker,这是由 AWS 完全管理的机器学习平台。


原文链接:

https://www.infoq.com/news/2023/08/kubeflow-cncf-project/

2023-09-13 08:005325

评论

发布
暂无评论
发现更多内容

有哪些前端面试题是面试官必考的

coder2028

JavaScript 前端

IDM下载器软件2024中文版

茶色酒

idm下载

FL Studio推出全新21中文版水果工具

茶色酒

FL Studio 21

vue实战-深入响应式数据原理

yyds2026

Vue 前端

2023前端vue面试题(边面边更)

yyds2026

Vue 前端

美团前端常考面试题(必备)

Geek_02d948

JavaScript 前端

企业IM即时通讯软件:就选安全稳定、自主可控的WorkPlus

BeeWorks

索信达宣布接入百度文心一言能力 加速推进AI在金融场景落地应用

索信达控股

即刻下载|连锁零售数字化转型难?领先企业实践助你打开新思路

Kyligence

大数据分析 指标中台

OpenCloudOS 如何利用 nettrace 进行网络故障诊断

OpenCloudOS

Linux

webpack高级配置

Geek_02d948

JavaScript 前端

美团前端经典vue面试题总结

yyds2026

Vue 前端

前端监控稳定性数据分析实践 | 得物技术

得物技术

前端 前端监控 客服业务

一文读懂NodeJs知识体系和原理浅析

coder2028

架构实战营模块二作业

null

致远互联2022年度净利9946.37万,研发投入增加;从人出发,人即流程、人即绩效

B Impact

vue实战-完全掌握Vue自定义指令

yyds2026

Vue 前端

社招中级前端笔试面试题总结

Geek_02d948

JavaScript 前端

融云「百幄」系列产品,两组套件、三类价值赋能政企八大业务场景

融云 RongCloud

产品 办公 百幄

极客时间运维进阶训练营第八周作业

忙着长大#

京东物流实时风控实践

Apache Flink

大数据 flink 实时计算

信息安全“狂飙”不止,WorkPlus为政企数字化保驾护航

BeeWorks

党政军IM私有化搭建,WorkPlus构建军工行业即时通讯安全底座

BeeWorks

面向复杂业务场景下的低代码平台组件设计与实践分享

百度开发者中心

低代码平台 amis

得物供应链复杂业务实时数仓建设之路

得物技术

数据库 大数据 技术架构

Zabbix 官方推荐的标签使用准则

北海

运维 zabbix 标签 IT运维 tag

nodejs实现jwt

coder2028

JavaScript 前端

更专业的出海服务商,融云荣膺 GTC2022 鲸鸣奖「优秀出海服务商」

融云 RongCloud

出海

从0到1,亿级消息推送的稳定性保障 | 得物技术

得物技术

稳定性 消息推送

webpack配置完全指南

Geek_02d948

JavaScript 前端

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目_机器学习/深度学习_InfoQ精选文章