2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

作者:Claudio Masolo

  • 2023-09-13
    北京
  • 本文字数:1015 字

    阅读完需:约 3 分钟

大小:549.18K时长:03:07
开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

云原生计算基金会(CNCF)最近宣布,在技术监督委员会(TOC)投票后,已接受Kubeflow,用于在Kubernetes上部署机器学习(ML)工作流的工具包,成为 CNCF 孵化项目。

 

Kubeflow 提供了一个开源的 Kubernetes 原生 MLOps 平台,用于为最流行的框架来开发和部署分布式机器学习(ML):TensorFlowPyTorchXGBoostApache MXNet等等。

 

Kubeflow 由谷歌于 2017 年创建,自 2017 年以来,该社区现拥有 150 家公司、28K+ GitHub Stars、15+ 提交者以及 15 个版本。该项目分为六个半独立的小组:

 

  • Notebooks 工作组:负责开发界面和交互式部署环境

  • 训练 Operator 小组:开发并训练 operator,以便在 Kubernetes 上进行分布式 ML 训练

  • AutoML 小组:开发了自动化模型开发软件 Katib

  • Kubeflow Pipeline 工作组:开发了将 Python ML 脚本转换为工作流模板的软件

  • Manifest 工作组:开发安装过程

  • KServe 项目:在 Kubernetes 上开发了高度可扩展的模型推理平台

 

当前 Kubeflow 的架构如下图所示:

 


Kubeflow架构

 

使用 Kubeflow 配置接口,可以指定工作流所需的 ML 工具,并且可以将其部署到各种云、本地和 on-premises 平台上,用于实验和生产。

 

TOC 赞助商 Ricardo Rocha 表示:

 

Kubernetes 环境提供了可重复性、可扩展性和快速交付,使其成为运行 AI 和 ML 计划的完美场所。Kubeflow 通过提供机器学习管道和 MLOps 来填补了这一空白,同时与其广泛的社区和其他工具及计划密切合作,以创建一个更具凝聚力的生态系统。我们很高兴看到 Kubeflow 项目在 CNCF 中的发展,并看到它在 MLOps 领域的进步。

 

云原生计算基金会为项目定义了三个成熟度级别:沙箱阶段、孵化阶段和毕业阶段。

 


项目阶段

 

每个被提议的项目都要经过一个后备(fallback)投票过程,该过程由TOC毕业标准来描述:

 

一个项目需要有高于三分之二的绝对多数赞成才能被接受为孵化或毕业。如果没有绝对多数的赞成选票来支持项目进入毕业阶段,那么任何毕业的选票都会被重新计算为项目进入孵化阶段的选票。如果没有绝对多数的选票来支持项目进入孵化阶段,那么任何毕业或孵化的选票都会被重新计算为项目进入沙箱阶段的赞成选票。如果没有足够的赞成选票来支持项目进入沙盒阶段,该项目将被拒绝。

 

云原生计算基金会(CNCF)生态系统负责人 Taylor D.在 LinkedIn 上发表了一篇专门的帖子,以庆祝 Kubeflow 作为孵化项目加入 CNCF。

 

Kubeflow 的主要替代方案是亚马逊的Sagemaker,这是由 AWS 完全管理的机器学习平台。


原文链接:

https://www.infoq.com/news/2023/08/kubeflow-cncf-project/

2023-09-13 08:005383

评论

发布
暂无评论
发现更多内容

如何避免写重复代码:善用抽象和组合

阿里技术

Java 代码实战

Spring Boot实现第一次启动时自动初始化数据库

Java spring Spring Boot

全国流体力学盛会召开,飞桨AI4S携最新科研进展亮相西湖大学

飞桨PaddlePaddle

人工智能 百度飞桨 科学计算

辅助测试和研发人员的一款小插件【数据安全】 | 京东云技术团队

京东科技开发者

浏览器 数据安全 插件开发 企业号 5 月 PK 榜

一次错误的解码处理导致Netty堆外内存泄漏问题的分析

Java你猿哥

Java Netty ssm RSS 逻辑

500行代码手写docker-实现硬件资源限制cgroups

蓝胖子的编程梦

容器 k8s ,docker Cgroups #k8s

大语言模型技术原理

NineData

AIGC ChatGPT AI大语言模型 大语言模型 技术原理

Kafka集群是如何选择leader,你知道吗?

Java kafka 集群

Flutter三棵树系列之BuildOwner | 京东云技术团队

京东科技开发者

flutter 移动开发 源码解读 企业号 5 月 PK 榜 BuildOwner

如何科学地利用MTTR优化软件交付流程?

SEAL安全

DevOps MTTR 企业号 5 月 PK 榜

Health Kit文档大变样,一起尝鲜!

HarmonyOS SDK

HMS Core

从7天到1天,Kyligence 和亚马逊云科技助力欣和提高数据应用价值

Kyligence

数字化转型 指标平台

房地产行业IT运维安全就用行云管家堡垒机!

行云管家

运维 房地产 IT运维

Git入门指南:从新手到高手的完全指南

小万哥

git Linux 程序员 后端 C/C++

刚入职的后端开发问我SpringBoot如何跨域配置?我表示

Java你猿哥

Java Spring Boot ssm 跨域

5月书讯 | 《这就是ChatGPT》来了!

图灵教育

数学 书单 GPT

5月书讯 | 《这就是ChatGPT》来了!

图灵社区

数学 书单 书单推荐 GPT

Solaris Network:BSC上首个链上合成资产解决方案

鳄鱼视界

小程序容器与PWA的完美结合:提升应用性能与用户体验

FinFish

私有小程序技术 小程序容器 PWA 小程序化 小程序技术

kafka集群是如何选择leader,你知道吗?

JAVA旭阳

kafka

阿里大神级Elasticsearch学习笔记,还学不会就埋了

Java elasticsearch 分布式搜索引擎 ES

软件测试/测试开发丨学习笔记之Web自动化测试

测试人

程序员 软件测试 自动化测试 测试开发

莉莉丝游戏与火山引擎ByteHouse达成合作,为实时数仓建设提速

字节跳动数据平台

数据仓库 云原生 实时

ByConity与主流开源OLAP引擎(Clickhouse、Doris、Presto)性能对比分析

墨天轮

数据库 字节跳动 OLAP Clickhouse Doris

医疗领域实体抽取:UIE Slim最新升级版含数据标注、serving部署、模型蒸馏等教学,助力工业应用场景快速落地

汀丶人工智能

人工智能 自然语言处理 知识图谱 关系抽取 命名实体识别

阿里架构组分布式架构技术使用心得:全在这一份文档里面了

Java你猿哥

架构 分布式 ssm 分布式架构 安全架构

MatrixOne 助力开启分布式计算格局新征程

MatrixOrigin

分布式数据库 HTAP MatrixOrigin MatrixOne 矩阵起源

如何将千亿文件放进一个文件系统,EuroSys'23 CFS 论文背后的故事

百度Geek说

数据库 云计算 百度 企业号 5 月 PK 榜

Mysql DDL执行方式-pt-osc介绍 | 京东云技术团队

京东科技开发者

MySQL 数据库 企业号 5 月 PK 榜 DDL执行方式 pt-soc

国内好用的堡垒机推荐-行云管家堡垒机

行云管家

网络安全 堡垒机

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目_机器学习/深度学习_InfoQ精选文章