写点什么

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

作者:Claudio Masolo

  • 2023-09-13
    北京
  • 本文字数:1015 字

    阅读完需:约 3 分钟

大小:549.18K时长:03:07
开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

云原生计算基金会(CNCF)最近宣布,在技术监督委员会(TOC)投票后,已接受Kubeflow,用于在Kubernetes上部署机器学习(ML)工作流的工具包,成为 CNCF 孵化项目。

 

Kubeflow 提供了一个开源的 Kubernetes 原生 MLOps 平台,用于为最流行的框架来开发和部署分布式机器学习(ML):TensorFlowPyTorchXGBoostApache MXNet等等。

 

Kubeflow 由谷歌于 2017 年创建,自 2017 年以来,该社区现拥有 150 家公司、28K+ GitHub Stars、15+ 提交者以及 15 个版本。该项目分为六个半独立的小组:

 

  • Notebooks 工作组:负责开发界面和交互式部署环境

  • 训练 Operator 小组:开发并训练 operator,以便在 Kubernetes 上进行分布式 ML 训练

  • AutoML 小组:开发了自动化模型开发软件 Katib

  • Kubeflow Pipeline 工作组:开发了将 Python ML 脚本转换为工作流模板的软件

  • Manifest 工作组:开发安装过程

  • KServe 项目:在 Kubernetes 上开发了高度可扩展的模型推理平台

 

当前 Kubeflow 的架构如下图所示:

 


Kubeflow架构

 

使用 Kubeflow 配置接口,可以指定工作流所需的 ML 工具,并且可以将其部署到各种云、本地和 on-premises 平台上,用于实验和生产。

 

TOC 赞助商 Ricardo Rocha 表示:

 

Kubernetes 环境提供了可重复性、可扩展性和快速交付,使其成为运行 AI 和 ML 计划的完美场所。Kubeflow 通过提供机器学习管道和 MLOps 来填补了这一空白,同时与其广泛的社区和其他工具及计划密切合作,以创建一个更具凝聚力的生态系统。我们很高兴看到 Kubeflow 项目在 CNCF 中的发展,并看到它在 MLOps 领域的进步。

 

云原生计算基金会为项目定义了三个成熟度级别:沙箱阶段、孵化阶段和毕业阶段。

 


项目阶段

 

每个被提议的项目都要经过一个后备(fallback)投票过程,该过程由TOC毕业标准来描述:

 

一个项目需要有高于三分之二的绝对多数赞成才能被接受为孵化或毕业。如果没有绝对多数的赞成选票来支持项目进入毕业阶段,那么任何毕业的选票都会被重新计算为项目进入孵化阶段的选票。如果没有绝对多数的选票来支持项目进入孵化阶段,那么任何毕业或孵化的选票都会被重新计算为项目进入沙箱阶段的赞成选票。如果没有足够的赞成选票来支持项目进入沙盒阶段,该项目将被拒绝。

 

云原生计算基金会(CNCF)生态系统负责人 Taylor D.在 LinkedIn 上发表了一篇专门的帖子,以庆祝 Kubeflow 作为孵化项目加入 CNCF。

 

Kubeflow 的主要替代方案是亚马逊的Sagemaker,这是由 AWS 完全管理的机器学习平台。


原文链接:

https://www.infoq.com/news/2023/08/kubeflow-cncf-project/

2023-09-13 08:005632

评论

发布
暂无评论
发现更多内容

YashanDB安装与配置全攻略,助力数据驱动决策

数据库砖家

YashanDB多节点集群部署及管理技巧

数据库砖家

相比于直接消费 MCP 服务,您的企业可能更需要一个专属的 MCP 服务中心

阿里巴巴云原生

阿里云 AI 云原生 MCP

怎么制作论文开题报告?用这3个AIPPT工具轻松搞定!

职场工具箱

人工智能 效率工具 PPT 论文 AI生成PPT

YashanDB安全管理指南:保障企业数据资产安全

数据库砖家

YashanDB安装部署环境要求及最佳实践

数据库砖家

YashanDB大规模数据导入与导出实用指南

数据库砖家

YashanDB大数据应用中的性能优化实战技巧

数据库砖家

YashanDB的技术支持:如何获取帮助与解答?

数据库砖家

YashanDB的结构设计原则:如何优化数据存储?

数据库砖家

YashanDB多版本并发控制机制详解

数据库砖家

YashanDB安装与配置详解,助力企业数据安全稳定运行

数据库砖家

YashanDB的报告生成:快速获取数据洞察的有效方法

数据库砖家

YashanDB的多版本并发控制:保障数据一致性的方法

数据库砖家

YashanDB的人工智能集成:如何进行智能数据分析?

数据库砖家

YashanDB多场景应用教程:助力企业实现高效数据管理

数据库砖家

YashanDB查询优化实战:提升数据库响应速度

数据库砖家

YashanDB的部署选项:选择最佳设置以满足业务需求

数据库砖家

YashanDB多活架构设计与实现实操分享

数据库砖家

Ceph 可观测性最佳实践

观测云

Ceph

YashanDB的监控功能:实时跟踪数据状态与性能

数据库砖家

YashanDB的性能监控工具:如何实时评估数据库状态?

数据库砖家

YashanDB对企业数据治理的影响及实施策略

数据库砖家

YashanDB大数据环境下的数据库性能提升方法

数据库砖家

YashanDB的分布式架构设计理念剖析

数据库砖家

YashanDB的生态系统:如何利用开源工具提升功能?

数据库砖家

YashanDB的数据操作日志:如何进行有效的审计跟踪?

数据库砖家

YashanDB多活架构实现企业业务持续运营

数据库砖家

YashanDB安全策略及权限管理全面解析

数据库砖家

YashanDB的认证与合规:企业应注意的法律要求

数据库砖家

YashanDB的事务处理机制及异常处理方法

数据库砖家

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目_机器学习/深度学习_InfoQ精选文章