英特尔开源分布式深度学习平台Nauta，使用Kubernetes 和 Docker 平台运行_AI&大模型_英特尔官博_InfoQ精选文章



 写点什么

登录/注册

英特尔开源分布式深度学习平台Nauta，使用Kubernetes 和 Docker 平台运行

1 月 24 日，英特尔发表博文宣布开源其分布式深度学习平台 Nauta。Nauta 使用业界领先的 Kubernetes 和 Docker 平台运行，以实现可扩展性和易管理性。

GitHub 开源地址：https://github.com/intelAI/Nauta

随着越来越多的企业探索在业务中使用 AI 来改善商业模式，AI 继续不断发展。根据 Gartner 最近一份报告显示，AI 部署已经产生巨大实际价值，2022 年价值有望达到 4 万亿美元。AI 中的深度学习也获得快速发展，据德勤一份 2018 年地调查显示，有将近 50% 的受访者表示已经采用了深度学习。虽然业务价值持续增长，并且企业对深度学习的兴趣显而易见，但集成、验证和优化深度学习解决方案仍然是一项复杂，有风险且耗时的工作。这就是英特尔使用 Kubernetes 为分布式深度学习引入 Nauta 开源平台的原因。

Nauta 是什么？

Nauta 提供了一个多用户的分布式计算环境，用于运行深度学习模型训练实验。它可以使用命令行界面、Web UI 和/或 TensorBoard 查看和监控实验结果。你可以使用现有数据集，自己的数据或在线下载的数据创建公共或私人文件夹，更轻松地在团队之间进行协作。

Nauta 使用业界领先的 Kubernetes 和 Docker 平台运行，以实现可扩展性和易管理性。为了让创建和运行单节点和多节点深度学习训练实验更简单，该平台兼容各种深度学习框架和工具的模板包（并可自定义），而无需标准容器环境所需的所有系统开销和脚本。

在模型测试中，Nauta 还支持批量和流式推理，所有工作在一个平台上完成。

（图 1：使用 Nauta 训练并部署深度学习网络）

面向开发人员，支持 Kubernetes 和容器化

英特尔在创建 Nauta 工作流程中考虑到了开发人员和数据科学家。Nauta 是一个企业级堆栈，适用于需要进行深度学习模型训练并在生产中部署团队。使用 Nauta，用户可以在单个或多个工作节点上使用 Kubernetes 定义并进行容器化的深度学习实验，并检查这些实验的状态和结果，以进一步调整和运行其他实验，或准备训练模型进行部署。

Nauta 特性

Nauta 使用户能够利用来自经验丰富的机器学习开发人员和运营商的共享最佳实践，而不会牺牲灵活性。
在每个抽象级别，开发人员仍然有机会回退到 Kubernetes 并直接使用原语。
Nauta 让新手在有保障的情况下进行实验。精心挑选的组件和直观的用户体验减少了对开源 DL 服务的生产准备，配置和互操作性的担忧。
支持多团队成员协作，作业输入和输出可以在团队成员之间共享，并通过启动 TensorBoard 来查看其他人的工作检查点，帮助调试问题。

（图 2：使用 TensorBoard 和 Nauta WebUI 监控作业）

创建指南

2019 年，Nauta 将在 Q1 及更高版本中进行更新，并通过landing page维护开发者社区，鼓励开发人员和数据科学家在他们自己的堆栈上尝试 Nauta。

有关最新的技术信息，包括安装指南，用户文档以及如何参与项目，参见 Github：https://github.com/intelAI/Nauta

构建 Nauta 安装包并在 Google Cloud Platform 上顺利运行，请关注Google云平台上的Nauta 入门。

有关构建 Nauta 包的详细信息，参见如何构建指南。

快速启动并运行，请查看入门指南。

更多信息，请参阅以下文档：

Nauta、Kubeflow Pipeline、Azure Kubernetes、Acumos AI 对比

Nauta 是可以使用 Kubernetes 或 Docker 容器的最新发布工具，这种方法让从业者在通过内部部署服务器还是云端部署 AI 之间进行选择。

11 月，谷歌推出了一个 Kubernetes 工作流程 Kubeflow Pipeline，而微软上个月在公开预览中推出了 Azure Kubernetes 服务。

Kubeflow Pipeline GitHub：https://github.com/kubeflow/pipelines

Kubeflow 是一个使用 Kubeflow Pipelines SDK 构建的可重复使用的端到端 ML 工作流程，致力于使 Kubernetes 上机器学习工作流的部署简单，可移植和可扩展。

Azure Kubernetes：https://azure.microsoft.com/en-us/services/kubernetes-service/

Azure Kubernetes 简化 Kubernetes 管理、部署和运营，使用完全托管的 Kubernetes 容器编排服务。

另外，Linux 基金会的 LF 深度学习基金也于去年秋季推出了用于深度学习的 Acumos AI 平台和开源框架，可以轻松构建、共享和部署 AI 应用程序，标准化了运行开箱即用的通用 AI 环境所需的基础架构堆栈和组件。

参考链接：

https://venturebeat.com/2019/01/23/heartland-tech-weekly-indie-vcs-funding-model-could-be-promising-for-startups-in-middle-america/

https://www.acumos.org/

https://azure.microsoft.com/en-us/services/kubernetes-service/

评论 1 条评论

发布

kube-batch inside :)

2019-01-26 18:47

 0 回复

没有更多了

三次握手与四次挥的问题，怎么回答？

教你用JavaScript完成简易贪吃蛇小游戏

小院里的霍大侠

JavaScript 编程开发实战案例初学者入门实战

数据可视化图表系列解析——柱状图

Data 探险实验室

数据分析可视化数据可视化 BI 分析工具可视化数据

数据库原理及MySQL应用 | 日志管理

数据库日志 12月月更

前端leetcde算法面试套路之堆

JavaScript LeetCode

跨平台应用开发进阶(二十四) ：uni-app实现文件下载并保存

No Silver Bullet

uni-app 12月月更文件下载文件保存

如何使用 Towify 在小程序中实现勾选用户协议后登录？

微信小程序无代码触发器

百度工程师带你探秘C++内存管理（ptmalloc篇）

c++ Linux 内存管理 12 月 PK 榜

promise执行顺序面试题令我头秃，你能作对几道

Dubbo架构设计与源码解析（一）架构设计

京东科技开发者

云原生 dubbo Java、架构设计分布式架构

vivo 云原生容器探索和落地实践

vivo互联网技术

机器学习 AI 容器云原生 k8s

DevData Talks | 大咖集结『研发效能答疑专场』即将开始！

思码逸研发效能

研发管理研发效能研发管理工具

用javascript分类刷leetcode23.并查集(图文视频讲解)

JavaScript LeetCode

跨平台应用开发进阶(二十六) ：忐忑悲壮路，心酸出坑史——记第一次iOS艰辛上架路

No Silver Bullet

uni-app iOS上架 12月月更问题汇总

架构实战营 - 模块 2- 作业

前端面试比较好的回答

关系型数据库设计三大范式

京东科技开发者

关系型数据库数据库设计范式冗余数据库·

ClassLoader 隔离性的基石是namespace，证明给你看

小小怪下士

Java 程序员面试

前端leetcde算法面试套路之树

JavaScript LeetCode

问：React的setState为什么是异步的？

跨平台应用开发进阶(二十五) ：uni-app实现IOS云打包解决IOS提交审核相册等隐私描述语导致审核失败问题

No Silver Bullet

uni-app 12月月更 IOS云打包提交审核隐私描述语

如何配置分享到微信功能？

微信小程序无代码触发器

最新前端面试总结

2022 阿里灵杰AI开发者峰会内容抢先看！

阿里云大数据AI技术

人工智能阿里云

程序员职场晋升：与阿里前P9的一次近距离互动

博文视点Broadview

web前端经典react面试题

老生常谈React的diff算法原理-面试版

ReactDOM.render在react源码中执行之后发生了什么？

NeurIPS 2022：基于语义聚合的对比式自监督学习方法

华为云开发者联盟

人工智能华为云论文 12 月 PK 榜

版本更新 | Towify V1.24.0 有哪些实用新功能？汇总来了！