写点什么

谷歌 Kubernetes 引擎上的 GPU 现已普遍可用

  • 2018-07-10
  • 本文字数:868 字

    阅读完需:约 3 分钟

谷歌宣布可在 Kubernetes 引擎(GKE)中普遍使用 GPU。与最近发布的 1.10 正式版 GKE 一起,用户可以将机器学习(ML)工作负载放在上面,并利用 GPU 的强大处理能力。

谷歌为 GKE 提供了几款 GPU——快速版的 NVIDIA Tesla V100、Tesla P100 和入门级的 Tesla K80。这些 GPU 中的每一个都可作为可抢占式 GPU 使用,让用户能够以较低的成本利用谷歌云的 GPU。此外,根据公告博文所述,有了这些可用的 GPU,用户可以从一些独特的功能中受益:

  • 节点池让现有群集在需要时使用 GPU。

  • 当 Pod 请求 GPU 时, Cluster Autoscaler 会自动创建带有 GPU 的节点,而当活动 Pod 不再使用 GPU 时,它会将节点缩减至零。

  • 侵蚀(Taint)和耐受(Toleration)技术确保只有请求 GPU 的 Pod 会被安排带有 GPU 的节点,并防止不需要 GPU 的 Pod 运行在上面。

  • 资源配额让管理员可以在多个用户或团队共享的大型群集中根据命名空间来限制资源消耗。

此外,谷歌还提供了通过 GCP 控制台观察 GPU 性能的功能。

来源: https://cloudplatform.googleblog.com/2018/06/GPUs-as-a-service-with-Kubernetes-Engine-are-now-generally-available.html

自从 GKE 上的 GPU 开放测试版以来,核心小时数增加了十倍,表明 Kubernetes 在 GCP 上的使用量增加了。但是,谷歌并不是唯一一个看到使用量增加的人。此外,微软看到他们的 Azure Kubernetes 服务(AKS)的使用量也有所增加,该服务最近才开始普遍可用。微软 Azure 容器项目经理 Gabe Monroy 在今年 5 月初的一篇博文中表示:

随着 Kubernetes 在全球范围内的普及,毫无疑问,Kubernetes 在 Azure 上的使用量比去年增长了 10 倍以上。

另一家重要的公有云提供商亚马逊为 Kubernetes(EKS)提供了弹性容器服务,该服务自 6 月中旬开始提供。此外,该提供商在 Kubernetes 的使用方面处于领先地位,因为最近的调查显示,57%运营Kubernetes 的公司选择了AWS。

用户可以通过价值300 美元的免费试用机会来体验Kubernetes 引擎中的GPU。此外,有关GPU 的价格详情,请参阅定价页面

查看英文原文 GPUs on Google’s Kubernetes Engine Are Now Generally Available

2018-07-10 03:191785
用户头像

发布了 731 篇内容, 共 477.5 次阅读, 收获喜欢 2008 次。

关注

评论

发布
暂无评论
发现更多内容

一文读透react精髓

xiaofeng

React

redux原理是什么

xiaofeng

React

小样本学习在文心ERNIE3.0多分类任务应用--提示学习

汀丶人工智能

nlp 文本分类

云小课|MRS基础原理之Oozie任务调度

华为云开发者联盟

大数据 华为云 企业号十月 PK 榜

5 why 分析法,一种用于归纳抽象出解决方案的好方法

程序员泥瓦匠

SAP | 子例程

暮春零贰

SAP 10月月更 子例程

长安链源码分析同步服务器1

【1024程序员节专访】聚焦行业前沿,共话IT发展趋势

博睿数据

程序员 可观测性 智能运维 博睿数据 IT行业

文读懂NodeJs知识体系和原理浅析

coder2028

node.js

Vue虚拟dom是如何被创建的

yyds2026

Vue

Vue模板是怎样编译的

yyds2026

Vue

Workflow,要不要了解一下

华为云开发者联盟

人工智能 华为云 企业号十月 PK 榜

京东云开发者|ElasticSearch降本增效常见的方法

京东科技开发者

elasticsearch ES 降本增效 数据压缩 存储计算分离

Java:既然有了synchronized,为什么还要提供Lock

华为云开发者联盟

Java 开发 华为云 企业号十月 PK 榜

从 wepy 到 uniapp 变形记

vivo互联网技术

wepy uni-app 前端 编译器

SAP | 功能模块

暮春零贰

SAP 功能块 10月月更

引擎上新|卡片焕新升级,信息高效呈现

Jianmu

DevOps 持续集成 CI/CD

Webpack配置实战

Geek_02d948

webpack

漏洞评分高达9.8分!Text4Shell 会是下一个 Log4Shell吗?

SEAL安全

安全 log4j 漏洞分析 Log4j2 漏洞 软件供应链安全

【沙丘大会】九科信息研发中心自动化负责人郑文茂受邀分享央企数字员工实践案例

九科Ninetech

线上数据问题排查案例分享-因为 HMS 和底层 orc 文件中某字段的数据精度不一致造成的数据丢失问题

明哥的IT随笔

hadoop hive DataX

深入nodejs的event-loop

coder2028

node.js

原生拖拽太拉跨了,纯JS自己手写一个拖拽效果,纵享丝滑

茶无味的一天

CSS html HTML5, CSS3 拖拉拽 原生js

云计算基础:云计算运用越来越广泛,我们应该如何去学习云计算

Python-派大星

10月月更

Docker进阶 dockerfile指令构建docker镜像

Python-派大星

10月月更

Vue组件是怎样挂载的

yyds2026

Vue

webpack模块化的原理

Geek_02d948

webpack

webpack实战,手写loader和plugin

Geek_02d948

webpack

【文本检测与识别白皮书-3.2】第二节:场景文本识别方法

合合技术团队

人工智能 深度学习 文字识别 OCR 文本识别

云安全系列2:访问安全和身份管理

HummerCloud

云计算 云安全 iam 身份和访问管理 10月月更

彻底搞懂nodejs事件循环

coder2028

node.js

谷歌Kubernetes引擎上的GPU现已普遍可用_语言 & 开发_Steef-Jan Wiggers_InfoQ精选文章