最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

谷歌 Kubernetes 引擎上的 GPU 现已普遍可用

  • 2018-07-10
  • 本文字数:868 字

    阅读完需:约 3 分钟

谷歌宣布可在 Kubernetes 引擎(GKE)中普遍使用 GPU。与最近发布的 1.10 正式版 GKE 一起,用户可以将机器学习(ML)工作负载放在上面,并利用 GPU 的强大处理能力。

谷歌为 GKE 提供了几款 GPU——快速版的 NVIDIA Tesla V100、Tesla P100 和入门级的 Tesla K80。这些 GPU 中的每一个都可作为可抢占式 GPU 使用,让用户能够以较低的成本利用谷歌云的 GPU。此外,根据公告博文所述,有了这些可用的 GPU,用户可以从一些独特的功能中受益:

  • 节点池让现有群集在需要时使用 GPU。

  • 当 Pod 请求 GPU 时, Cluster Autoscaler 会自动创建带有 GPU 的节点,而当活动 Pod 不再使用 GPU 时,它会将节点缩减至零。

  • 侵蚀(Taint)和耐受(Toleration)技术确保只有请求 GPU 的 Pod 会被安排带有 GPU 的节点,并防止不需要 GPU 的 Pod 运行在上面。

  • 资源配额让管理员可以在多个用户或团队共享的大型群集中根据命名空间来限制资源消耗。

此外,谷歌还提供了通过 GCP 控制台观察 GPU 性能的功能。

来源: https://cloudplatform.googleblog.com/2018/06/GPUs-as-a-service-with-Kubernetes-Engine-are-now-generally-available.html

自从 GKE 上的 GPU 开放测试版以来,核心小时数增加了十倍,表明 Kubernetes 在 GCP 上的使用量增加了。但是,谷歌并不是唯一一个看到使用量增加的人。此外,微软看到他们的 Azure Kubernetes 服务(AKS)的使用量也有所增加,该服务最近才开始普遍可用。微软 Azure 容器项目经理 Gabe Monroy 在今年 5 月初的一篇博文中表示:

随着 Kubernetes 在全球范围内的普及,毫无疑问,Kubernetes 在 Azure 上的使用量比去年增长了 10 倍以上。

另一家重要的公有云提供商亚马逊为 Kubernetes(EKS)提供了弹性容器服务,该服务自 6 月中旬开始提供。此外,该提供商在 Kubernetes 的使用方面处于领先地位,因为最近的调查显示,57%运营Kubernetes 的公司选择了AWS。

用户可以通过价值300 美元的免费试用机会来体验Kubernetes 引擎中的GPU。此外,有关GPU 的价格详情,请参阅定价页面

查看英文原文 GPUs on Google’s Kubernetes Engine Are Now Generally Available

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-07-10 03:191249
用户头像

发布了 731 篇内容, 共 433.8 次阅读, 收获喜欢 1997 次。

关注

评论

发布
暂无评论
发现更多内容

ReactNative进阶(七):导航组件 react-navigation

No Silver Bullet

React Native 导航 1月月更

深度剖析:Kafka 请求是如何处理的? 看完这篇文章彻底懂了

Kafka中文社区

熬夜整理56个JavaScript高级的手写知识点!!专业扫盲!

Sunshine_Lin

JavaScript 面试 进阶 ES6 手写

2022 年 Python 项目管理最佳实践(qbit)

qbit

Java 中 Jackson 的 readTree

HoneyMoose

物联网平台分为几层,你了解吗

华为云开发者联盟

物联网平台 终端 物联网 IoTAgent 智慧家庭

ubuntu隐藏终端路径

Ayosh

ubuntu #Ubuntu

中文分词的原理与方法及其在运维领域中的实践

云智慧AIOps社区

算法 分词 智能运维 日志解析 技术黑板报

Linux之chmod命令

入门小站

Linux

大数据开发之Hive调优技巧

@零度

大数据 hive调优

看了个女装项目(doge

你?

企业办公IM风云再起,未来将朝三大方向发展

WorkPlus

技术干货 | 基于标准 WebRTC 低延迟直播的开源实践

网易云信

WebRTC 网络协议 直播技术 低延迟

java开发之SpringBoot 定时任务动态管理

@零度

JAVA开发 springboot

云计算厂商们,你们辜负了中国的用户

Geek_2749b8

云计算 云服务

2021 年 25 大 DevOps 工具(下)

禅道项目管理

DevOps

在线JSON转YAML工具

入门小站

json

做数据分析已经会Excel了,还要学Python吗?

博文视点Broadview

企业级开发平台的业务场景/运行机制/功能

WorkPlus

KubeMeet 新年首站成都开放报名!5 场云原生应用交付开源实践

阿里巴巴云原生

阿里云 开源 云原生 KubeMeet 线下活动

关于熟经济和通胀--《香帅中国财富报告》摘录(2/100)

hackstoic

经济

Mithril.js:一个高性能 JavaScript MVC 框架

devpoint

typescript mvc 1月月更 Mithril.js

没想到,学棋五年的我竟然输给了昇腾CANN!

华为云开发者联盟

机器人 强化学习 CANN 昇腾 机械臂

Vue3的8种组件通信方式

编程江湖

Vue 3

Spring中用了哪些设计模式

编程江湖

spring

带你认识FusionInsight Flink:既能批处理,又能流处理

华为云开发者联盟

flink 批处理 流处理 FusionInsight Flink 计算框架

Kafka架构及基本原理简析

编程江湖

kafka

青藤:东西向流量占比80%,安全如何有效搞定?

青藤云安全

全新UI西游H5决战天宫游戏详细图文架设教程

echeverra

5步带你掌握工作流Activiti框架的使用

华为云开发者联盟

工作流 流程 任务 Activiti 静态数据

前端开发之JS中localStorage的使用

@零度

JavaScript 前端开发

谷歌Kubernetes引擎上的GPU现已普遍可用_语言 & 开发_Steef-Jan Wiggers_InfoQ精选文章