写点什么

Google 为他们的客户引入了 Preemptible GPU

  • 2018-02-21
  • 本文字数:1452 字

    阅读完需:约 5 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Google 宣布在他们的云平台上,释放为 Preemptible 虚拟机(Virtual Machine)附加图像处理器(Graphical Processing Unit,GPU)的 beta 发布版本。Google 云平台(Google Cloud Platform)的客户现在能够将 NVIDIA K80 和 NVIDIA P100 GPU 附加到 Preemptible VM 上,每个 GPU 每小时的价格分别是 0.22 和 0.73 美分,这要比 on-demand 实例上 GPU 的价格便宜 50%。这个发布版本能够让 Google 的客户在计算密集型的任务上有了更多的选择,这样他们能够在更细的粒度上进行高吞吐的批处理计算、机器学习以及科学和技术工作负载。

GCP 用户能够创建和运行 Preemptible VM 实例,它要比标准的 on-demand 实例成本低得多。但是,Google Compute Engine 会在 30 秒的警告之后,终止(preempt)这些实例。这些实例最多能使用 24 小时。GCP 用户如果具有容错的工作负载并且不需要专门的实例,就成本而言,Preemptible 实例是很合适的选择。另外,关联到 Preemptible VM 上的 GPU 默认都是 preemptible 的,因此成本会更低。

Alex Hickey 是 CIO Dive 站点的编辑,在最新的简报中,他提供了一些利用 Google Preemptiple GPU 的观点:

对于一般的公司来说,构建或运行 AI 系统并不便宜。专家们的薪水已经达到了六位数甚至更高,AI 的预算也变得很难分配。计算处理的硬件资源一般都是外包的,以便于节省成本。GPU 比专门的硬件在速度和处理时间上表现更好,而专门的硬件往往很快就会积累可观的前期和维护成本。可用工具,包括用于处理的硬件,是 AI 和 ML 实现普及的重要因素。据统计,40% 的公司具有 AI 实验室或实验性地应用,但是只有大约 20% 的企业实现了 AI 的规模化部署或核心业务功能的部署。不过,凭借更加可负担的 GPU,更多的公司能够在预算和策略方面找到空间,实现 POC 和测试用例的落地。

典型的 Preemptible VM 可以通过在 gcloud 命令行的实例创建命令上附加_–preemptible_ 参数或者在使用 REST API 时,将scheduling.preemptible属性设置为true进行创建。另外,用户还可以在 Google Cloud Platform Console 上将 Preemptibility 设置为 _“On”_,然后像往常一样为其关联 GPU。

图片来源: https://cloudplatform.googleblog.com/2018/01/introducing-preemptible-gpus-50-off.html

除此之外,用户如果需要更强的可扩展性,还可以通过创建由preemptible 实例所组成的托管实例组实现GPU 动态池的功能。需要注意的是,在创建组之前,要指定实例模板的preemptible 选项。这种方法所能带来的好处是如果preemptible 实例有足够的处理能力的话,在重新preempt 的时候,它们能够自动重建。当前,preemptible GPU 的特性只能在US-central1 region 中使用。Preemptible VM 的完整文档可以通过 Compute Engine 文档进行访问。

Google、Amazon 和 Microsoft 都提供了这样低价的计算资源,形式包括 Preemptible VM、spot 或 reserved VM 实例。它们的差异在于实例使用的灵活性。Amazon EC2 Spot 实例兼容 Preemptible VM。但是,客户不能为它们添加 GPU。AWS 和 Azure 所提供的 reserved 实例成本优势不明显,不过它们有一年或三年的期限。根据用例和所需的可用性不同,用户可以选择存活时间更短的 Preemptible VM 或 AWS spot 实例,也可以选择生命周期更可扩展的 Azure 或 AWS Reserved 实例。它们在成本上都比云平台的 on-demand 实例更廉价。

查看英文原文 Google Introduces Low-Priced Preemptible GPUs for Their Customers

2018-02-21 18:001583

评论

发布
暂无评论
发现更多内容

开源技术交流丨批流一体数据同步引擎ChunJun数据还原-DDL功能模块解析

袋鼠云数栈

跨平台|融云 React Native IM SDK 全新改版上线

融云 RongCloud

IM sdk

数据资产为王,解析企业数字化转型与数据资产管理的关系

袋鼠云数栈

当我们在聊「开源大数据调度系统Taier」的数据开发功能时,到底在讨论什么?

袋鼠云数栈

活动报名| MongoDB 使用规范及最佳实践线上直播来啦!

MongoDB中文社区

mongodb

基于开源流批一体数据同步引擎ChunJun数据还原—DDL解析模块的实战分享

袋鼠云数栈

开源项目丨一文详解一站式大数据平台运维管家ChengYing如何部署Hadoop集群

袋鼠云数栈

大数据开源项目,一站式全自动化全生命周期运维管家ChengYing(承影)走向何方?

袋鼠云数栈

老忘记带伞,自己动手做一个雨天提醒打伞小工具

华为云开发者联盟

云计算 开发 aPaaS

开源项目丨Taier1.2版本发布,新增工作流、租户绑定简化等多项功能

袋鼠云数栈

2022年了,你还不会手撕轮播图?

知心宝贝

JavaScript 算法 前端 可视化 签约计划第三季

基于开源大数据调度系统Taier的Web前端架构选型及技术实践

袋鼠云数栈

开源技术交流丨一站式全自动化运维管家ChengYing入门介绍

袋鼠云数栈

流批一体开源项目ChunJun技术公开课——ChunJun同步Hive事务表

袋鼠云数栈

DataOps不是工具,而是帮助企业实现数据价值的最佳实践

袋鼠云数栈

开源技术交流丨ChengYing部署Hadoop集群实战

袋鼠云数栈

袋鼠云思枢:数驹DTengine,助力企业构建高效的流批一体数据湖计算平台

袋鼠云数栈

袋鼠云申杭:数雁EasyDigit,致力成为金融行业数据洞察平台供应商的“领头雁”

袋鼠云数栈

如何在BI中增加“路线地图”并进行数据分析?

葡萄城技术团队

想要精准营销,从学习搭建一套对的标签体系开始丨DTVision分析洞察篇

袋鼠云数栈

从洞察到决策,一文解读标签画像体系建设方法论丨DTVision分析洞察篇

袋鼠云数栈

【接入指南 之 云云接入】快速接入HONOR Connect平台(下)

荣耀开发者服务平台

开发者 IoT 新手指南 荣耀 honor

走好数据中台最后一公里,为什么说数据服务API是数据中台的标配?

袋鼠云数栈

数据资产为王,如何解析企业数字化转型与数据资产管理的关系?

袋鼠云数栈

开源大数据调度系统Taier技术公开课——Taier数据开发介绍

袋鼠云数栈

开源交流丨批流一体数据集成工具ChunJun同步Hive事务表原理详解及实战分享

袋鼠云数栈

开源一夏 | layui时间控件 laydate 重置失效

六月的雨在InfoQ

开源 layui 8月月更 laydate

“阿里爸爸”最新总结的303页Spring全家桶高级笔记,都是面试必问的知识点

Java工程师

Java spring Spring全家桶

用 manim 写一个排序算法动画

ooooooh灰灰

算法 前端 后端 动画 排序

自动化测试-存储测试用例,哪个更好

和牛

Python 自动化 测试 8月月更

1分钟创建3000台云电脑 阿里云无影发布多款千人协同生产力方案

Lily

Google为他们的客户引入了Preemptible GPU_语言 & 开发_Steef-Jan Wiggers_InfoQ精选文章