写点什么

Google 为他们的客户引入了 Preemptible GPU

  • 2018-02-21
  • 本文字数:1452 字

    阅读完需:约 5 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Google 宣布在他们的云平台上,释放为 Preemptible 虚拟机(Virtual Machine)附加图像处理器(Graphical Processing Unit,GPU)的 beta 发布版本。Google 云平台(Google Cloud Platform)的客户现在能够将 NVIDIA K80 和 NVIDIA P100 GPU 附加到 Preemptible VM 上,每个 GPU 每小时的价格分别是 0.22 和 0.73 美分,这要比 on-demand 实例上 GPU 的价格便宜 50%。这个发布版本能够让 Google 的客户在计算密集型的任务上有了更多的选择,这样他们能够在更细的粒度上进行高吞吐的批处理计算、机器学习以及科学和技术工作负载。

GCP 用户能够创建和运行 Preemptible VM 实例,它要比标准的 on-demand 实例成本低得多。但是,Google Compute Engine 会在 30 秒的警告之后,终止(preempt)这些实例。这些实例最多能使用 24 小时。GCP 用户如果具有容错的工作负载并且不需要专门的实例,就成本而言,Preemptible 实例是很合适的选择。另外,关联到 Preemptible VM 上的 GPU 默认都是 preemptible 的,因此成本会更低。

Alex Hickey 是 CIO Dive 站点的编辑,在最新的简报中,他提供了一些利用 Google Preemptiple GPU 的观点:

对于一般的公司来说,构建或运行 AI 系统并不便宜。专家们的薪水已经达到了六位数甚至更高,AI 的预算也变得很难分配。计算处理的硬件资源一般都是外包的,以便于节省成本。GPU 比专门的硬件在速度和处理时间上表现更好,而专门的硬件往往很快就会积累可观的前期和维护成本。可用工具,包括用于处理的硬件,是 AI 和 ML 实现普及的重要因素。据统计,40% 的公司具有 AI 实验室或实验性地应用,但是只有大约 20% 的企业实现了 AI 的规模化部署或核心业务功能的部署。不过,凭借更加可负担的 GPU,更多的公司能够在预算和策略方面找到空间,实现 POC 和测试用例的落地。

典型的 Preemptible VM 可以通过在 gcloud 命令行的实例创建命令上附加_–preemptible_ 参数或者在使用 REST API 时,将scheduling.preemptible属性设置为true进行创建。另外,用户还可以在 Google Cloud Platform Console 上将 Preemptibility 设置为 _“On”_,然后像往常一样为其关联 GPU。

图片来源: https://cloudplatform.googleblog.com/2018/01/introducing-preemptible-gpus-50-off.html

除此之外,用户如果需要更强的可扩展性,还可以通过创建由preemptible 实例所组成的托管实例组实现GPU 动态池的功能。需要注意的是,在创建组之前,要指定实例模板的preemptible 选项。这种方法所能带来的好处是如果preemptible 实例有足够的处理能力的话,在重新preempt 的时候,它们能够自动重建。当前,preemptible GPU 的特性只能在US-central1 region 中使用。Preemptible VM 的完整文档可以通过 Compute Engine 文档进行访问。

Google、Amazon 和 Microsoft 都提供了这样低价的计算资源,形式包括 Preemptible VM、spot 或 reserved VM 实例。它们的差异在于实例使用的灵活性。Amazon EC2 Spot 实例兼容 Preemptible VM。但是,客户不能为它们添加 GPU。AWS 和 Azure 所提供的 reserved 实例成本优势不明显,不过它们有一年或三年的期限。根据用例和所需的可用性不同,用户可以选择存活时间更短的 Preemptible VM 或 AWS spot 实例,也可以选择生命周期更可扩展的 Azure 或 AWS Reserved 实例。它们在成本上都比云平台的 on-demand 实例更廉价。

查看英文原文 Google Introduces Low-Priced Preemptible GPUs for Their Customers

2018-02-21 18:002074

评论

发布
暂无评论
发现更多内容

Python2 AI 通义灵码 VSCode插件安装与功能详解

阿里巴巴云原生

vscode Python2

Python2 AI 通义灵码 VSCode插件安装与功能详解

阿里云云效

Python

私有云统一管理定义以及好处简单说明

行云管家

云计算 私有云 云管理

Web3项目的开发

北京木奇移动技术有限公司

区块链技术 web3开发 软件外包开公司

音乐NFT项目的技术开发

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

Spring项目开发的智能助手:通义灵码使用指南

阿里巴巴云原生

spring

运维堡垒机-开启IT安全运维利器!

行云管家

网络安全 堡垒机 数字安全

数字藏品NFT的技术原理

北京木奇移动技术有限公司

软件外包公司 音乐NFT 体育NFT

从“制造”到“智造”,低代码如何赋能制造业转型升级?

天津汇柏科技有限公司

人工智能 低代码 智能制造

倒计时三年,国产化替代100%进度走到哪了?

禅道项目管理

信创 项目管理软件 国产化替代

移动端动态化发展:技术演进与生态建设实践

xuyinyin

Agentic AI 干货!DeepSeek + OpenAI SDK 构建 Agent 实战

七牛云

AI

无需登录+离线调试 Apipost完胜Apifox?

数据追梦人

什么是用于REST API的JWT Bearer令牌以及如何通过代码和工具进行调试

数据追梦人

中国企业出海的驱动力、跨端技术创新及流量分发新模式

xuyinyin

导师招募!Apache DolphinScheduler开源之夏2025等你领航!

白鲸开源

开源 Apache DolphinScheduler 开源之夏

​​AMS行政管理系统:数字化赋能人力资源精益管理​

秃头小帅oi

祝贺!华为云GES完成中国信通院图数据库产品测试

华为云开发者联盟

图数据库 华为云GES 中国信通院

龙蜥社区两大委员会月度会议圆满召开

OpenAnolis小助手

开源 操作系统 龙蜥社区

龙蜥RISC-V SIG 2.0研讨会圆满举办,宋卓当选国际基金会Datacenter SIG主席

OpenAnolis小助手

AI 操作系统 高性能计算 龙蜥社区 OpenAnolis

Spring项目开发的智能助手:通义灵码使用指南

阿里云云效

云计算 spring

龙蜥社区荣获 OS2ATC 2025 “最具影响力开源创新贡献奖”

OpenAnolis小助手

开源 操作系统 龙蜥社区 OpenAnolis

深入研究:淘宝天猫商品评论查询API详解

tbapi

淘宝API 淘宝商品评论API接口 天猫商品评论API接口

Python3 AI 通义灵码 VSCode插件安装与功能详解

阿里巴巴云原生

Python

几张图搞懂息队列Message Que

Marvin

kafka RabbitMQ IT 消息队列 message queue

CrossOver 25重磅发布:众多革命性突破带给你更强的Mac游戏兼容性

阿拉灯神丁

兼容性测试 CrossOver Mac下载 Mac游戏推荐 mac虚拟机软件

5分钟掌握!DolphinScheduler时间参数动态配置秘籍

白鲸开源

大数据 开源 Apache DolphinScheduler 任务调度 大数据调度

DNS常见问题:什么是主机记录和记录值?

防火墙后吃泡面

Cloud Kernel SIG 季度动态:发布ANCK 6.6-003版本,支持一测多证

OpenAnolis小助手

操作系统 龙蜥社区 OpenAnolis 龙蜥社区SIG

Python3 AI 通义灵码 VSCode插件安装与功能详解

阿里云云效

Python

Apache DolphinScheduler 3.3.0 Alpha发布,功能增强与性能优化大升级!

白鲸开源

大数据 开源 Apache DolphinScheduler 任务调度 发版

Google为他们的客户引入了Preemptible GPU_语言 & 开发_Steef-Jan Wiggers_InfoQ精选文章