大厂Data+Agent 秘籍:腾讯/阿里/字节解析如何提升数据分析智能。 了解详情
写点什么

谷歌 Cloud Run 现在为 AI 和批处理提供了无服务器 GPU

  • 2025-06-11
    北京
  • 本文字数:1398 字

    阅读完需:约 5 分钟

大小:687.28K时长:03:54
谷歌Cloud Run现在为AI和批处理提供了无服务器GPU

谷歌云宣布 NVIDIA GPU 支持 Cloud Run(无服务器运行时)的全面可用性。通过这一增强功能,谷歌云旨在为广泛的 GPU 加速用例,特别是在 AI 推理和批处理方面,提供一个功能强大且成本效益显著的环境。

 

在一篇公司的博客文章中,谷歌强调,开发人员青睐 Cloud Run,因为它简单、灵活且可扩展。随着对 GPU 支持的增加,它现在将其核心优势扩展到 GPU 资源:

 

  • 按秒计费:用户现在只需根据他们消耗的 GPU 资源付费,精确到秒——从而最大限度地减少浪费。

  • 缩放到零:Cloud Run 在非活动状态下自动将 GPU 实例缩放到零,消除空闲成本——对于间歇性或不可预测的工作负载尤其有益。

  • 快速启动和扩展:带有 GPU 和驱动程序的实例可以在 5 秒内启动,使应用程序能够非常快速地响应需求。

  • 完整的流支持:对 HTTP 和 WebSocket 流的内置支持允许交互式应用程序,例如实时 LLM 响应。

 

NVIDIA 加速计算产品总监 Dave Salvator 评论道:

 

无服务器 GPU 加速代表了使尖端 AI 计算更易于访问的重大进步。通过无缝访问 NVIDIA L4 GPU,开发人员现在可以比以往任何时候都更快、更经济地将 AI 应用程序投入生产。

 

一个重要的入门障碍已经被移除,因为 Cloud Run 上的 NVIDIA L4 GPU 支持现在对所有用户开放,无需请求配额。开发人员可以通过简单的命令行标志(--gpu 1)或在谷歌云控制台中勾选一个框来启用 GPU 支持。

 

支持 GPU 的 Cloud Run 已经可以投入生产,由 Cloud Run 的服务水平协议(SLA)覆盖,以确保可靠性和正常运行时间。默认情况下,它为弹性提供了区域冗余,并在区域性故障时提供最佳努力故障转移的选项,通过关闭区域冗余,以降低价格。

 

在 Cloud Run 上对 GPU 的普遍支持也引发了开发者社区关于其竞争影响的讨论,特别是与其他主要云提供商的关系。ZenRows 的首席软件工程师 Rubén del Campo强调,谷歌的举动是“AWS 多年前就应该打造的东西:真正有效的无服务器 GPU 计算。”

 

他的观点突出了对 AWS Lambda 能力的“巨大差距”的感知,特别指出 Lambda 的 15 分钟超时和仅限 CPU 计算对于现代 AI 工作负载(如 Stable Diffusion 推断、模型微调或实时视频分析)来说是令人难以接受的。“尝试在 Lambda 中运行 Stable Diffusion 推理,微调模型或使用 AI 处理视频。这是不可能的,”一位用户评论道,并强调 Cloud Run GPU 使这些任务“在缩放到零的无服务器 GPU 上变得微不足道”。

 

虽然 Cloud Run gpu 提供了引人注目的功能,但一些 Hacker News帖子上的用户对缺乏硬性计费限制表示担忧,这可能会导致意想不到的成本。虽然 Cloud Run 允许设置最大实例限制,但它不提供实际的基于美元的支出上限。

 

此外,在同一个 Hacker News帖子上的比较也表明,其他提供商,如 Runpod.io 可能会为类似的 GPU 实例提供更有竞争力的价格。例如,一些用户指出,即使考虑到谷歌的按秒计费,Runpod 的 L4、A100 和 H100 GPU 的小时费率也可能明显低于谷歌的小时费率。

 

除了实时推理,谷歌还宣布 GPU 在Cloud Run作业上的可用性(目前处于私有预览阶段),为批处理和异步任务解锁了新的用例。这些功能在全球范围内得到支持,Cloud Run GPU 可在五个谷歌云区域使用:us-central1(美国爱荷华州)、european -west1(比利时)、european -west4(荷兰)、asia-southeast1(新加坡)和 asia-south1(印度孟买)。规划增加更多的区域。

 

最后,该公司表示,开发人员可以通过利用官方文档快速入门优化模型加载的最佳实践来开始构建 Cloud Run GPU。

 

原文链接:

https://www.infoq.com/news/2025/06/google-cloud-run-nvidia-gpu/

2025-06-11 11:063536

评论

发布
暂无评论

技术分享 | 测试人员必须掌握的测试用例

霍格沃兹测试开发学社

GOPS现场 | 对话龙智董事长何明,探讨DevOps安全新概念

龙智—DevSecOps解决方案

运维 GOPS大会 GOPS全球运维大会

BulkProcessor异步批处理组件使用

大河

elasticsearch bboss bulkprocess

bboss数据同步ETL工具介绍

大河

elasticsearch ETL bboss

最常见的两个Jenkins问题,以及解决方法

龙智—DevSecOps解决方案

ci CI/CD CI/CD管道

NFT平台开发:NFT数字馆藏平台开发

开源直播系统源码

数字藏品软件开发 数字藏品开发 数字藏品系统

蓝牙5.0简介、nRF52832 BLE样例工程框架及main函数初始化流程简析

矜辰所致

蓝牙 启动流程 8月月更 nRF52832

入门机器学习?还是先抢救一下数学吧!

博文视点Broadview

兆骑科创人才引进服务平台,线上直播路演,投融资对接

兆骑科创凤阁

leetcode 227. Basic Calculator II 基本计算器 II(中等)

okokabcd

LeetCode 算法与数据结构

兆骑科创创新创业服务平台,海内外高层次人才引进,赛事承办

兆骑科创凤阁

AntDB最新成果亮相全球分布式云大会,推动企业数字化变革深入

亚信AntDB数据库

AntDB

这份SVN命令备忘清单,请查收

龙智—DevSecOps解决方案

svn 版本控制系统

字节跳动基于 ClickHouse 优化实践之“查询优化器”

字节跳动数据平台

OLAP Clickhouse 查询优化 数据库开发 数据引擎

bboss http负载均衡器使用指南

大河

HTTP bboss httpproxy

你还有什么问题吗?

AlwaysBeta

程序员 面试

Kyligence 亮相 Gartner 2022 数据与分析峰会,解锁数据智能新潜力

Kyligence

数据管理 指标中台

Elasticsearch添加修改删除索引文档

大河

elasticsearch bboss

移动端App自动化之触屏操作自动化

霍格沃兹测试开发学社

节能环保LED显示屏为什么是未来发展趋势?

Dylan

LED显示屏 led显示屏厂家

校区多,客情管理难?看中进教育使用明道云的新解法

明道云

如何建立开源战略

龙智—DevSecOps解决方案

开源 漏洞修复 漏洞检测 漏洞管理

【小程序项目开发-- 京东商城】uni-app开发之配置 tabBar & 窗口样式

计算机魔术师

8月月更

厚积薄发--一文带您了解阿里云 RocketMQ 轻量版消息队列(MNS)

阿里巴巴云原生

阿里云 RocketMQ 云原生 消息队列

如何应对ITSM难题,打造现代化、高效的ITSM解决方案?

龙智—DevSecOps解决方案

ITSM ITSM软件 ITSM解决方案

技术分享 | 这些常用测试平台,你们公司在用的是哪些呢?

霍格沃兹测试开发学社

技术分享 | 这些常用测试平台,你们公司在用的是哪些呢?

霍格沃兹测试开发学社

网络组件axios可以在OpenHarmony上使用了

OpenHarmony开发者

Open Harmony

项目经理和ScrumMaster可以是同一个人吗?

ShineScrum

Scrum 敏捷 ScrumMaster 项目经理

2022 世界人工智能大会|人工智能与开源技术先锋论坛即将开幕

Kyligence

开源技术 人工智能大会

【小程序项目开发 --- 京东商城】 启航篇之uni-app项目搭建

计算机魔术师

8月月更

谷歌Cloud Run现在为AI和批处理提供了无服务器GPU_AI&大模型_Steef-Jan Wiggers_InfoQ精选文章