50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

IBM Cloud Code Engine Serverless Fleets 配备 GPU 以实现高性能人工智能和并行计算

作者:Steef-Jan Wiggers

  • 2025-10-23
    北京
  • 本文字数:1183 字

    阅读完需:约 4 分钟

大小:577.49K时长:03:17
IBM Cloud Code Engine Serverless Fleets配备GPU以实现高性能人工智能和并行计算

IBM 战略性全托管无服务器平台IBM Cloud Code Engine引入了支持集成 GPU 的 Serverless Fleets。凭借这项新能力,该公司直接解决了在简化版按需付费无服务器模型上运行大规模计算密集型工作负载的挑战,如企业级人工智能、生成式人工智能、机器学习和复杂仿真。

 

正如学术论文中所指出的那样(包括康奈尔大学最近发表的一篇论文),历史上,无服务器技术在高效支持这些要求苛刻的并行工作负载方面存在困难,这类负载通常需要使用专用的硬件同时执行数千或数百万个任务。通过 Serverless Fleets,IBM 旨在通过提供高性能计算资源来弥合这一差距,而且又不需要用户应对管理专用基础设施的操作复杂性。

 

Michael Behrendt 是无服务器平台首席技术官兼 IBM 杰出工程师,他在 LinkedIn 上的一篇博文中评论道:

 

在很大程度上,这项能力的架构灵感来自在数十万个处理器上运行现实世界的大型工作负载。它的构建方式非常健壮,以至于可以在几乎没有 SRE 人员的情况下运行这些工作负载。

 

Serverless Fleets 提供了单个端点用于提交大量的批处理作业,简化了数据科学家和开发人员执行计算密集型任务的方式。在这篇博文中,IBM 提到,Code Engine 随后会自动处理基础设施编排:

 

  • 该服务会自动配置所需的计算资源,包括虚拟机(VM)和无服务器图形处理单元(GPU),如 NVIDIA L40,以便可以同时运行多个任务。

  • 此外,Serverless Fleets 旨在运行可弹性扩展的运行至完成任务。该系统会确定所需的工作实例的最优数量并将其部署,以便高效处理并行执行。

  • 最后,当工作负载完成后,资源将自动移除,确保用户仅需为执行过程中实际消耗的技术资源付费。

 

随着 IBM Cloud Code Engine Serverless Fleets 的推出,公司带来了一项极具竞争力的服务。在其他超大型提供商中,亚马逊云科技提供了AWS Fargate这样的解决方案,用于在无服务器计算上运行容器(通常搭配 EKS 或 ECS 进行编排),而 Azure 在Container Apps中提供了Serverless GPU。然而,IBM 致力于提供一个统一的环境,通过单个简单的平台为 Web 应用、函数以及现有的大量 GPU 加速的批处理作业提供服务。

 

竞争对手可能需要开发人员将多个服务(如无服务器运行时、容器服务和批处理编排器)拼接在一起,Serverless Fleets 则旨在简化这一过程,通过单个端点就可以完全管理基于 GPU 的虚拟机的配置和弹性扩展,减少了通常与在云中运行 GPU 密集型弹性工作负载相关的复杂性和运营开销。在 Medium 上的一篇博文中,Luke Roy 总结道:

 

无论你是在进行媒体处理、AI 推理还是科学工作负载,IBM Cloud Code Engine Serverless Fleets 都提供了一个健壮且对开发者友好的解决方案。

 

在一篇博文中,该公司表示,在当今竞争激烈的格局中,各行各业的企业都需要能够快速、便捷地交付服务,同时优先考虑安全性、弹性和成本节省。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/10/ibm-cloud-code-engine-serverless/

2025-10-23 11:313

评论

发布
暂无评论

【浪潮云说】直播间第七期今日准时开播!

云计算运维

训练千亿参数模型的法宝,昇腾CANN异构计算架构来了~

华为云开发者联盟

盘古 CANN 千亿参数模型 异构计算 计算架构

最近很火的低代码到底是什么?

禅道项目管理

大前端 测试开发 语言 & 开发

解析ThreadPoolExecutor类是如何保证线程池正确运行的

华为云开发者联盟

线程池 任务 注释 Worker类

阿里巴巴新产“Java架构核心宝典”,全是流行技术,限时开放

Java 架构 面试 后端 计算机

信息爆炸!78天闭门深造千页SpringCloud,再战京东

Java~~~

Java spring 架构 面试 Spring Cloud

易华录 X ShardingSphere|葫芦 App 后台数据处理的逻辑捷径

SphereEx

数据库 开源

国产接口工具ApiPost如何利用CryptoJS对请求参数进行MD5/AES加解密

Proud lion

大前端 后端 加密解密 Postman 接口文档

最近很火的低代码到底是什么?

禅道项目管理

低代码 可视化 低代码平台

接口测试,负载测试,并发测试,压力测试区别

与风逐梦

软件测试 接口测试

故事点数VS工时,研发工作量到底怎么算?

LigaAI

敏捷开发 故事点数 工时 研发工作量

CompletableFuture真香,可以替代CountDownLatch!

架构 面试 后端 计算机

一个内核漏洞详解:容器逃逸

程序员 架构 面试 计算机

面试Go语言开发?让这本书帮你感动面试官!

博文视点Broadview

🏆【Alibaba微服务技术系列】「Dubbo3.0技术专题」回顾Dubbo2.x的技术原理和功能实现及源码分析(温故而知新)

码界西柚

dubbo RPC 8月日更 Dubbo3

三面阿里被挂,竟获内推名额,历经5面拿下口碑offer(Java后台)

Java 程序员 架构 面试 计算机

一起吐槽接口文档

FunTester

接口文档 接口测试 API Jira FunTester

带你走进MySQL全新高可用解决方案-MGR

vivo互联网技术

数据库 分布式 MySQL 高可用

百度信誉认证中台架构解析

百度Geek说

后端 软件架构 中台架构

自主创新国产化科技:智能制造之 SMT 产线监控管理可视化

一只数据鲸鱼

数据可视化 工业4.0 制造业 智慧工厂

图灵奖得主大全 深度学习经典论文翻译合集 John 易筋 ARTS 打卡 Week 62

John(易筋)

ARTS 打卡计划

轮询锁在使用时遇到的问题与解决方案!

王磊

8月日更

适女化科技(二):让女性更安全的两条技术路径:软件硬件化与硬件软件化

脑极体

数仓出现“wait in ccn queue”的时候,怎么迅速定位处理?

华为云开发者联盟

线程 hash 负载 数仓 GaussDB(DWS)

开源demo| 视频应用类开源 Demo 大盘点

anyRTC开发者

音视频 视频直播 直播连麦 视频通话

Golang并发操作中常见的死锁情形

Regan Yue

协程 Go 语言 8月日更

Vue进阶(八十六):iframe 结合 window.postMessage 实现跨域通信

No Silver Bullet

Vue 8月日更 iframe

突破四大要素  飞算SoFlu助力企业实现DevOps落地

飞算JavaAI开发助手

DevOps 自动化 软件工程

Hadoop MapReduce原理、序列化

Mike

互动直播应用快速开发实践(基于声网)

大伟

云小课|原来云备份不仅仅是能备份...

华为云开发者联盟

云备份 迁移数据 复制备份

IBM Cloud Code Engine Serverless Fleets配备GPU以实现高性能人工智能和并行计算_云计算_InfoQ精选文章