写点什么

IBM Cloud Code Engine Serverless Fleets 配备 GPU 以实现高性能人工智能和并行计算

作者:Steef-Jan Wiggers

  • 2025-10-23
    北京
  • 本文字数:1183 字

    阅读完需:约 4 分钟

大小:577.49K时长:03:17
IBM Cloud Code Engine Serverless Fleets配备GPU以实现高性能人工智能和并行计算

IBM 战略性全托管无服务器平台IBM Cloud Code Engine引入了支持集成 GPU 的 Serverless Fleets。凭借这项新能力,该公司直接解决了在简化版按需付费无服务器模型上运行大规模计算密集型工作负载的挑战,如企业级人工智能、生成式人工智能、机器学习和复杂仿真。

 

正如学术论文中所指出的那样(包括康奈尔大学最近发表的一篇论文),历史上,无服务器技术在高效支持这些要求苛刻的并行工作负载方面存在困难,这类负载通常需要使用专用的硬件同时执行数千或数百万个任务。通过 Serverless Fleets,IBM 旨在通过提供高性能计算资源来弥合这一差距,而且又不需要用户应对管理专用基础设施的操作复杂性。

 

Michael Behrendt 是无服务器平台首席技术官兼 IBM 杰出工程师,他在 LinkedIn 上的一篇博文中评论道:

 

在很大程度上,这项能力的架构灵感来自在数十万个处理器上运行现实世界的大型工作负载。它的构建方式非常健壮,以至于可以在几乎没有 SRE 人员的情况下运行这些工作负载。

 

Serverless Fleets 提供了单个端点用于提交大量的批处理作业,简化了数据科学家和开发人员执行计算密集型任务的方式。在这篇博文中,IBM 提到,Code Engine 随后会自动处理基础设施编排:

 

  • 该服务会自动配置所需的计算资源,包括虚拟机(VM)和无服务器图形处理单元(GPU),如 NVIDIA L40,以便可以同时运行多个任务。

  • 此外,Serverless Fleets 旨在运行可弹性扩展的运行至完成任务。该系统会确定所需的工作实例的最优数量并将其部署,以便高效处理并行执行。

  • 最后,当工作负载完成后,资源将自动移除,确保用户仅需为执行过程中实际消耗的技术资源付费。

 

随着 IBM Cloud Code Engine Serverless Fleets 的推出,公司带来了一项极具竞争力的服务。在其他超大型提供商中,亚马逊云科技提供了AWS Fargate这样的解决方案,用于在无服务器计算上运行容器(通常搭配 EKS 或 ECS 进行编排),而 Azure 在Container Apps中提供了Serverless GPU。然而,IBM 致力于提供一个统一的环境,通过单个简单的平台为 Web 应用、函数以及现有的大量 GPU 加速的批处理作业提供服务。

 

竞争对手可能需要开发人员将多个服务(如无服务器运行时、容器服务和批处理编排器)拼接在一起,Serverless Fleets 则旨在简化这一过程,通过单个端点就可以完全管理基于 GPU 的虚拟机的配置和弹性扩展,减少了通常与在云中运行 GPU 密集型弹性工作负载相关的复杂性和运营开销。在 Medium 上的一篇博文中,Luke Roy 总结道:

 

无论你是在进行媒体处理、AI 推理还是科学工作负载,IBM Cloud Code Engine Serverless Fleets 都提供了一个健壮且对开发者友好的解决方案。

 

在一篇博文中,该公司表示,在当今竞争激烈的格局中,各行各业的企业都需要能够快速、便捷地交付服务,同时优先考虑安全性、弹性和成本节省。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/10/ibm-cloud-code-engine-serverless/

2025-10-23 11:316605

评论

发布
暂无评论

BSN-DDC基础网络详解(三):注册门户账号和业务开通(2)

BSN研习社

BSN-DDC

ChatGPT“狂飙”出圈,快来分享你眼中的ChatGPT吧!

InfoQ写作社区官方

热门活动 ChatGPT

EasyNLP集成K-Global Pointer算法,支持中文信息抽取

阿里云大数据AI技术

人工智能 深度学习 信息抽取 算法模型 企业号 2 月 PK 榜

JS词法环境和执行上下文

hellocoder2029

JavaScript 前端

打造江西数智产业高地,百度飞桨人工智能产业赋能中心落户南昌青山湖

飞桨PaddlePaddle

飞桨 PaddlePaddle

互联网企业如何进行数字化转型?业务需求迭代频繁的应对之策!

优秀

数字化转型 互联网行业

“四维一体”,银行数据使用安全新姿势|盾见

极盾科技

数据安全

Selenium启动IE11常见问题解决方法

自动化测试 selenium IE

Flink CDC+Kafka 加速业务实时化

Apache Flink

大数据 flink 实时计算

python+requests+excel+unittest+ddt接口自动化数据驱动并生成html报告(优化版)

Python 单元测试 自动化测试 unittest 测试框架

手把手教你为基于Netty的IM生成自签名SSL/TLS证书

JackJiang

集度汽车 Flink on native k8s 的应用与实践

Apache Flink

大数据 flink 实时计算

龙蜥开发者说:为爱发电!当一个龙蜥社区打包 Contributor 是怎样的体验?| 第16期

OpenAnolis小助手

Linux 开源 rpm 龙蜥社区 贡献

中移链结合CA证书实现节点准入控制

BSN研习社

Jmeter安装配置详细教程

Jmeter 性能测试 接口测试

一文详解 Netty 组件

京东科技开发者

Java 架构 Netty nio 企业号 2 月 PK 榜

Python基础知识入门(一)

漫步桔田

前端监控之性能与异常

京东科技开发者

监控 服务端 页面 企业号 2 月 PK 榜 js代码

DevEco Studio 3.1 Beta1版本发布——新增六大关键特性,开发更高效

HarmonyOS开发者

HarmonyOS

秒懂算法 | 基于朴素贝叶斯算法的垃圾信息的识别

TiAmo

机器学习 算法 过滤算法

2023年关于身份安全的4 个预测

HummerCloud

春季3月 · CSPO认证周末班【提前报名特惠】“价值交付课程” | 全国招生

ShineScrum

产品经理 PO Product Owner 产品负责人 产品愿景

基于selenium的UI自动化实践

Python 自动化测试 selenium

Pycharm+PyQt5+Python3.5开发环境配置(详细教程)

Python pycharm 环境安装 PyQt PyQt5

春季3月 · CSM认证周末班【提前报名特惠】“全球金牌课程”CST导师亲授

ShineScrum

ScrumMaster CSM

Serverless Kubernetes的思考与征程

阿里技术

Kubernetes Serverless

最佳实践|用腾讯云智能文字识别实现网约车信息管理

牵着蜗牛去散步

人工智能 腾讯云 腾讯 最佳实践 文字识别

IBM Cloud Code Engine Serverless Fleets配备GPU以实现高性能人工智能和并行计算_云计算_InfoQ精选文章