AI实践哪家强?来 AICon, 解锁技术前沿,探寻产业新机! 了解详情
写点什么

Docker 扩展 Compose,新增 Cloud Offload 支持

  • 2025-07-16
    北京
  • 本文字数:1110 字

    阅读完需:约 4 分钟

大小:509.35K时长:02:53
Docker扩展Compose,新增Cloud Offload支持

Docker 推出了一个新特性,允许开发者使用Docker Compose定义、构建和运行代理,目的是简化代理开发流程并减少重复性任务。此外,Docker Offload 目前处于测试阶段,它提供了一种方法,可以无缝地将模型构建和运行卸载到远程 GPU 算力。

 

支持使用 Docker Compose 定义代理,是 Docker 将自己定位为代理开发关键工具提供商后又迈进了一步,就像它为基于容器的开发所做的那样。正如来自 Docker 的 Mark Cavage 和 Tushar Jain 所言,这意味着简化代理开发通常会涉及的繁琐的重复任务,例如遍历不同的模型、安全地连接 MCP 工具,以及将一切打包,使团队成员可以很轻松地运行相同的工作流。

 

新特性允许开发者在compose.yaml文件中声明开放模型、代理和 MCP 工具,然后使用docker compose up构建和运行它们。Docker Compose 可以与许多现有的代理框架集成,包括 LangGraph、Embabel、Vercel AI、Spring AI、CrewAI、Google ADK 和 Agno。

 

为了帮助开发者开始使用 Docker Compose 进行代理开发,Docker 创建了一个 GitHub 仓库,其中包含它所支持的所有框架的示例项目。例如,有一个例子展示了如何使用 Google ADK 构建一个协作式多代理事实检查器:

 

Critic 代理利用实时互联网搜索来收集证据,通过 Model Context Protocol(MCP)使用 DuckDuckGo,而 Reviser 代理仅使用内部推理分析和完善结论。该系统展示了具有不同角色和工具的代理如何通过编排实现协作。

 

相应的compose.yaml文件定义了两个服务:adkmcp-gateway,并包括一个models部分,列出了使用的模型及其参数。在Docker Desktop 4.40中,Docker 提供了使用 Model Runner 在本地打包和运行模型的可能性,但你也可以通过提供适当的凭据使用远程或基于云的模型。

 

Docker Compose 的模块化架构使得创建用于多代理配置的 compose override 文件变得很容易。例如,你可以定义一个变体,使用 OpenAI 而不是本地模型,或者使用Google Cloud Run。这使你能够组合多个 compose 文件,轻松切换代理设置:

 

docker compose -f compose.yaml -f compose.openai.yaml up --build
复制代码

 

Docker Desktop 最新版本支持的另一个代理开发新特性是 Docker Offload。当本地资源不足时,这项全托管服务可以用作 Docker Model Runner 的直接替代品,使开发者能够在云 GPU 上使用与本地部署相同的工作流透明地运行模型和容器。

 

Docker Offload 通过将计算密集型工作负载(如大型语言模型和多代理编排)卸载到高性能云环境,帮你摆脱基础设施限制。无需复杂的设置,不再有 GPU 短缺,不用为配置头疼。

 

该服务目前处于测试阶段,Docker 为开发者提供了 300 分钟的免费试用时间。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:

https://www.infoq.com/news/2025/07/docker-compose-agent-gpu-offload/

2025-07-16 10:011

评论

发布
暂无评论

JVM字节码分析与修改:探索代码覆盖率底层实现框架

测吧(北京)科技有限公司

测试

AlphaGPT在法律大模型圈子火了,案件仅需3分钟搞定

科技汇

数据要素×工业制造:500强大型制造集团携手奇点云,以数据为经营管理提效

奇点云

数字化 奇点云 数据要素 工业制造

实战代码静态分析工具:利用语法树数据工具提升代码质量

测吧(北京)科技有限公司

测试

Alpha律所管理系统,助力律师团队管理提效再升级

科技汇

一个基于.NET Core构建的简单、跨平台、模块化的商城系统

不在线第一只蜗牛

小程序 .net core

如何提升买家对独立站的信任感?提升转化率的技巧

技术冰糖葫芦

API 接口 API 文档

JavaScript混淆工具选择与使用指南

【FAQ】HarmonyOS SDK 闭源开放能力 —Scan Kit

HarmonyOS SDK

HarmonyOS

码上时刻|通过逻辑视图 Logic View 快速实现批流一体

Kyligence

代码覆盖率提升策略:利用静态分析工具优化测试覆盖率

测吧(北京)科技有限公司

测试

TikTok直播专线:解决出海网络问题痛点,提升商业效率

Ogcloud

海外直播专线 海外直播 tiktok直播 tiktok直播专线 tiktok直播网络

数字化工厂MES/MOM一体化解决方案PPT

工赋开发者社区

RocketMQ 流数据库解析:如何实现一体化流处理?

阿里巴巴云原生

阿里云 RocketMQ 云原生

【FAQ】HarmonyOS SDK 闭源开放能力 —IAP Kit

HarmonyOS SDK

HarmonyOS

自定义Elasticsearch索引模式:优化数据存储结构以提高检索效率

测吧(北京)科技有限公司

测试

如何利用ChatGPT进行翻译--精准翻译篇

三七互娱后端技术团队

AI翻译

深度解析代码变更对业务的影响范围:业务影响范围关联分析

测吧(北京)科技有限公司

测试

互联网公司裁员现象调查:探寻背后原因与应对策略

小魏写代码

搭建Elasticsearch、Kibana和Logstash环境:构建强大的数据分析平台

测吧(北京)科技有限公司

测试

利用Shell二次封装Elasticsearch客户端:简化数据检索与操作

测吧(北京)科技有限公司

测试

利用Elasticsearch进行文本数据的深度分析

测吧(北京)科技有限公司

测试

数据可视化与分析:利用Kibana展现数据的视觉化洞见

测吧(北京)科技有限公司

测试

左手医生:医疗 AI 企业的云原生提效降本之路

阿里巴巴云原生

阿里云 容器 云原生

大模型+医疗,优质数据助力新生态建立

澳鹏Appen

数据标注 大模型 医疗大模型

聊聊低代码产品的应用场景

互联网工科生

深入了解一下http和https的区别

秃头小帅oi

AI足球教练上岗利物浦,射门机会提高13%!来自DeepMind,网友:这不公平

Openlab_cosmoplat

AI

如何利用ChatGPT进行翻译--通用翻译篇

三七互娱后端技术团队

AI翻译

Docker扩展Compose,新增Cloud Offload支持_架构_Sergio De Simone_InfoQ精选文章