Cloudflare 推出 Workflows V2。经过更新的执行模型可以用于在其开发平台上对分布式应用程序中有状态的多步骤工作流进行编排。这次发布旨在提升此类分布式执行工作负载的可靠性、可扩展性和可观测性,同时引入了一种确定性且可重放的工作流架构。
工作流提供了一种机制,可以在 API、队列和存储系统等服务之间协调长期运行的业务逻辑和后台处理,并且可以在发生故障时保持执行状态和可靠性。初始版本(V1)引入了用于串联多步骤流程的持久执行原语,但在扩展性、可观测性以及故障条件下的重放行为方面仍然存在一些局限性,尤其是在高吞吐量场景中。
借助 Workflows V2,Cloudflare 提升了关键性的扩展限制,可以支持要求更高的应用程序。该平台现在允许最多 50000 个并发工作流实例(此前为 4500 个),并支持每个账户每秒最多 300 次的新工作流执行(此前为 100 次)。队列容量也已经扩展至每个工作流 200 万个实例,是此前限额的两倍。这些更新旨在支持事件驱动型系统,包括 AI 代理、数据管道以及在全球范围内运行的大规模后台处理工作负载。
Cloudflare 工程师重点介绍了这一新模型:
V2 使我们能够更轻松地分析执行过程并从故障中恢复,同时避免重复工作。
Workflows V2 使开发人员能够定义基于事件的持久化工作流,在保持执行状态的同时,协调跨 API、队列和存储系统的任务。通过在多个步骤之间持久化状态,并自动处理重试、超时和故障,该平台减少了对自定义编排逻辑的需求。该系统还提升了开发体验,包括更清晰的步骤定义以及更好的与应用逻辑的对齐。常见用例包括多步骤业务流程、数据同步管道以及需要在较长时间内可靠执行的 AI 推理工作流。
V2 版本的一项关键架构变更在于引入了基于步骤的确定性执行模型。每个工作流步骤都是隔离的、可重放的且具有幂等性,这使得系统能够在不重新执行已完成步骤的情况下从故障中恢复。该功能依托于持久化状态管理和执行跟踪机制,使工作流能够从最后一个成功的步骤继续执行。该架构基于 Cloudflare 的分布式运行时构建,集成了用于计算的 Workers、用于事件采集的 Queues,以及用于跨区域协调和保持状态一致性的 Durable Objects。
/filters:no_upscale()/news/2026/05/cloudflare-workflows-v2-release/en/resources/2cloudflarev2workflow-1777438105526.jpeg)
Workflows V2 架构概览(图片来源:Cloudflare 博客)
更新后的模型还增强了对并行执行和分支的支持。相互独立的步骤可以并行运行,从而支持数据处理和 AI 管道中常用的扇出和扇入模式。得益于步骤级追踪、执行历史记录和调试工具,可观测性也得到了增强,开发人员可以检查工作流的进度,并在生产环境中诊断故障。
Cloudflare 表示,增强确定性是其核心设计原则之一:
每个步骤都被设计成可以在重试时安全地重放,从而保证工作流的行为可预测。
从 Workflows V1 迁移到 V2 需要采用明确的基于步骤的模型以及更新后的 API。虽然核心概念保持不变,但工作流必须按照新的执行语义重新构建为相互隔离且可重放的步骤。Cloudflare 指出,更新后的模型增强了工作流执行管理工具,提升了可调试性、运维清晰度以及长期可维护性。
原文链接:https://www.infoq.com/news/2026/05/cloudflare-workflows-v2-release/





