云原生计算基金会(CNCF)最近宣布,其开源的镜像和文件分发系统Dragonfly已经达到了毕业状态,这是 CNCF 项目生命周期中的最高成熟度级别。这一里程碑标志着 Dragonfly 已具备生产就绪性、广泛行业的采用以及在众多大型组织中对云原生基础设施的扩展,特别是在容器和 AI 工作负载方面,发挥了关键作用。
Dragonfly 通过使用点对点(P2P)加速技术,解决了云原生生态系统中长期存在的挑战,实现了容器镜像、OCI 工件、AI 模型、缓存和其他大文件的高效、稳定和安全分发。该项目运行在 Kubernetes 上,可以通过 Helm 安装,并与 Prometheus 和 OpenTelemetry 等工具集成,用于性能跟踪和遥测,并增强了从 CI/CD 到边缘计算的分发场景。在生产中,CNCF 声称 Dragonfly 将镜像拉取时间从分钟级减少到秒级,并节省了高达 90%的存储带宽,使其成为现代分布式系统的基础组件,这些系统越来越多地受到 GenAI 和大型模型工作负载的驱动。
Dragonfly 的毕业是经过了多年的社区增长和技术演进的结果。它最初由阿里巴巴集团在 2017 年开源,并在 2018 年作为沙箱项目加入 CNCF,经过孵化,现在以来自超过 130 个组织的数百名开发者的贡献毕业,自加入 CNCF 以来,提交活动增加了 3000%以上。第三方安全审计和社区治理及贡献流程的正式化是毕业标准的一部分,强调了其运营成熟度和对开放标准的承诺。
虽然许多与容器相关的工具旨在改进镜像分发和缓存,但 Dragonfly 因其点对点(P2P)分发模型而脱颖而出,该模型减少了带宽使用量,并加速了跨集群的镜像和大文件交付。与传统的注册表代理或缓存层不同,它们只是从中央缓存存储和提供镜像,Dragonfly 创建了一个分布式的对等网络,其中节点直接相互共享工件片段。这种方法可以减少回源注册表负载,并随着更多对等方参与网络,提高了拉取性能,这是单独的注册表缓存解决方案无法在规模上实现的。
相比之下,Harbor和Red Hat Quay等工具为容器镜像提供了强大的代理缓存和拉取缓存功能,将上游工件的副本存储在更接近工作负载的地方以加快检索。这些模型适用于可预测的镜像集和受控环境,但不像 Dragonfly 这样的 P2P 系统那样动态地在对等方之间转移分发负载。同样,像Google Artifact Registry和AWS Elastic Container Registry这样的纯注册表服务专注于安全、可扩展的存储,具有漏洞扫描和复制等功能,而不是分布式交付优化。比较这些方法突出了 Dragonfly 的独特价值主张:在大规模、多节点部署中实现高效、节省带宽的分发,而简单的缓存或镜像注册表可能无法满足需求
展望未来,Dragonfly 社区计划通过旨在加速使用RDMA的 AI 模型权重分发、优化镜像布局以实现更快的数据加载、引入负载感知调度和改进的故障恢复以确保在高流量下的性能和可靠性的增强来继续这一势头。随着毕业,CNCF 和项目维护者表示,Dragonfly 有望继续塑造云原生分发技术,以应对大规模系统中的新挑战。
原文链接:
https://www.infoq.com/news/2026/03/cncf-dragonfly-graduation/





