写点什么

Istio 引入多集群、环境模式及推理功能,应对 AI 时代的不断发展

作者:Craig Risi
  • 2026-04-10
    北京
  • 本文字数:1630 字

    阅读完需:约 5 分钟

云原生计算基金会(CNCF)宣布了 Istio 的重大升级,引入了一些新功能,旨使这个服务网格能够适应未来需求以支持 AI 驱动的工作负载。本次更新于 2026 年在 KubeCon + CloudNativeCon 欧洲大会上发布,包含对环境(ambient)多集群部署的测试版支持、全新的网关 API 推理扩展,以及智能体网关的实验性集成。这些功能旨在简化运维,同时为现代分布式系统提供更智能的流量管理。

 

本次发布反映了云原生基础设施领域存在的一个广泛转变,即越来越多的组织开始在Kubernetes上运行 AI 工作负载。根据 CNCF 的数据,尽管目前已有 66%的企业在 Kubernetes 上运行生成式 AI 工作负载,但仅有极少数能实现每日部署的速度,而运维复杂性是主要障碍。Istio 的新功能旨在通过简化服务网格的采用,并将 AI 感知型流量路由直接嵌入平台基础组件中来弥补这方面的不足。他们将该项目定位为下一代基础设施的基础层。

 

本次更新的核心功能是环境多集群支持。该功能将 Istio 的无 sidecar“环境模式(ambient mode)”扩展至多个集群,使团队能够在不同区域或云服务提供商之间管理流量、安全性和可观测性,同时避免了传统 sidecar 代理带来的运维开销。通过降低复杂性,该功能旨在让平台团队能够更轻松地进行多集群部署,并提升其可扩展性。

 

与之相辅相成的是网关API推理扩展,它将机器学习推理直接集成到服务网格的流量流中。这使得用户能够通过所熟悉的 Kubernetes 原生 API 对 AI 推理请求进行一致的路由、控制和可观测性管理,将应用程序网络与 AI 工作负载之间的差距降至最低。引入智能体代理这个实验性数据平面,表明该系统正朝着处理 AI 驱动的动态流量模式迈进,特别是在模型、智能体和服务交互日益复杂的环境中。

 

这些更新标志着服务网格正从传统的微服务基础设施向具备 AI 感知能力的平台基础组件的广泛演进。从历史上看,Istio 一直专注于管理服务间通信、安全性和可观测性。本次发布将功能扩展至协调 AI 推理流量,并使平台工程师能够为生成式 AI 和基于智能体的系统等新兴工作负载构建防护机制。

 

这一转变也反映了业界对平台工程团队的期望有了变化,他们在确保 AI 部署安全、可扩展方面承担着越来越重要的责任。通过将推理路由和多集群流量控制等功能直接嵌入到网状架构中,Istio 减少了对定制化工具和分散式架构的需求,这符合行业的发展趋势:即构建统一的平台层,在抽象化复杂性的同时保持灵活性。

 

CNCF 管理层表示,本次发布是 Istio 为满足现代基础设施需求而进行的长期演进的一部分。随着 AI 工作负载日益呈现分布式、延迟敏感及动态化的特征,服务网格有望在跨环境可靠性、安全性和可观测性方面发挥关键的作用。

 

尽管 Istio 对自身的定位依然是功能丰富且可扩展的服务网格(尤其是带来聚焦 AI 的新功能),但在解决类似的挑战时,这个生态系统中的其他平台采取了截然不同的方法。例如,Linkerd(被广泛视为一种轻量级且注重性能的替代方案)优先考虑的是简单性、更低的延迟和易用性,而非高级流量管理功能。对于希望快速部署且所需开销最小的团队,这极具吸引力。但通常来说,它缺乏 Istio 在路由、策略和可扩展性方面的深度。另一方面,Consul则通过多平台和混合云支持来凸显自身优势,可在 Kubernetes、虚拟机及其他运行时环境中提供服务网格功能,尽管这往往会增加运维复杂性。

 

从更广泛的角度来看,服务网格的特点体现了功能、性能与运维简便性之间的权衡。通常,Istio 被视为最先进的选择。它提供了深度流量控制、安全策略和可观测性,但代价是更高的资源消耗和复杂性。相比之下,新兴的替代方案——包括无 sidecar 模型和基于eBPF的网络架构(如 Cilium)——正致力于降低开销并实现更紧密的内核级集成,这与 Istio 向“环境模式”演进的方向如出一辙。

 

不过,有一个明显的趋势正在所有平台上显现:服务网格正从传统的微服务网络演变为平台级控制平面,能够支持日益复杂多变的工作负载,包括 AI 推理、多集群部署以及基于策略的流量管理。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2026/04/istio-ai-multicluster/