写点什么

深入了解谷歌全球服务体系中的 A/B 测试协调系统

作者:Leela Kumili
  • 2026-06-10
    北京
  • 本文字数:1083 字

    阅读完需:约 4 分钟

谷歌详细介绍了他们如何在各项服务中开展全平台大规模 A/B 测试,并介绍了一套内部系统,用于对大规模产品进行一致、可靠的测试。该方法聚焦于让团队能够在分布式基础设施上安全地运行实验,同时保持统计严谨性,并最大限度地减少实验之间的干扰。

从本质上讲,该系统旨在解决大型组织在运营众多互联服务时面临的共同挑战:当流量横跨多层基础设施、用户界面和后端系统时,如何确保实验能产生可信的因果信号。随着实验在产品开发中的应用日益普及,分配不一致、实验重叠以及遥测数据分散等问题可能会降低洞察的质量。谷歌的方法旨在对这一系列服务中的实验分配和测量进行标准化。

该系统提供了一个集中式的实验框架,用于协调如何将用户或请求分配到实验变体中。谷歌并未依赖于针对每个产品或服务的独立实现,而是采用共享基础设施来管理实验配置、分配逻辑和曝光日志记录。这有助于确保用户在与不同实验的多个服务或功能交互时,仍然能够被一致地分配到相应的实验组中。

谷歌基础设施实验流程(图片来源:谷歌博客

其中一个关键的组件是统一分配层,它决定了流量在各个实验之间的分配方式。该层支持层级化分配,既允许在技术栈的不同层级开展实验,又能减少重叠测试之间的冲突。它还确保了针对特定用户或会话的分配具有确定性,这对于避免变体之间的交叉影响以及随时间推移保持稳定的实验曝光至关重要。

为了保证测量结果的正确性,这套系统重点强调了曝光日志采集:它会准确记录用户在何时、通过何种方式实际接触到了实验处理方案,让下游分析系统可以区分”仅被分配了分组“和”真正接触到实验“两类用户,显著提升了指标统计的可靠性。平台还内置了安全护栏机制,防止实验超出配置的流量上限或是违反安全约束。

谷歌还强调了在整个基础设施中传播配置的重要性。实验定义会被分发到服务系统中,使服务能够在本地评估实验状态,从而降低延迟,减少运行时对集中式调用的依赖。这种设计支持需要实时决策的高吞吐量环境。

在 LinkedIn 的一篇帖子中,digi edZe 副总裁 Anil Bhagavatula 强调了这一方法。他指出:

关键在于,基础设施实验不仅仅涉及代码调整;它需要一个安全强大且统计严谨的框架,将数据中心视为一个实验室。

实验基础设施与分析管道紧密集成,后者负责汇总跨服务的结果。这使团队不仅能够评估变更在单个服务层面的影响,还能评估其在端到端用户旅程中的影响。通过标准化分配和测量流程,该系统降低了产品团队的运维负担,并加速了迭代周期。通过将实验基础组件整合到共享基础设施中,该公司旨在提升整个生态系统产品决策的速度和可信度。

原文链接:https://www.infoq.com/news/2026/06/google-fleet-ab-experimentation/