Sauce Labs 推出 AI 智能体，实现测试创建自动化

Sauce Labs 宣布 Sauce AI for Test Authoring 正式全面上线。这是一款 AI 驱动的智能体，旨在将业务意图直接转化为可执行的测试套件，标志着该公司提出的意图驱动测试（Intent-Driven Testing）时代正式开启。该平台致力于解决软件开发中最耗资源的环节之一——测试用例创建，团队能够用自然语言描述预期行为，并自动生成可自我改进、与框架无关的测试用例，这些测试用例可在云端和 CI/CD 环境中运行。

此次发布针对现代 DevOps 中日益突出的瓶颈问题。随着生成式 AI 加速代码产出（通常将开发速度提升多达十倍），测试环节却难以跟上节奏。Sauce Labs 指出，企业目前将 22% 至 25% 的 IT 预算用于质量保证，但开发人员仍将超过 30% 的时间花在编写和维护测试用例上。与此同时，复杂用户流程的自动化测试覆盖率往往徘徊在 35% 以下，而团队却要将高达 40% 的时间用于修复脆弱或"不稳定"的测试用例。

Sauce AI for Test Authoring 引入了一种新模式，用业务意图取代手动脚本编写。该平台可以解读应用程序工作流、产品规格，甚至来自 Figma 等工具的设计输入，为 Web 和移动端环境生成完整的测试套件。工程师、产品经理以及非技术利益相关者都可以用通俗语言描述预期行为，让系统生成可执行的测试用例，并通过反馈循环持续迭代优化。

这种方法旨在通过消除编码门槛来普及测试自动化，让传统工程角色之外的领域专家也能直接为质量保证做出贡献。它还引入了持续学习机制，使测试能够随应用一起演进，减少维护开销并提升长期可靠性。

该平台聚焦于软件测试中三个长期存在的挑战：效率、覆盖率和可维护性。Sauce Labs 称，测试创建速度提升高达 90%，用户流程覆盖率近乎完整，并且测试脚本更加稳定，能够适应应用的变更。内置的审查和编辑功能确保人工的监督介入，而自主学习机制可持续提升测试的精准度与适配性。

一个关键的差异化优势是 Sauce Labs 所称的“数据护城河”——一个源自 87 亿次真实测试运行的数据集。这使得它对应用行为的理解更加准确，根因分析速度也优于通用 AI 模型。该公司报告称，这能将问题诊断速度提升高达 41%，尤其是在复杂的企业环境中。

意图驱动测试的出现反映了软件工程领域正在发生一场更为广泛的转变：在 AI 加速开发的大背景下，测试验证环节正成为主要瓶颈。随着代码生成速度变得越来越快、越来越自动化，确保质量、可靠性和可信度已成为新的瓶颈。

Sauce Labs 将这款新产品定位为 DevOps 实践的一次基础性变革，从手动、基于脚本的测试转向自主、自适应的质量系统。该平台将 AI 嵌入测试编写流程，旨在缩小开发速度与验证能力之间的差距，让企业能够同步拓展两者的规模。

该平台面向企业客户开放，并与 Sauce Labs 现有的测试云和设备基础设施集成。早期采用者报告称，在入门适配效率与整体研发生产力上均有显著提升，尤其是在以往需要大量设置和专业知识的移动端测试场景中。

Sauce Labs 发布 Sauce AI for Test Authoring 后，行业和社区的早期反响呈现出一种基于实际价值而非跟风炒作的乐观态度。The New Stack 的报道指出，该平台实现了向自然语言驱动测试的转变，并印证了其最大的直接价值在于加速测试编写、减少对专业自动化技能的依赖。这也契合业内从业者的普遍观点：意图驱动模式可能有助于解决 AI 生成代码速度加快与验证周期较慢之间的瓶颈问题，尤其是能够让 QA 分析师和产品相关负责人更广泛参与测试工作，不再将测试自动化局限于研发工程师群体。

与此同时，测试社区中也出现了更为理性的批判声音，一些长期存在的挑战仍未得到大规模的验证，包括在复杂用户流程中实现高覆盖率，以及在动态环境中减少不稳定测试。Test Management Tool Solutions 等行业分析机构指出，虽然 AI 辅助测试生成技术发展迅速，但可靠性、可维护性以及边缘场景处理能力依旧是企业选型落地的核心考量因素。综上所述，Sauce Labs 的此次发布是迈向意图驱动测试的一次有益探索，但最终价值仍取决于它在真实、大规模工程场景中的实际落地表现。

这项技术最直接的对标产品来自 TestMu AI（前身为 LambdaTest）和 mabl，它们同样强调自然语言驱动的测试创建和基于智能体的自动化。TestMu AI 的 KaneAI 智能体可让团队依据高层业务目标生成并迭代测试用例，同时支持从 Selenium、Cypress 等现有测试框架平滑迁移，帮助团队轻松接入 AI 能力，无需全盘重写原有用例。

mabl 将自身定位为“数字队友”，借助 AI 基于用户故事自动构建端到端测试，并在应用程序发生变更时持续同步更新。它的自适应自动修复功能能够在 UI 发生变动时自动调整测试步骤与元素定位器，大幅降低维护成本，而这也正是 Sauce Labs 瞄准的最大痛点之一。

其他平台在覆盖率拓展与智能优化方面各有差异。Testsigma 和 Katalon 等工具专注于自动识别测试覆盖率中的缺口，并生成额外场景以提升质量，同时支持用自然语言创建测试，让非工程人员也能使用。同样，Testim（Tricentis 旗下产品）强调 AI 驱动的稳定性，使用机器学习锁定 UI 元素并动态调整测试，减少复杂应用场景下的不稳定性。

原文链接：

https://www.infoq.com/news/2026/04/sauce-labs-ai-test-creation/

创作场景

Sauce Labs 推出 AI 智能体，实现测试创建自动化