写点什么

Agent 技术演进与落地:从工具到伙伴的生产力变革|AICon 北京

  • 2025-11-28
    北京
  • 本文字数:1133 字

    阅读完需:约 4 分钟

大小:543.95K时长:03:05
Agent 技术演进与落地:从工具到伙伴的生产力变革|AICon北京

Sauce Labs 推出了Sauce AI for Insights。这套全新的基于 AI 的分析功能据称将改变团队解读测试数据并采取行动的方式。

 

该公司对这个系统的定位是首个专为软件质量智能打造的 AI 代理,旨在将海量测试输出转化为工程师和领导者能够即时理解的答案。

 

开发过程中,他们在对 Web 和移动应用进行内部基准测试时发现,团队识别根本原因的速度比手动检查快近 100 倍,即使是在最慢、最复杂的情况下也是如此。

 

Sauce Labs 指出,现在,经过扩展的交付管道所产生的数据比较多,大多数团队都无法轻松解释。日志和环境信息会在多次构建中不断累积,审查这些信息所需的时间可能会比测试本身更拖慢发布速度。公告还援引了他们内部研究中的一项发现,工程师四分之一的工作时间都耗费在与测试相关的事务上,对于需要大量时间来管理脚本和配置的人员而言尤其如此。

 

Sauce Labs 首席执行官 Prince Kohli 在新闻发布会上表示,现在面临的主要挑战不再是收集数据,而是理解数据。“我们的测试基础设施已经运行 17 年了,我们的经验是:问题不在于生成测试数据,而是我们被数据淹没了。问题在于,解读这些数据已然成为一项专业知识。”

 

该系统使用自然语言呈现情境化答案、可视化摘要及相关工件的链接,并根据用户角色动态调整信息的详略程度。

 

Beta 测试用户报告说,问题识别更快,调试周期更短,在发布准备期间可以提供更好的可见性。Sauce Labs 首席产品官 Shubha Govil 在新闻发布会上表示,该工具可以帮助团队更快地采取有针对性的行动。“我们的 Beta 测试客户向我们展示了该工具带来的全面影响:其高管团队获得了推动业务决策的质量指标,而工程团队则获得了更强大的诊断能力,能在数分钟而非数小时内解决问题。”

 

这一报道也使 Sauce AI for Insights 进入了广泛的 AI 测试工具市场。BrowserStack PercyApplitoolsFunctionize等平台都旨在解决类似的挑战,但关注的领域更狭窄。

 

BrowserStack Percy 专注于视觉回归测试,帮助团队检测跨浏览器和设备的布局问题。它的优势在于提供视觉对比,而非公告中所描述的对话式、情境感知型洞察。

 

Applitools 专注于视觉验证,通过专用 AI 引擎检测跨环境的视觉回归问题。它的优化重点在于视觉准确性,而非 Sauce Labs 方法所强调的更广泛的多信号分析。

 

Functionize 提供 AI 驱动的测试自动化,具有自愈测试功能和 ML 生成的脚本。它的重点是加速测试的创建和维护,而根据公告,Sauce AI for Insights 是一种工具,用于将测试数据、日志和设备信号关联起来,转化为自然语言解释,减少问题调查时间。

 

上述对比表明,在 AI 辅助测试的大趋势下,不同的供应商都在设法解决类似的挑战,不过解决问题的角度略有不同。

 

声明:本文为 InfoQ 翻译,未经许可禁止转载。

 

原文链接:https://www.infoq.com/news/2025/11/sauce-labs-ai-testing/

2025-11-28 10:175

评论

发布
暂无评论

ShareSDK Android端合规指南

MobTech袤博科技

JWT真的安全吗?如何解决该问题

JWT

融云参编中国信通院「办公即时通信研究报告」,并入选「典型行业案例」

融云 RongCloud

PaaS 即时通讯 办公 信息 融云

软件测试/测试开发丨Web自动化测试-高级定位CSS

测试人

CSS 程序员 软件测试 自动化测试 测试开发

基于AIGC的京东购物助手的技术方案设想 | 京东云技术团队

京东科技开发者

人工智能 智能客服 AIGC 企业号 5 月 PK 榜

起猛了!从Github大佬白嫖的分布式进阶宝典,啃完感觉能吊锤面试官

Java 架构 分布式

PAG动效框架源码笔记 (四)渲染框架

olinone

ios android 动画 移动 特效

淬体归元,运营商资源域元数据管理

鲸品堂

大数据 管理 元数据 企业号 5 月 PK 榜

火山引擎DataLeap:如何构建一套完整、易用的数据标准体系

字节跳动数据平台

大数据 数据治理 数据标准 数据研发

SpringCloud 中 Zuul 网关原理及其配置

Java Spring Cloud 网关 Zuul

2022 Kube-OVN开源社区年度报告

York

开源 云原生 k8s 容器网络 cni

优秀的屏幕取色软件:ColorSnapper2激活版

真大的脸盆

Mac Mac 软件 屏幕取色器

央企财务共享建设路径四大趋势洞察

用友BIP

财务共享

平行云X火山引擎:探索XR观展的极致体验

火山引擎边缘云

XR 火山引擎 实时云渲染 平行云 火山引擎边缘云

复盘的价值是什么?

老张

复盘 复盘归因

借生态力量助力人工智能发展 英特尔这些年做了哪些事?

E科讯

架构训练营模块二作业

Geek_3d7c4d

被性能优化撂倒无数次后的顿悟!465页调优笔记助力大厂面试之旅

Java 性能优化 性能调优

可视化探索开源项目的 contributor 关系

NebulaGraph

开源

网络性能问题排查思路

蓝胖子的编程梦

TCP 网络 问题排查 问题定位 问题解析

DB-GPT: Github 两周2.6k star 数据库领域的GPT来了~

csunny

GPT autogpt LLMs

强!PCB“金手指”从设计到生产全流程

华秋PCB

工具 PCB 连接器 PCB设计 金手指

解读与用户一起“跳动”的开源实时监控工具 HertzBeat

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 5 月 PK 榜

代码级质量技术之基本框架介绍

百度Geek说

单元测试 开发语言 C++ 企业号 5 月 PK 榜

巅峰对谈:迈向 AGI 时代,除了优秀的大模型,还需要什么?丨Fabarta&蓝驰创投

Fabarta

人工智能 图数据库 AI大模型 AGI 图智能

Java高并发难题一网打尽,全网最全的高并发设计文档

Java 架构 系统设计 高并发

NGINX Service Mesh 中的 mTLS 架构

NGINX开源社区

nginx Service Mesh

“源生无限,同行致远”,加速迈向智能世界

说山水

MoE 系列(五)|Envoy Go 扩展之内存安全

SOFAStack

golang 开发者 后端 网关 C++

OIDC & OAuth2.0 协议及其授权模式详解|认证协议最佳实践系列【1】

Authing

身份认证 OAuth 2.0 单点登录 OIDC

Agent 技术演进与落地:从工具到伙伴的生产力变革|AICon北京_大会快讯_AICon 全球人工智能开发与应用大会_InfoQ精选文章