2025上半年,最新 AI实践都在这!20+ 应用案例,任听一场议题就值回票价 了解详情
写点什么

在自动化测试结果分析中使用 AI 工具

  • 2025-04-22
    北京
  • 本文字数:1635 字

    阅读完需:约 5 分钟

在自动化测试结果分析中使用AI工具

Maroš Kutschy 在 QA Challenge Accepted 大会上表示,自动化测试结果的分析是测试活动的一个非常重要且具有挑战性的部分。在任何时刻,我们都应该能够根据自动化测试的结果来判断产品的状态。他介绍了人工智能如何帮助他们节省分析时间、减少人为错误,使团队能够专注于新出现的失败的测试。


Kutschy 提到,他们在分析自动化测试结果时遇到了挑战,正在寻找一种更高效且更少出错的分析方法:


如果你每晚运行 4000 多个测试,其中约 5% 的测试失败,那么你每天需要分析大约 200 个失败的测试。


他们引入了 ReportPortal 这个工具,它使用人工智能来分析自动化测试结果。正如 Kutschy 所说的,这个工具可以作为企业内部解决方案进行免费安装:


作为这个工具的管理员,我完成了概念验证和集成,并解决了所有问题。现在,功能团队的测试人员每天都在使用它。


Kutschy 说,测试人员登录 ReportPortal 找到他们负责的作业的运行结果,并查看有多少失败处于“待调查”状态。前一天的失败测试(之前已经分析过)已被 ReportPortal 分类。对于“待调查”状态的失败测试,他们需要执行标准的分析流程,即调试并找出失败的根本原因:


ReportPortal 会显示分析结果;你可以看到有多少测试是因产品缺陷、自动化缺陷、环境问题导致的,以及还有多少失败的测试处于“待调查”状态。


Kutschy 说,当你刚开始使用这个工具时,它对失败的测试一无所知。测试人员需要决定测试失败是产品缺陷、自动化缺陷还是环境问题导致的。当下一次相同的测试再次失败时,工具会根据之前的判断,利用人工智能为失败分配正确的状态。


Kutschy 提到,仪表盘通过展示分析结果提供了测试和应用程序状态的概览视图。实时可见的分析状态让你可以看到谁正在处理哪个失败的测试,这有助于决定是否可以发布应用程序。


使用这个工具可以节省分析时间,因为它们只关注新失败的测试,而不是所有失败的测试,正如 Kutschy 所说的:


区别在于,如果你今天有 100 个失败的测试,其中只有 2 个是新出现的,你只需要查看这 2 个。如果你不使用这个工具,就需要查看 100 个。


由于工具会根据之前的决策对旧的失败测试进行分类,因此减少了人为错误。这有助于将注意力集中在新出现的失败测试上,Kutschy 说。


如果人类用错误的数据训练人工智能,人工智能也会做出错误的决定,Kutschy 说。如果你是一个糟糕的老师,你的学生(ReportPortal)也会表现不佳:


有时,一个同事会将失败的测试链接到错误的 Jira 任务,或者为失败的测试分配错误的状态。


你可以通过手动修改来“取消学习”,Kutschy 说。


如果正确使用人工智能,它可以为你节省大量时间并减少人为错误,Kutschy 说。在确认它可以正常运行之后,你就可以信赖它,不再需要你们手动对失败的测试进行分类。


InfoQ 采访了 Maroš Kutschy__,了解他如何使用人工智能进行自动化测试分析。


InfoQ:你在这个过程中遇到了哪些挑战,又是如何解决的?

Maroš Kutschy:我们首先进行概念验证,确认我们可以将该工具集成到我们的测试自动化框架中。


接下来,我们让同事们遵循使用 ReportPortal 来分析测试结果的流程。最初,他们需要对所有的失败测试进行分类,即为它们分配正确的状态(自动化问题、产品缺陷、环境问题)和 Jira 任务。


我们先是在指定的团队中进行了测试,然后让所有团队都开始使用。试用的反馈非常积极,测试人员觉得它很有用,因为它帮助他们简化了分析工作。


InfoQ:你从中学到了什么?

Kutschy:在开始使用人工智能工具之前,你必须确认其可靠性。


我们必须确保 ReportPortal 做出了正确的决定。这个决定取决于我们在测试自动化框架中如何处理堆栈跟踪信息和 ReportPortal 的配置。如果它没有按预期工作,我们就尝试调整 ReportPortal 的设置。


目前的大多数讨论都是关于如何使用人工智能来生成测试自动化代码,但我们发现,自动化测试结果分析也是一个非常适用人工智能的领域。我们可以在测试的许多场景中使用人工智能(包括生成式人工智能)。


查看英文原文:

https://www.infoq.com/news/2025/03/AI-analysis-automated-test/

2025-04-22 08:004674

评论

发布
暂无评论

一天 Star 破万的开源项目「GitHub 热点速览」

电子尖叫食人鱼

GitHub

英特尔“大小脑融合”全新方案亮相:构建具身智能系统的理想选择

E科讯

“思考更长时间”而非“模型更大”是提升模型在复杂软件工程任务中表现的有效途径 | 学术研究系列

阿里云云效

阿里云 云原生

以人脸识别验票机为例,通义灵码如何助力嵌入式软硬件开发中的快速功能验证

阿里巴巴云原生

阿里云 云原生 通义灵码

三门峡文旅集团:用友BIP企业AI全栈云赋能黄河流域文旅产业升级

用友BIP

稳就业,保民生:2025年就业形势与实操指南,助你把握职场先机

安全乐谷

找工作 招聘 就业 找实习 改简历

万字长文 | Apache SeaTunnel 分离集群模式部署 K8s 集群实践

白鲸开源

广州生物医药产业全景解析:如何抓住未来千亿级产业机遇?

安全乐谷

找工作 招聘 就业 广州 找实习

容器技术演进:从云原生基座到小程序生态重构

xuyinyin

世界地球日,DeCloud如何助力节能减排?

PowerVerse

DePIN 节能减排 DeCloud

酒仙桥的AI变形记

脑极体

AI

用通义灵码写一个大学社团“自动化运营外挂” | 《趣玩》第3期

阿里巴巴云原生

阿里云 云原生 通义灵码

JDK的SPI有什么缺陷?dubbo做了什么改进?

不在线第一只蜗牛

Java

BeeWorks:专业的企业Im即时通讯平台

BeeWorks

IM 即时通讯IM 私有化部署 企业级应用

2025 AI+研发数字峰会,我们在「AI 生产力工具创新论坛」等你来

阿里云云效

阿里云 云原生 通义灵码

2025深圳机器人展览会·高交会

AIOTE智博会

高交会 机器人展 机器人展会 机器人博览会

最讨厌AI的人选了特朗普

脑极体

AI

故障定位系列-2-服务&接口双粒度动态拓扑,精准定位共享连接池故障

乘云数字DataBuff

可观测性 故障定位 智能运维 运维监控

用户说 | 手把手体验通义灵码 2.0:AI 程序员如何让我从“调参侠”进阶“架构师”?

阿里云云效

阿里云 云原生 通义灵码

用户说 | 手把手体验通义灵码 2.0:AI 程序员如何让我从“调参侠”进阶“架构师”?

阿里巴巴云原生

阿里云 云原生 通义灵码

2025 AI+研发数字峰会,我们在「AI 生产力工具创新论坛」等你来

阿里巴巴云原生

阿里云 云原生 通义灵码

国产直升机发展现状及思考

DevOps和数字孪生

航空航天 低空经济

全球线上直播会议丨快速赋能企业,仿真技术如何实现降本增效?

Altair RapidMiner

仿真 CAE hyperworks SimSolid Simlab

用通义灵码写一个大学社团“自动化运营外挂” | 《趣玩》第3期

阿里云云效

阿里云 云原生 通义灵码

天润融通AI Agent引领零售行业客户服务变革,塑造持久竞争力

天润融通

“思考更长时间”而非“模型更大”是提升模型在复杂软件工程任务中表现的有效途径 | 学术研究系列

阿里巴巴云原生

阿里云 云原生

BeeWorks:低成本的国产化企业内网即时通讯

BeeWorks

即时通讯 IM 私有化部署 企业级应用

飞行器半实物联合仿真:技术解析与应用实践

DevOps和数字孪生

天润融通携手天虹:AI Agent革新购物体验,优化服务效率

天润融通

一文讲透“MCP协议+LazyLLM”实战:零基础秒建Agent分身!

商汤万象开发者

AI LLM

天润融通智能工单系统,助力企业实现服务全流程可视化管理

天润融通

在自动化测试结果分析中使用AI工具_软件工程_Ben Linders_InfoQ精选文章