10 月 23 - 25 日,QCon 上海站即将召开,现在购票,享9折优惠 了解详情
写点什么

在自动化测试结果分析中使用 AI 工具

  • 2025-04-22
    北京
  • 本文字数:1635 字

    阅读完需:约 5 分钟

在自动化测试结果分析中使用AI工具

Maroš Kutschy 在 QA Challenge Accepted 大会上表示,自动化测试结果的分析是测试活动的一个非常重要且具有挑战性的部分。在任何时刻,我们都应该能够根据自动化测试的结果来判断产品的状态。他介绍了人工智能如何帮助他们节省分析时间、减少人为错误,使团队能够专注于新出现的失败的测试。


Kutschy 提到,他们在分析自动化测试结果时遇到了挑战,正在寻找一种更高效且更少出错的分析方法:


如果你每晚运行 4000 多个测试,其中约 5% 的测试失败,那么你每天需要分析大约 200 个失败的测试。


他们引入了 ReportPortal 这个工具,它使用人工智能来分析自动化测试结果。正如 Kutschy 所说的,这个工具可以作为企业内部解决方案进行免费安装:


作为这个工具的管理员,我完成了概念验证和集成,并解决了所有问题。现在,功能团队的测试人员每天都在使用它。


Kutschy 说,测试人员登录 ReportPortal 找到他们负责的作业的运行结果,并查看有多少失败处于“待调查”状态。前一天的失败测试(之前已经分析过)已被 ReportPortal 分类。对于“待调查”状态的失败测试,他们需要执行标准的分析流程,即调试并找出失败的根本原因:


ReportPortal 会显示分析结果;你可以看到有多少测试是因产品缺陷、自动化缺陷、环境问题导致的,以及还有多少失败的测试处于“待调查”状态。


Kutschy 说,当你刚开始使用这个工具时,它对失败的测试一无所知。测试人员需要决定测试失败是产品缺陷、自动化缺陷还是环境问题导致的。当下一次相同的测试再次失败时,工具会根据之前的判断,利用人工智能为失败分配正确的状态。


Kutschy 提到,仪表盘通过展示分析结果提供了测试和应用程序状态的概览视图。实时可见的分析状态让你可以看到谁正在处理哪个失败的测试,这有助于决定是否可以发布应用程序。


使用这个工具可以节省分析时间,因为它们只关注新失败的测试,而不是所有失败的测试,正如 Kutschy 所说的:


区别在于,如果你今天有 100 个失败的测试,其中只有 2 个是新出现的,你只需要查看这 2 个。如果你不使用这个工具,就需要查看 100 个。


由于工具会根据之前的决策对旧的失败测试进行分类,因此减少了人为错误。这有助于将注意力集中在新出现的失败测试上,Kutschy 说。


如果人类用错误的数据训练人工智能,人工智能也会做出错误的决定,Kutschy 说。如果你是一个糟糕的老师,你的学生(ReportPortal)也会表现不佳:


有时,一个同事会将失败的测试链接到错误的 Jira 任务,或者为失败的测试分配错误的状态。


你可以通过手动修改来“取消学习”,Kutschy 说。


如果正确使用人工智能,它可以为你节省大量时间并减少人为错误,Kutschy 说。在确认它可以正常运行之后,你就可以信赖它,不再需要你们手动对失败的测试进行分类。


InfoQ 采访了 Maroš Kutschy__,了解他如何使用人工智能进行自动化测试分析。


InfoQ:你在这个过程中遇到了哪些挑战,又是如何解决的?

Maroš Kutschy:我们首先进行概念验证,确认我们可以将该工具集成到我们的测试自动化框架中。


接下来,我们让同事们遵循使用 ReportPortal 来分析测试结果的流程。最初,他们需要对所有的失败测试进行分类,即为它们分配正确的状态(自动化问题、产品缺陷、环境问题)和 Jira 任务。


我们先是在指定的团队中进行了测试,然后让所有团队都开始使用。试用的反馈非常积极,测试人员觉得它很有用,因为它帮助他们简化了分析工作。


InfoQ:你从中学到了什么?

Kutschy:在开始使用人工智能工具之前,你必须确认其可靠性。


我们必须确保 ReportPortal 做出了正确的决定。这个决定取决于我们在测试自动化框架中如何处理堆栈跟踪信息和 ReportPortal 的配置。如果它没有按预期工作,我们就尝试调整 ReportPortal 的设置。


目前的大多数讨论都是关于如何使用人工智能来生成测试自动化代码,但我们发现,自动化测试结果分析也是一个非常适用人工智能的领域。我们可以在测试的许多场景中使用人工智能(包括生成式人工智能)。


查看英文原文:

https://www.infoq.com/news/2025/03/AI-analysis-automated-test/

2025-04-22 08:004914

评论

发布
暂无评论

【FAQ】HarmonyOS SDK 闭源开放能力 —Live View Kit (1)

HarmonyOS SDK

harmoyos

当AI邂逅时尚 如何撬动时尚行业新一轮商业变革

第七在线

多 Agent 协作,效果如何评估?

Baihai IDP

程序员 AI Baihai IDP AI Agents 智能体评估

CRM管理系统(源码+文档+部署+讲解)

深圳亥时科技

直播间互动框架性能优化与稳定性实践

百度Geek说

百度 直播 性能优化、

CRM系统(源码+文档+部署+讲解)

深圳亥时科技

人工智能丨微信搜索“暗藏玄机”?DeepSeek-R1灰度测试背后有何深意?

测试人

创意LED显示屏解决方案:点亮未来视界

Dylan

LED显示屏 全彩LED显示屏 户外LED显示屏 led显示屏厂家

搜款网VVIC商品列表数据接口(搜款网API系列)

tbapi

搜款网 搜款网API 搜款网商品列表接口 搜款网商品详情接口

鸿蒙APP开发的核心框架

北京木奇移动技术有限公司

APP开发 鸿蒙开发 软件外包公司

鸿蒙APP的性能优化

北京木奇移动技术有限公司

鸿蒙开发 鸿蒙app 软件外包公司

【天池训练营之大模型第一课】Data-juicer系列学练赛火热开启!

阿里云天池

Svelte 最新中文文档教程(14)—— 特殊元素

冴羽

vue.js 前端 React Svelte SvelteKit

搜款网VVIC商品详情数据接口(搜款网API系列)

tbapi

搜款网API 搜款网商品详情接口 搜款网商品数据采集

传统AI不给力!模型自训练优化可以这样玩

鲸品堂

人工智能 企业号 2025年2月PK榜

简单了解中国网络空间安全协会

行云管家

网络安全

如何在保障精度的同时,轻量级部署DeepSeek?

华为云开发者联盟

人工智能 大模型 昇腾 模型量化 MindStudio

在自动化测试结果分析中使用AI工具_软件工程_Ben Linders_InfoQ精选文章