GTLC全球技术领导力峰会·上海站,首批讲师正式上线! 了解详情
写点什么

对抗“无知”,大数据下的软件质量建设实践

2018 年 4 月 12 日

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

图1,比这还要多的蓝

题图来源于2009 年一篇名为《谷歌首席视觉设计师离职,不满公司痴迷数据》的新闻报道,内容大意是谷歌的某个团队在决定不了使用哪种蓝色背景的情况下,他们会测试41 种蓝色区间的阴影,以判断哪种更好。这位设计师一度认为谷歌的做法简直就侮辱了设计的专业性。回头来看,9 年前的谷歌,就已经用上大数据的思维方式了,并且影响着公司中对不同方向不同职位的商业决策。

我们不妨进一步思考下,谷歌做决策的时候如此依赖数据,背后原因究竟是什么?

背景

在思考这个原因的同时,我们来类比下软件测试这个行业,测试其实也面对着巨大的挑战。如果把测试发现和把控风险看作测试的价值之一,那么当今,测试把控风险的能力是前所未有的弱。移动的浪潮,让终端碎片化严重,固定的 App 测试人员,能在多少型号的 Android 手机上测试?当然也因此孕育出了众测和云测的方案,但是这个问题依旧像是个定时炸弹;音视频(直播,点播)的浪潮,让服务的链路更长, 不可控的因素更多,从录制、到滤镜处理,到编码压缩,到上传服务器,服务器二次加工,CDN 缓存,拉流,客户端渲染播放,链路长,测试要如何介入呢?推荐内容的浪潮,也开始助力 App 内容的个性化,如头条、QQ 看点,测试要覆盖什么场景?什么是正确的,什么是错误的?什么 Bug 是重要的?这些最基本的判断都越来越难。对应的,测试报告也就从测试通过、基本通过、最终退化成“测试完成”了。

这时,我想起的是“无知”,测试难以把控风险是因为无知,谷歌做决策时的数据依赖更是因为无知。谷歌正如许多知名的科学家都是有神论者一样,懂得越多越觉得自己无知,越需要用数据来证明规则和经验的正确性。测试要重新把控风险,同样也需要依赖数据,大数据,研发流程的数据,用户行为数据,性能数据等。

初衷

我们这次专题设置也因此而来,希望通过案例,帮助听众掌握大数据的工具、实践的思路,让测试同行可以打造把控风险的武器,另一方面也希望这成为日后大家进一步利用人工智能提升工作效率的基础。

提到软件质量建设与大数据的关联,第一个需要解决的问题其实是用来做什么。正如前一阵 AI 热的时候,我们想用 AI ,但是却不知在哪里落地才有价值。此次专题会从“解决问题”作为出发点来看待大数据的实践,而不是为了大数据而大数据,因此小V 称之为实践者。这里,小V 把大数据能解决的问题分为如下三类,同时 QCon 的伙伴们与小V 也努力在这三类里面探寻对应的实践者,为大家提供有落地价值的案例和经验。

利用大数据**** 发现问题

华为,张春兵分享的大数据助力测试策略制定到质量评估的智能化,区别于从研发流程外获取的质量数据,而是从研发流程中的质量大数据出发,借此来发现测试效率。

利用大数据探寻规律,定位问题原因

滴滴张晓杰分享的主题滴滴基于大数据的用户问题定位建设与实践和阿里巴巴万传奇分享的主题优酷大数据质量平台的业务特色是有着相对长的业务链路,全链路的问题定位的业务诉求最强烈,所以我们非常期待他们可以分享利用大数据定位问题的丰富经验。另外,百度王胜的主题让数据为质量服务在利用用户行为数据来聚合、自动生成用力,帮助 Crash 排查上也有出彩的实践。

利用大数据度量效影响的大小

腾讯,谭力分享的主题手Q**** 性能优化的大数据中,会重点介绍如何从大量的卡顿问题,如何从用户中高效采集兵处理分析型数据,例如千万级别的卡顿堆栈如何高效采集和还原。通过大数据度量并找出影响用户的关键问题。

解决大数据问题的先行者

有了好的想法,当然就是实践了。但是对于开发来说都有难度的大数据,对于测试来说也是一样的。在这次专题中,解决这些问题的,小V 称之为先行者,为我们点亮前路,其中京东孔祥云的主题《大数据实战- 测试工具领域对应海量数据的解决方案》以及腾讯、百度、华为、滴滴的分享,都会提到在质量大数据平台建设中遇到的困难,已经如何借助如 Spark ,Storm 等平台工具,大数据云服务,高效低成本地提升测试对于大数据的处理能力。希望可以帮助听众突破这一难关。

展望

4 月 20~22 日,我们将在 QCon 北京 2018 ,以大数据作为开始,抛砖引玉,期待能有更多有价值的案例产生与行业分享,让测试行业更具活力更有价值。 这里参照无人车的 L1-L5 评级幻想了个图,也让期盼着迎来未来属于测试的 L5。

2018 年 4 月 12 日 19:001388

评论

发布
暂无评论
发现更多内容

为什么我就面试阿里P6,好不容易过2面,3面来个架构师来吊打我?

小Q

Java 学习 程序员 架构 面试

【Mycat】作为Mycat核心开发者,怎能不来一波Mycat系列文章?

冰河

分布式事务 分布式数据库 系统架构 分布式存储 mycat

面试,到底在考察什么?

程序员架构进阶

面试 方法论

三千字轻松入门TensorFlow 2

计算机与AI

tensorflow 学习

第六周课后练习

balsamspear

极客大学架构师训练营

[Pulsar 社区周报] 2020-10-31 ~ 2020-11-06

Apache Pulsar

大数据 开源

甲方日常 49

句子

工作 随笔杂谈 日常

极客大学 - 架构师训练营 第八周

9527

微众银行大数据平台建设方案

微众开源

大数据 开源 金融 平台 微众银行

利用下班时间,我两星期完成了redis入门与进阶

小松漫步

数据库 redis

高交会第一天,高新技术成焦点

13530558032

Oracle、NoSQL和NewSQL 数据库技术对比

VoltDB

数据库 大数据 数据分析 物联网

什么?还不懂c++vector的用法,你凭什么勇气来的!

良知犹存

c++

Serverless 是一种思想状态

donghui

Serverless

链表交集问题与DataNode宕机HDFS处理时序

garlic

极客大学架构师训练营

面经手册 · 第17篇《码农会锁,ReentrantLock之AQS原理分析和实践使用》

小傅哥

Java AQS CAS unsafe CLH

我就是增发、健身、养猫、社交通通拥有的锦鲤本鲤

脑极体

LAXCUS 大数据集群操作系统:一个分布式分时共享 E 级系统软件(六)

陈泽云

人工智能 大数据 算法

多线程并发主题-ThreadLocalRandom类

Geek_896619

Java 并发编程 线程

【涂鸦物联网足迹】涂鸦云平台接口列表

IoT云工坊

人工智能 接口 物联网 API 智能家居

C++多元组tuple使用方法?你熟悉吗?快来看看吧

良知犹存

c++

LAXCUS 大数据集群操作系统:一个分布式分时共享 E 级系统软件(七)

陈泽云

人工智能 大数据 算法

《迅雷链精品课》第三课:区块链主流框架分析

迅雷链

区块链 区块链方案 区块链+ 区块链应用

“双11”购物狂欢节,所有女生走进了谁的直播间?

博睿数据

APM AIOPS 拨测 直播 用户体验

高交会科技盛宴:“科技改变生活,创新驱动发展”

13530558032

mongodb 源码实现系列 - 网络传输层模块实现四

杨亚洲(专注mongodb及高性能中间件)

MySQL 数据库 mongodb 高性能 分布式数据库mongodb

WE大会上,科学家们是怎样治愈“小破球”的?

脑极体

mPaaS 客户端问题排查之漫长的 3s 等待之谜

阿里云金融线TAM SRE专家服务团队

mPaaS

第六周总结

balsamspear

极客大学架构师训练营

Github标星67.9k的微服务架构以及架构设计模式笔记我真的爱了

Java架构之路

Java 程序员 架构 面试 编程语言

Pulsar Summit Asia 2020 | 场景案例论坛(上):多行业,多场景

Apache Pulsar

大数据 开源 Apache Pulsar

DNSPod与开源应用专场

DNSPod与开源应用专场

对抗“无知”,大数据下的软件质量建设实践-InfoQ