阿里云「飞天发布时刻」2024来啦!新产品、新特性、新能力、新方案,等你来探~ 了解详情
写点什么

关于 A/B 测试你不得不知道的 7 件事

  • 2020-04-05
  • 本文字数:2030 字

    阅读完需:约 7 分钟

关于A/B测试你不得不知道的7件事

AB 测试,或称 ABT,想必你已有所耳闻。


可能在公司的培训中,你曾学习到 ABT 的知识;可能在平时的交流中,你曾谈及 ABT 的意义;也可能在网上的浏览中,你曾一窥 ABT 的强大。


不过,什么人适合使用它,什么产品不适合它,它该用在哪儿,不该忽视哪些东西:


这些事儿,都将在下文中为你呈现。

什么是 A/B 测试

A/B 测试是一种用数据进行产品决策的方法,它用于比较网页或应用程序的两个或多个版本,以确定哪一个版本更好。A/B 测试本质上是一个实验机制,其向用户随机显示页面的某一个版本,并通过统计分析确定哪个版本对于设定的转化目标有更好的表现



通俗一点讲:现在页面上有个按钮是红色的,产品经理想把按钮颜色换成绿色——但是不知道用户反馈怎么样。这个场景下就应该做 A/B 测试:我们让 10%流量的用户使用 A 版本(红色按钮),10%流量的用户使用 B 版本(绿色按钮)。如果 B 版本的用户点击量更多的话,OK,发布 B 版本吧。如果 AB 两个版本按钮点击量差不多或者 A 版本点击量更多的话,那就不用浪费程序猿的时间去上线 B 版本了。

A/B 测试具体可以用在哪些地方

1 获取用户(吸引更多的人使用产品)


2 提高活跃度(引导用户做点什么)


3 提高留存(提升用户粘性)


4 增加收入(想法收钱呗)


5 传播推荐(让产品被更多人知道)


上面的 5 个步骤就是“AARRR“转化漏斗模型。在这个漏斗中,用户会在被导入之后层层流失,在层层深入中实现最终转化。一个好的产品经理会在产品生命周期中的各个阶段思考是否到达上面的五个目标——而 AB 测试,正好可以帮上忙。

哪些人会用到 A/B 测试

产品经理


几乎很少有公司设置增长黑客这个岗位,因此使用 A/B 测试驱动增长的职责自然落到了产品经理头上。例如,改变一个按钮颜色,更换页面风格(总之就是把产品做成什么样),或者是留存率,转化率这些都是产品经理常常挂在嘴边的。


运营


这里指的运营不是简简单单打个广告,拉条横幅的那种运营。这里指的是用数据驱动增长的增长黑客这类人。

什么样的产品不适合做 A/B 测试

日活小于 1000 的产品,不适合做 A/B 测试。从产品本身来说,似乎没有不适合做 A/B 测试的。但日活小于 1000 的产品由于流量基数太小,做 A/B 测试几乎没什么作用,并且结合需要支付第三方工具的费用来说得不偿失。目前 BAT 级别公司有自己的 A/B 测试团队,中型公司用第三方 SDK(例如我们 Testin 的 A/B 测试),而日活流量较小的公司不太适合 A/B 测试。

A/B 测试与灰度发布是什么关系

如果去问一些产品经理 A/B 测试是什么,他们可能会说出灰度发布的概念。实际上灰度发布只是 A/B 测试的一个子功能


在一个完备的 A/B 测试中,我们可以灵活地控制不同产品版本的流量分配:例如,我们可以让 10%用户用 A 版本,10%用户用 B 版本,如果用户在 B 版本中的点击量、留存率等数据表现更好,那么就可以逐步扩大 B 版本的流量分配,最终让所有用户都用 B 版本。


而灰度发布一般来说是在预发步环境中发布新版本,确定功能正常之后再将新版本完整上线。在一个 A/B 测试系统中,我们完全可以通过控制不同版本的流量分配来完成灰度发布,但是一个灰度发布系统却不能实现 A/B 测试系统灵活的流量分配及针对不同版本的数据统计功能。

A/B 测试的实际案例

例 1 页面新增了一个注册表单


国外某公司在新版本上新增了一个注册表单。该公司导入 3000 多访客流量参与这次 A/B 测试。最终结果为转化率提升 43.85%。



例 2 更合适的图片提高了 40.18%的转化率


ExactTarget 是一家全球性数字营销的 SaaS 领导者.他们在登录页的内容是吸引人们参加大会,而原始版本的图片是一台笔记本。在新版本里面他们将图片换成了实际大会的场景图片,从而使转化率提高了 40.18%。从用户心理的角度分析,笔记本电脑屏幕会给人虚拟会议的印象,而不是现场活动。



例 3 免费试用按钮使注册次数增加了 158%


GetResponse 的首页一开始只有一个购买按钮,他们想新增一个试用按钮提高注册率。但这个方案有可能会降低付费用户的数量,所以试验是冒着一定的风险的。


旧版页面:



新版页面:



最终结果是注册率提高 148%,而且购买人数没有降低。

A/B 测试中应该注意的一些细节

流量。做 A/B 测试的用户流量不能太小,一般日活在 1000 以上;


数据指标。A/B 测试需要有具体的、可量化的数据指标,比如“将下个月产品的留存率提高百分之三十”是很具体的 A/B 测试目标,而“明天是该吃苹果还是吃梨”就不是一个合适的 A/B 测试目标;


测试的时间周期一般为一至两个星期,时间太短无法完整覆盖完整的用户的行为习惯;


科学分割流量。分配到每个版本的用户群体在行为特征方面应该保持一致(如果 A 版本用户用的都是土豪金,B 版本都是诺基亚,那试验结果肯定不能说明什么,因为两组人群特征不同);


不能只看试验结果。还要结合置信区间来判断,例如 95%的置信度的前提下,置信区间为[-3%, +5.4%],说明这个 A/B 测试的实验有可能使“点击次数”降低 3%,也有可能提升 5.4%,这个试验的结果是不显著的,在这种情况下我们需要收集更多的用户行为数据,以得到确定性的试验结果。


2020-04-05 16:541303

评论

发布
暂无评论
发现更多内容

技术实践 | 场景导向的音视频通话体验优化

融云 RongCloud

自助洗车方便主要体现在哪方面

共享电单车厂家

自助洗车 自助洗车加盟

自助洗车一次费用不到10元你敢信

共享电单车厂家

自助洗车加盟 自助洗车费用

Move Protocol Beta测试版稳定,临时决定奖池规模再扩大

小哈区块

如何使用 DATAX 以 UPSERT 语义更新下游 ORACLE 数据库中的数据

明哥的IT随笔

oracle 大数据 数据仓库 DataX

昇腾科研创新使能计划赋能开发者  华为计算提供三大维度支持

Geek_2d6073

秒云云原生信创全兼容解决方案再升级,助力信创产业加速落地

MIAOYUN

运维 云原生 信创 智能运维 信创云

pnpm 中无法使用 patch-package 打补丁

OpenHacker

前端 js

Move Protocol Beta测试版进行时,瓜分生态核心权益MOMO

鳄鱼视界

启动!阿里巴巴编程之夏2022

阿里巴巴云原生

阿里云 云原生 编程之夏

Serverless 时代下微服务应用全托管解决方案

阿里巴巴云原生

阿里云 Serverless 微服务 云原生

数字藏品系统开发,NFT艺术品交易平台搭建

薇電13242772558

NFT 数字藏品

在线文档协作:办公必备高效率神器

小炮

Gartner 网络研讨会 “九问数字化转型” 会后感

明哥的IT随笔

数字化转型

自助洗车为什么可以做到24小时营业

共享电单车厂家

自助洗车机 自助洗车加盟 24小时自助洗车

有哪些好用的工作汇报工具

优秀

低代码 工具软件

SQL操作:WITH表达式及其应用

华为云开发者联盟

数据库 sql 后端 华为云

带你区分几种并行

华为云开发者联盟

后端 开发 华为云

Dubbo3 官方文档贡献者征集令

阿里巴巴云原生

阿里云 开源 云原生 dubbo

Redis 做缓存场景引发的问题

Ayue、

redis

自助洗车到底有哪些不一样的地方

共享电单车厂家

自助洗车加盟 24小时自助洗车

Docker入坑篇

青柚1943

Docker DevOps 云原生 容器化

揭秘支撑百度搜索、Feed、小程序三大业务的MVVM框架设计思想,San 核心人员倾力打造

图灵教育

前端开发 好书推荐 框架设计

为 Serverless Devs 插上 Terraform 的翅膀,实现企业级多环境部署(上)

阿里巴巴云原生

阿里云 Serverless 云原生 开源项目

Nebula Graph入驻阿里云计算巢,助力企业打造云上超大规模图数据库

阿里云弹性计算

spark 分布式 云原生 图数据库 计算巢

力扣每日一练之双指针1Day8

京与旧铺

6月月更

你的城市有24小时共享自助洗车吗

共享电单车厂家

自助洗车加盟 自助洗车店

深入剖析 HIVE 的锁和事务机制

明哥的IT随笔

大数据 hive 数据仓库

数据库主键一定要自增吗?有哪些场景不建议自增?

CRMEB

拥抱开放,Serverless 时代的下一征程

阿里巴巴云原生

阿里云 Serverless 云原生 SAE

阿里云 ACK One、ACK 云原生 AI 套件新发布,解决算力时代下场景化需求

阿里巴巴云原生

阿里云 云原生 分布式云容器平台 ACK One ACK 云原生 AI 套件

关于A/B测试你不得不知道的7件事_文化 & 方法_云测数据_InfoQ精选文章