写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002467
用户头像

发布了 1008 篇内容, 共 445.9 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

招聘 | Bifrost、Gear、Phala Network等多家波卡生态项目招聘区块链开发者

One Block Community

波卡生态 区块链招聘 bifrost gear Phala Network

适合 Kubernetes 初学者的一些实战练习 (六)

汪子熙

Docker Kubernetes 云原生 Serverless Kubernetes 4月月更

Flutter 通过自定义路由拦截实现权限管理

岛上码农

flutter ios 移动端开发 安卓开发 4月月更

数据库的物理存储系统

Joseph295

数据库 数据库系统

jackson学习之四:WRAP_ROOT_VALUE(root对象)

程序员欣宸

4月月更

RocketMQ—Producer(三)发送方式和消息类型

IT巅峰技术

常用的高情商话术

williamcai

一文简述:云原生应用十二要素

穿过生命散发芬芳

4月月更

生产环境Redis连接,长时间无响应被服务器断开问题

越长大越悲伤

redis TCP 连接 springboot

Android C++系列:NDK减少so库体积方法总结

轻口味

c++ android 4月月更

王者荣耀商城异地多活架构设计

Geek_36cc7c

首期Moonlight Builder Workshop | 如何在 Moonbeam 快速开发和部署 DApp

One Block Community

dapp SBUSUART Moonbeam 波卡生态 Scaffold-ETH

PlatoFarm将DAO理念发扬光大,让DAO社区受益才能走得远

小哈区块

ECharts 饼图颜色设置教程 - 4 种方式设置饼图颜色

蒋川

eCharts

jupyter notebook更换皮肤

Peter

数据分析 工具 jupyter

一文读完吴恩达-Machine Learning Yearning

AIWeker

人工智能 机器学习 吴恩达

AI大咖说-如何有效的读论文

AIWeker

人工智能 论文阅读 李沐

架构实战营 - 模块二作业

凯博无线

展业四海,服务八方,明道云落地蜀陕豫鄂

明道云

Linux驱动开发-编写OLED显示屏驱动

DS小龙哥

4月月更

Spring如何解决循环依赖

IT巅峰技术

Twitter架构决策

俞凡

架构 大厂实践

微信朋友圈的高性能复杂度分析

高山觅流水

「架构实战营」

自己动手写Docker系列 -- 5.4实现进入容器的namespace,exec命令

Docker Go 语言 4月月更

TensorFlow的常用函数

Peter

人工智能 深度学习 tensorflow

游戏化与驱动力 —《游戏化实战》读后感

Bruce Talk

敏捷 随笔 Agile

人生之道

williamcai

人生修炼

去中心化云存储的前世今生 | 存储技术分享活动回顾

One Block Community

区块链 Substrate 去中心化存储 波卡

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章