写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002449
用户头像

发布了 1008 篇内容, 共 443.9 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

某邮储银行数据归集系统在HTAP场景下的选型与实践

OceanBase 数据库

解读Vue3模板编译优化

yyds2026

Vue

BI口碑分析,Quick BI何以连续入选魔力象限

巷子

JavaScript刷LeetCode拿offer-分治

Geek_07a724

JavaScript LeetCode

StartDT奇点云通过CMMI5全球软件领域最高级别成熟度认证

奇点云

CMMI 奇点云

汇总LED显示屏专业知识

Dylan

LED LED显示屏 led显示屏厂家

【LeetCode】字母大小写全排列Java题解

Albert

算法 LeetCode 11月月更

信息论与编码:信道编码的基本概念

timerring

11月月更 信息论

3.1版本【HarmonyOS 第一课】正式上线!参与学习赢官方好礼>>

HarmonyOS开发者

HarmonyOS

深度阐述Nodejs模块机制

coder2028

node.js

深度理解NodeJS事件循环

coder2028

node.js

技术公开课|深度剖析 Java 的依赖管理,快速生成项目 SBOM清单

墨菲安全

Java SBOM 软件供应链安全

用javascript分类刷leetcode3.动态规划(图文视频讲解)

js2030code

JavaScript LeetCode

Java后端面试到底要如何准备?

钟奕礼

Java 程序员 java程序员 java面试 java编程

深聊Nodejs模块化

coder2028

node.js

前端懒加载和预加载

hellocoder2029

JavaScript

前端leetcde算法面试套路之回溯

js2030code

JavaScript LeetCode

详解webpack构建优化

Geek_02d948

webpack

为什么vue3要选用proxy,好处是什么?

hellocoder2029

JavaScript

用javascript分类刷leetcode3.动态规划(图文视频讲解)

Geek_07a724

JavaScript LeetCode

如何通过Java代码给Word文档添加水印?

在下毛毛雨

Java word 水印

双机热备软件原理简单说明以及品牌重点推荐

行云管家

高可用 ha 热备 双机热备

腾讯大神亲码Redis技术笔记,实战+原理双管齐下

小小怪下士

Java redis 程序员 腾讯

腾讯会议后台研发效能提升之路

博文视点Broadview

【11.11-11.18】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动

Webpack中的plugin插件机制

Geek_02d948

webpack

令人头疼的Javascript隐式&强制转换

hellocoder2029

JavaScript

深度解读Webpack中的loader原理

Geek_02d948

webpack

JavaScript刷LeetCode拿offer-双指针技巧(上)

Geek_07a724

JavaScript LeetCode

前端leetcde算法面试套路之堆

js2030code

JavaScript LeetCode

阿里P8整理的新版手抄本,所有Java知识操作

钟奕礼

Java java程序员 java面试 java编程

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章