2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002440
用户头像

发布了 1008 篇内容, 共 442.9 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

redis中报too many connections错误的解决

杨彦星

redis

从架构上详解技术(SLB,Redis,Mysql,Kafka,Clickhouse)的各类热点问题

利志分享

架构 #热点问题

jackson学习之八:常用方法注解

程序员欣宸

4月月更

智能风控中台设计与落地

第四范式开发者社区

人工智能 自动化 金融 中台架构 风险控制

渗透测试系列之靶机渗透

网络安全学海

网络安全 信息安全 渗透测试 WEB安全 漏洞挖掘

架构训练营-作业八

默光

消息队列 训练营

【直播预告】优化器及 Flink CDC + OceanBase 全增量一体化数据集成方案

OceanBase 数据库

OceanBase 社区版

在线CSV转TSV工具

入门小站

工具

react源码解析10.commit阶段

buchila11

React

论语音社交视频直播平台与 Apache DolphinScheduler 的适配度有多高

白鲸开源

多模块项目 mybatis mapper bean 找不到问题

Z冰红茶

详解动静态缓存各种方式

穿过生命散发芬芳

4月月更

在线标准程序员计算器

入门小站

工具

开启 JSON 和多模,让生态更多可能 | OceanBase 社区版 3.1.3 发版

OceanBase 数据库

OceanBase 社区版

SeekTiger迎来新征程,STI即将登录Gate.io

BlockChain先知

P5直升P7!“阿里爸爸”最新出品年薪30W~120WJava架构师学习路线

Java全栈架构师

程序人生 IT java程序员 java面试 java架构

Web3 和区块链技术:数字资产所有权如何颠覆当前的商业模式

CECBC

什么是中国企业信息化

秋去冬来春未远

数字化信息化中国文化

动态压测模型让工作更轻松

FunTester

cdr2022订阅版本安装包

茶色酒

cdr2022

宜搭小技巧|自动计算日期时长,3个公式帮你搞定!

一只大光圈

低代码 数字化 钉钉宜搭 宜搭

压力如同下雨一样具有存在的必要性,我和你交个朋友吧。

叶小鍵

带你了解什么是DHCP,为什么要用DHCP?

乌龟哥哥

DHCP 4月月更

分布式shiro权限验证

Rubble

4月日更

linux之chsh命令

入门小站

Linux

逐向双碳:绿色计算的误区与正确打开方式

脑极体

[Day13]-[动态规划]爬楼梯

方勇(gopher)

LeetCode 数据结构和算法

2022观测云产品发布会前瞻:这是一份给IT工程师们的礼物

观测云

Android C++系列:JNI开发准则

轻口味

c++ android 4月月更

阿里云PolarDB开源数据库社区与 Tapdata 联合共建开放数据技术生态

阿里云数据库开源

数据库 阿里云 polarDB PolarDB-X

领导看了我写的关闭超时订单,让我出门左转!

阿Q说代码

RabbitMQ 延时队列 4月月更 关闭订单

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章