写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002278
用户头像

发布了 1008 篇内容, 共 425.5 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

提示找不到某些库文件?

矩视智能

深度学习 机器视觉

Archicad 26中文for Mac(BIM建模软件) Archicad26破解详细安装教程

Rose

mac软件下载 建模软件 Archicad 26破解版 Archicad 26 Mac中文版 BIM软件

向成本要效益!用友BIP助力车企突破内卷、打赢“降本战”

用友BIP

降本增效

为什么说数据安全运维难?有好用的数据安全运维平台吗?

行云管家

数字化 数据安全 数据运维 数据运维安全

高性价比AWS Lambda无服务体验

查拉图斯特拉说

Lambda 亚马逊云科技 Amazon Lambda

软件研发流程、架构规范、技术标准、需求过程等全文档

代码人,代码魂

开发文档

有效降低数据库存储成本方案与实践 | 京东云技术团队

京东科技开发者

数据库 存储 数据存储 降本 企业号11月PK榜

软件测试/测试开发丨接口测试Mock实战练习学习笔记

测试人

软件测试 接口测试 Mock

当生成式AI从梦想走近现实,大语言模型未来会取代人类吗?

格致君的planB

人工智能 AI 大语言模型

软件测试/测试开发丨探索Python魔力:第一个程序到快捷键大揭秘

测试人

Python 软件测试

大模型产业生态有“成功密码”?百度高管2023进博会最新发声

飞桨PaddlePaddle

深度学习 产业生态 大模型

苹果最新系统:macOS 14 Sonoma 14.1.1正式版

加油,小妞!

macOS 14 Sonoma Macos最新系统

大模型集体失控!南洋理工新型攻击,主流AI无一幸免

Openlab_cosmoplat

人工智能 大模型

【慢SQL性能优化】 一条SQL的生命周期 | 京东物流技术团队

京东科技开发者

MySQL 数据库 SQL优化 企业号11月PK榜

淘天Java一面,难度适中!(上篇)

王磊

Java java面试

站群服务器优势

Geek_f19a80

快速教程|如何在 AWS EC2上使用 Walrus 部署 GitLab

SEAL安全

#GitLab Walrus 企业号11月PK榜

沉浸式LED显示屏的定义和特点

Dylan

LED显示屏 沉浸式体验 沉浸式

HarmonyOS NEXT调优工具Smart Perf Host高效使用指南

HarmonyOS开发者

HarmonyOS

智慧燃气:用友BIP资产云如何实现管道资产数智化管理?

用友BIP

资产管理 智慧燃气

Java 多线程开发系列 2:创建一个线程

BigBang!

Java多线程

Android下Linux创建进程的姿势(上)

江湖修行

android Linux 进程

基于Java开发的供应商询价招标采购系统(SRM系统源码)

代码人,代码魂

Java springboot 采购 srm

入门指导:NGINX 中的 QUIC 网络连接和加密

NGINX开源社区

DNS DDoS QUIC nginx 开源版 HTTP/3

企业如何选型iPaaS平台

RestCloud

ipaas

YonGPT构筑酒旅企业AI大脑 轻松拿捏“松弛感”

用友BIP

AI YonGPT

Stable Diffusion:最先进的文本生成图像模型

3D建模设计

人工智能 Stable Diffusion 稳定扩散 自动纹理

云服务器数据安全保障措施看这里!

行云管家

云计算 云安全 云服务器 云数据

关于稳定扩散最详细的介绍

3D建模设计

人工智能 Stable Diffusion AI自动纹理 稳定扩散

中国电信国际数智化人力领先实践

用友BIP

人力资源 数智化领先实践 中国电信

数仓实践丨表扫描时过滤行数过多引起的性能瓶颈问题

华为云开发者联盟

数据库 数据仓库 后端 华为云 华为云开发者联盟

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章