写点什么

Twitter 借助漏斗分析提升用户参与度

  • 2016-02-28
  • 本文字数:1026 字

    阅读完需:约 3 分钟

漏斗分析(Funnel analysis)”用于分析事件序列,帮助网站或移动应用提升用户参与度。为了提升Twitter 用户的参与度, Twitter 的数据科学团队借助这个概念了解用户在注册或发推过程中如何同用户界面交互。他们用它分析用户交互日志,以确保他们交付的产品特性对用户有用且有吸引力。

Krist Wongsuphasawat 是 Twitter 的职业数据科学家,他最近写了一篇有关他们的试验性可视化分析方法的文章。该方法用于特定的事件序列计数,此外,为了提供更广阔的视角,该方法还会聚合并可视化序列中各步骤之间的信息。

日志分析可以像单事件计数那么简单,例如,点击Tweet 按钮。但是,该事件只是打开了Tweet 编辑器,并不一定意味着用户成功发推。漏斗分析或“漏斗计数(counting funnels)”可以提供更宏观的画面,便于查看用户在开始编辑之后中途放弃Tweet 的次数。这会引出更具探究性的问题,但是,Twitter 的数据规模对数据分析提出了挑战。这些数据涉及1 万多种事件类型和数以亿计的用户。Twitter 团队已经构建了一个统一的日志基础设施,用于捕获所有客户端的用户活动,使得这些日志成为组织内最大的数据集之一。

团队设计了一个试验性可视化漏斗分析工具Flying Sessions,用于支持漏斗探究,减少工作量,并提供比简单计数更多的信息。该工具帮助数据科学家理解日志数据。用户可以通过选择部分会话来指定分析粒度。然后,该工具会为用户提供聚合结果,用户可以在可视化界面上交互地探究这些结果。

该方案的数据管道包含三个部分:“会话生成(sessionzation)”、分段和聚合。可视化分析工具用到的技术包括 Hadoop Scalding D3 d3Kit 。Scalding 用于对 Hadoop 中大量的原始日志事件进行过滤,并汇总成较小的 JSON 文件,后者可以通过使用 D3 和 d3Kit 开发的 Web 用户界面可视化。

会话生成阶段会为每个用户创建一个会话,并添加连续事件(按时间戳排序)。

分段阶段会从会话中提取与分析师指定的“对齐点(alignment point)”相关的事件子序列,并根据它们包含的对齐点将子序列分组成段。该阶段包括识别会话片段,然后提取对齐点之间的事件序列并分组。

最后,聚合阶段会通过管道将上个阶段生成的段并行发给各种聚合器,以便生成可以在前端可视化的汇总信息(比如事件平均次数)。这种设计允许在需要额外的汇总类型时添加新的聚合器。

此外,Twitter 团队还设想了几种设计改进,以便将来增加使用模式挖掘或更复杂算法的新聚合类型。

查看英文原文: Funnel Analysis at Twitter for Improving User Engagement

2016-02-28 18:002493
用户头像

发布了 1008 篇内容, 共 448.6 次阅读, 收获喜欢 346 次。

关注

评论

发布
暂无评论
发现更多内容

KWDB多副本集群保姆级部署

KaiwuDB

再添荣誉!嘉为蓝鲸斩获可信云技术典型实践大奖,彰显智能运维实力

嘉为蓝鲸

AIOPS 智能运维 cmp 可信云大会

微服务的10大问题

不在线第一只蜗牛

JavaScript 微服务

MyEMS能源管理系统后台配置-车间管理

开源能源管理系统

开源 能源管理系统

免费不限量,通义灵码已经全面支持 Qwen3-coder 模型,“效果很惊艳”

阿里巴巴云原生

通义灵码

「宇树科技」启动IPO,29家产业链公司齐飞!

机器人头条

特斯拉 人形机器人 具身智能 宇树科技 智元机器人

嘉为蓝鲸 WeOps+Microsoft Teams:提升跨国运维信息传递精准度

嘉为蓝鲸

智能运维 #WeOps 一体化运维

内网IM:BeeWorks私有化部署的安全通讯解决方案

BeeWorks

即时通讯 IM 私有化部署

让复杂 AI 应用构建就像搭积木:Spring AI Alibaba Graph 使用指南与源码解读

阿里巴巴云原生

阿里云 微服务 云原生 Spring AI Alibaba

AI Agent热潮还能火多久?

Techinsight

免费不限量,通义灵码已经全面支持 Qwen3-coder 模型,“效果很惊艳”

阿里云云效

OpsPilot 动态知识图谱上线:让企业知识具备“理解力”与“关联力”

嘉为蓝鲸

智能运维 #WeOps OpsPilot

C#解析JSON数据全攻略

量贩潮汐·WholesaleTide

C# json

Bonree ONE 发布直通车 | Bonree ONE多地多中心版本首发!全行业部署与应用深度解析

博睿数据

2025 制造业必看!当 RPA 遇上 AI Agent,这 5 类流程将被彻底重构

Techinsight

智能化

嘉为蓝鲸CTeam敏捷协同平台:一站式实现Jira迁移与研发管理升级

嘉为蓝鲸

DevOps 智能运维 敏捷协同平台

CMeas效能洞察平台:10分钟,从数据到研发度量报表

嘉为蓝鲸

DevOps 智能运维 效能洞察

Seed 端到端同声传译大模型:3s 延迟,实时声音复刻;昆仑万维 Mureka TTS 更新,支持音色设计丨日报

RTE开发者社区

海淀“小孩哥”用文心快码打造少年编程开源社区

Comate编码助手

少儿编程 代码自动生成 AI 代码助手 AI 编程 文心快码

第十六章 Seo最简单的赚钱方式-广告

溪抱鱼

SEO

Canvas X Draw for Mac 矢量插图设计软件

晨光熹微

【深入解剖Spring事务管理】原理、传播机制与12大失效场景避坑指南

不在线第一只蜗牛

spring

7月25日 矩阵起源亮相深圳DA数智大会,解读多模态大模型驱动的数据处理新方法

MatrixOrigin

Web前端入门:JavaScript 哪些地方需要 try...catch 异常捕获

量贩潮汐·WholesaleTide

前端 Web

传奇IP续作:融合创新技术 数字娱乐产业迎来新发展机遇

江湖老铁

面试官:聊聊RAG的执行流程?

王磊

硬核来袭!「AI 进化论:智算时代 OS 的破局之路」首期直播上线

OpenAnolis小助手

centos AI 操作系统 龙蜥社区 智算时代

直播精彩回顾 | 拆解金融行业“隐形风险”,可观测性守护核心业务生命线

博睿数据

制造业RPA选型全攻略

Techinsight

制造业

企业IM:BeeWorks私有化即时通讯助力高效协作

BeeWorks

即时通讯 IM 私有化部署

Data Agent:超越BI与AI的边界

字节跳动数据平台

Twitter借助漏斗分析提升用户参与度_大数据_Srini Penchikala_InfoQ精选文章