2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

Netflix 如何在万亿行规模上处理观众数据洞察

作者:Matt Foster

  • 2025-09-26
    北京
  • 本文字数:1152 字

    阅读完需:约 4 分钟

大小:575.48K时长:03:16
Netflix如何在万亿行规模上处理观众数据洞察

在最近的一篇博客文章中,Netflix 的工程师描述了他们如何扩展 Muse 这个公司内部用于数据驱动创意洞察的应用,使其能处理万亿行数据集。

 

Muse 帮助 Netflix 的创意和发布团队了解哪些艺术作品和视频资产能够引起观众的共鸣,而公司的业务增长需要它在大规模数据上支持高级过滤和受众亲和性分析。

 

为了满足这些需求,Netflix 报告称它重新设计了数据服务层,将查询延迟减少了约 50%,同时保持了准确性和响应性。

 

Muse 最初是一个由 Spark 驱动的仪表板,背后是一个适度的 Apache Druid 集群。随着时间的推移,创意团队要求添加异常检测、通知和媒体比较等功能,而数据量增长到了每年数万亿行。满足这些需求需要更低的延迟和更强大的服务层。

 

一个主要挑战来自于受众亲和性:通过算法推断的标签,将成员按喜好分组,如“角色剧粉丝”或“流行文化爱好者”。将这些多对多关系添加到印象和播放数据中增加了复杂性,达到了原来架构的极限。


Muse 应用程序 GUI

 

另一个挑战来自于 Muse 的两个关键指标,一个是印象,也就是资产被展示的次数,还有一个是合格播放,这将播放事件与印象联系起来。两者都需要计算不同的用户,这在 Netflix 的规模上是一项昂贵的操作。

 

为了解决这个问题,团队采用了来自 Apache DataSketches 的 HyperLogLog 草图,这些草图提供了大约 1%误差的估计。

 

草图在两个地方构建:在 Druid 摄取过程中和在 Spark ETL 作业中,后者将每日草图合并成所有时间的聚合。这种方法将整个组织的常见 OLAP 模式的查询延迟减少了大约 50%。

 

为了进一步减轻 Druid 的负载,Netflix 转向了 Hollow,这是其内部的内存键/值存储库。Hollow 提要由 Iceberg 表构建,生产服务器推送更新,Spring Boot 消费者刷新缓存的数据集。这种设置允许 Muse 直接从内存中提供预计算的聚合,如不同国家的可用性、所有时间资产指标和元数据。

 

查询时间从数百毫秒降低到数十毫秒,同时也保护 Druid 免受高并发请求的影响。团队指出,这种权衡是更高的内存使用和更复杂的请求路由,但结果是更大的稳定性和响应性。


当前 Muse 架构

 

最后,Netflix 还花时间调整了 Druid:团队调整了数据在节点之间分割的方式,调整了段的大小以使扫描更有效,并在存储前过滤掉未使用的列。

 

他们还利用 Druid 在单个字段中存储多个值的能力,更好地处理受众亲和性。

 

这些变化,结合早期的改进,将查询时间大致减半,并使系统在重负载下更加一致。

 

为了确保准确性和信任,Netflix 并行运行了遗留和新的度量堆栈,通过自动化的 Jupyter 比较和突出显示差异的应用程序内工具来验证结果。

 

推出是分阶段进行的,由影子测试和细粒度的功能标志支持,以实现安全的回滚。

 

展望未来,Netflix 计划将 Muse 扩展到支持“直播”和游戏,整合概要数据,并完善区分“有效”和“真实”促销资产的指标。

 

原文链接:

How Netflix Powers Audience Insights at Trillion-Row Scale

2025-09-26 11:007203

评论

发布
暂无评论

前端刷完这12道滑动窗口,就可以出山面试了

js2030code

JavaScript LeetCode

软件测试 | HTTPS 的通信加解密过程,证书为什么更安全?

测吧(北京)科技有限公司

测试

软件测试 | 简历中应该如何描述才能体现出软技能的实力?

测吧(北京)科技有限公司

测试

软件测试 | 普罗米修斯 - HTTP API调用PromQL

测吧(北京)科技有限公司

测试

足不出户,搞定IoT设备故障诊断和恢复——实践类

阿里云AIoT

阿里云 物联网 IoT

安卓手机的网络权限,全网最全解答

神锁离线版

android 互联网 安卓 网络权限 安卓权限

软件测试 | 普罗米修斯 - 自定义exporter

测吧(北京)科技有限公司

测试

解决方案| anyRTC 融合其他厂商视频会议系统方案

anyRTC开发者

音视频 私有云 视频会议 视频通话 H.323

OpenMLDB 社区月报 | 2023 年 2 月

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

ONES 获得 SOC2 Type1 鉴证报告,数据安全能力受权威认可

万事ONES

API+DevOps:华为云API Arts一体化平台,端到端呵护您的API

科技怪授

API 华为云

ChatGPT“爆红”启示:工业AI如何掀起新型“工业革命”?

Openlab_cosmoplat

人工智能 开源 工业 智能制造 ChatGPT

OpenMLDB SQL 与标准 SQL 的主要差异

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

Camtasia 2023体验版有哪些新功能

茶色酒

Camtasia Studio2023

存量设备 0 改造,平滑迁移阿里云 IoT 物联网平台最佳实践——实践类

阿里云AIoT

阿里云 物联网 IoT

小程序与微服务架构如何进行结合

Onegun

小程序 微服务架构 移动开发

猫咪在逐步壮大--PUSS通证深度解析

股市老人

软件测试 | 跨平台设备管理方案Selenium Grid

测吧(北京)科技有限公司

测试

十五年,始吾心

博睿数据

可观测性 智能运维 博睿数据 15周年 品牌历史

Airserver2023免费手机投屏电脑工具

茶色酒

AirServer2023

AntDB数据库首个社区版正式发布,携手生态更多可能

亚信AntDB数据库

AntDB 国产数据库 AntDB数据库 企业号 3 月 PK 榜

PCB板漏孔、漏槽怎么办?看工程师避坑“SOP”

华秋PCB

PCB 电路板 PCB设计 钻孔

江苏鸿程大数据:基于鲲鹏DevKit开发数据报告生成平台,数据库查询效率提升30%

极客天地

软件测试| 普罗米修斯 - 基本使用

测吧(北京)科技有限公司

测试

FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态

硬科技星球

mysongbook2023吉他谱永久免费版

茶色酒

mysongbook2023

Exposure2023绿色版本人像滤镜插件下载

茶色酒

Exposure2023

Netflix如何在万亿行规模上处理观众数据洞察_架构_InfoQ精选文章