如何 0 成本启动全员 AI 技能提升?戳> 了解详情
写点什么

Netflix 采用 RAW Hollow 内存对象存储对 Tudum 的 CQRS 架构进行了重新设计

  • 2025-08-18
    北京
  • 本文字数:1220 字

    阅读完需:约 4 分钟

大小:611.34K时长:03:28
Netflix采用RAW Hollow内存对象存储对Tudum的CQRS架构进行了重新设计

Netflix用内部开发的RAW Hollow内存对象存储替换了基于Kafka和Cassandra的CQRS实现。Tudum 的新架构在编辑过程中提供了更快的内容预览,并为访问者提供更快的页面渲染。

 

Netflix 在 2021 年底推出了其官方粉丝网站 Tudum,为对该公司节目相关内容感兴趣的 Netflix 用户提供了一个集合点。网站架构最初基于命令查询责任分离(Command Query Responsibility Segregation,CQRS)模式,以优化读取性能,以便于为用户提供内容。

 

平台的写入部分是围绕第三方 CMS 产品构建的,并有一个专门的摄取服务来处理通过 webhook 传递的内容更新事件。摄取服务负责将 CMS 数据转换为针对读取优化过的页面内容,这是通过应用模板以及数据验证和转换来实现的。然后,经过读取优化的数据会被发布到一个专门的 Kafka 主题。


初始 Tudum 的数据架构(来源:Netflix工程博客

 

在查询方面,页面数据服务负责消费 Kafka 主题的消息,并将数据存储在Cassandra查询数据库中。该服务使用缓存来提高性能,为页面构建服务和其他内部服务提供已存储的页面数据。

 

初始架构能够从读写路径的解耦中受益,允许独立扩展。然而,由于缓存刷新周期的问题,CMS 更新需要许多秒后才能显示在网站上。这个问题使得内容编辑器预览他们的修改变得问题重重,并且随着内容量的增长,问题逐渐恶化,导致延迟持续数十秒之久。

 

技术布道师Eugene Yemelyanau和 Netflix 的主任工程师Jake Grice描述了由于缓存导致检索内容显示延迟的原因:

无论哪个系统修改数据,缓存都会在每个刷新周期进行更新。如果你有 60 个键,并且刷新间隔为 60 秒,缓存将每秒更新一个键。这对于预览最近的修改是有问题的,因为这些变化只有在每次缓存刷新时才会反映出来。随着 Tudum 内容的增长,缓存刷新时间增加,这进一步增加了延迟。

 

最终,团队决定彻底改革架构,以消除预览内容更新的延迟,理想情况下。工程师选择利用RAW Hollow,这是一个自制的内存对象数据库。Netflix 设计了这个数据库来处理小到中等的数据集,并支持强写后读一致性(read-after-write consistency)。RAW Hollow 允许整个数据集驻留在集群中每个应用程序进程的内存中,提供低延迟和高可用性。数据库默认提供最终一致性,但支持在单个请求级别上的强一致性。


修改后的 Tudum 数据架构(来源:Netflix工程博客

 

Tudum 工程师用 RAW Follow 集群替换了 Kafka 和 Cassandra,涵盖了摄取和页面构建服务实例。团队最终得出结论,对于手头的用例,CQRS 设计模式并不是最佳方法,使用分布式内存对象存储更适合这种情况。新解决方案消除了缓存失效的问题,因为整个数据集可以适应应用程序的内存,借助 Hollow 的数据压缩,将数据大小减少到 Apache Iceberg 表中未压缩大小的 25%。

 

由于架构改善以及支持数据迁移,平台能够从数据传播时间和页面构建次数的显著减少中获益,这是由于减少了请求 I/O 和往返时间。Tudum 工程师相信新架构为编辑器和访问者提供了最佳的体验。

 

原文链接:

 Netflix Revamps Tudum’s CQRS Architecture with RAW Hollow In-Memory Object Store

2025-08-18 15:005917

评论

发布
暂无评论

企业业务前端监控实践

京东科技开发者

高并发场景下的库存管理,理论与实战能否兼得?

京东科技开发者

从困境到突破,EasyMR 集群迁移助力大数据底座信创国产化

袋鼠云数栈

集群架构 大数据存储 大数据计算与存储 大数据计算引擎 集群迁移

云手机:海外社媒运营必备工具

Ogcloud

云手机 海外云手机 云手机海外版 云手机群控 海外社媒运营

构建数据中台,引领零售业数字化转型的最佳实践

数造万象

数据中台 零售 数字化 数据智能 实践案例

言犀智能体平台上线了!赶紧来试试!连接大模型与企业应用的“最后一公里”

京东科技开发者

Grafana 与观测云:无缝集成的监控可视化体验

可观测技术

数据可视化

润开鸿“龙芯+OpenHarmony”开发平台DAYU431先锋派新品发布

坚果

OpenHarmony 润开鸿

最佳实践:解读GaussDB(DWS) 统计信息自动收集方案

华为云开发者联盟

大数据 GaussDB(DWS) 企业号 8 月 PK 榜 2024企业号8月pk 实时查询

一文全面了解HPC高性能计算平台是什么、怎么选型?高性能计算平台CHPC 都能做什么?

XxinQi

解锁亚马逊商品数据:API获取商品列表信息

tbapi

亚马逊API 亚马逊商品数据采集 亚马逊商品列表接口

2024 年 7 月区块链游戏研报:市场波动与数据分化的挑战与机遇

Footprint Analytics

链游

官宣|Apache Flink 1.20 发布公告

Apache Flink

flink 实时计算 官宣

Supersonic 发行逻辑:从原型到爆款,健康增长循环助力开发者走向成功

极客天地

Prometheus Exporter 在观测云中的应用与优势

可观测技术

#Prometheus

安全性和合规性:保障企业数据的安全

可观测技术

数据安全 数据合规

观测云:多云架构下的监控革新与效能提升

可观测技术

监控 多云

NFTScan 正式上线 Gravity NFTScan 浏览器和 NFT API 数据服务

NFT Research

NFT NFTScan

腾讯云大数据 TBDS 参编信通院《数据库发展研究报告》,引领数据湖仓创新

腾讯云大数据

TBDS

ai做ppt的工具哪个好?盘点8个好用的AIPPT生成软件!

彭宏豪95

效率工具 职场 PPT 办公软件 AI生成PPT

免费一站式搭建企业云上数据库与BI 数据可视化分析平台

XxinQi

观测云:零售业数据监控与分析的革新者

可观测技术

监控 零售

最新进展!Intel 18A产品,成功点亮!

E科讯

继“蓝屏”事件之后,微软再次出现全球性宕机

我再BUG界嘎嘎乱杀

黑客 网络安全 安全 DDoS 网安

在国内怎么运营TikTok?试试云手机!

Ogcloud

云手机 海外云手机 tiktok云手机 云手机海外版 海外云手机推荐

将数据库系统实践转向 AI:使用生成式 AI 创建高效的开发和维护实践

哦豁完蛋了

AI Codec

Netflix采用RAW Hollow内存对象存储对Tudum的CQRS架构进行了重新设计_架构_Rafal Gancarz_InfoQ精选文章