写点什么

Facebook 开源分布式日志存储系统 LogDevice

  • 2018-10-08
  • 本文字数:1096 字

    阅读完需:约 4 分钟

Facebook开源了他们的内部分布式日志存储项目LogDevice。它通过复制、持久日志存储和故障恢复实现写入高可用性。

Facebook 的大多数需要记录日志应用程序都需要写入高可用性、持久的日志存储以及在性能和延迟方面要求各不相同的工作负载。另一个非常重要的要求是能够承受硬件故障。Facebook 有一个叫作 Scribe 的旧项目侧重于将日志聚合到集中式存储中,但这种方案存在数据丢失的情况。Scribe 现在使用 LogDevice 作为日志存储后端。

Facebook 将 LogDevice 用在数据中心内部的流式处理管道、数据库索引更新的发布、机器学习管道、复制管道和持久任务队列(每秒摄取超过 1TB 的数据)中。尽管 Facebook 已经构建了很多用于管理 LogDevice 集群的开源工具,但还没有将它们开源出来,除了一些基本的工具集。 LDShell 工具可用于从命令行管理集群,并且可以使用 LDQuery 命令来查看集群统计信息。

LogDevice 使用“日志记录”抽象来划分单个日志事件,为每个记录分配一个称为日志序列号(LSN)的唯一 ID。LSN 由“Sequencer”组件基于时间点生成,而时间点保存在 ZooKeeper 中。LogDevice 只能以追加的模式写入记录,也就是说,一旦写入记录就无法修改。与大多数日志存储系统一样,LogDevice 会“修剪”记录,即基于时间或空间策略的日志轮换。它还可以按需进行日志修剪。除此之外,对日志的存储时间没有限制。

LogDevice 通过在不同的计算机节点上存储每个日志记录的多个副本来实现高可用性,尤其是写入高可用性。每条记录可以跨20-30 个存储节点复制。不过,如果某些具有某条日志副本的计算机速度很慢或不可用,那么该日志写入次数的增加会限制吞吐量。LogDevice 可以自动检测哪些节点已失效,并不再往这些节点写入新记录。它试图通过尽可能多的复制尽减少硬件故障的影响,并尽可能快地“重建”丢失的副本。在重建过程中,“可以以每秒5-10GB 的速率进行恢复”。LogDevice 底层存储基于RocksDB,它也是由Facebook 开源的一个键值存储系统。

LogDevice 团队还必须应对其他挑战,他们发现,LogDevice 的用户会执行回填(backfill),请求几个小时或几天内的旧数据。这些请求由使用 LogDevice 日志的下游服务发出,当这些服务从故障中恢复并重新处理日志时就会发生回填。LogDevice 通过在“节点集”之间分摊读取负载来应对这些读取高峰。

LogDevice 可以与 Apache BookKeeper Apache Kafka 等其他日志存储系统进行对比。其中与 Kafka 的主要区别似乎是LogDevice 将计算和存储进行了分离,主要是为了应对Facebook 规模的日志。LogDevice 是用C++ 开发的,并托管在 GitHub 上。

查看英文原文 Facebook Open Sources LogDevice - a Distributed Data Store for Log Storage

2018-10-08 10:232322
用户头像

发布了 731 篇内容, 共 478.9 次阅读, 收获喜欢 2008 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

【Dubbo3终极特性】「流量治理体系」一文教你如何搭建Dubbo3的控制台服务Dubbo-Admin

码界西柚

dubbo RPC Dubbo3 Dubbo-Admin

ZBC即将登录Coinbase Institutional,2023年以全新姿态出发

BlockChain先知

Datawhale学习笔记【阿里云天池 金融风控-贷款违约预测】task1 赛题理解

一颗小树

机器学习 机器学习笔记

TiCDC 源码阅读(三)TiCDC 集群工作过程解析

PingCAP

TiDB 源码解读

简述JavaScript键盘事件

devpoint

JavaScript 事件监听 事件冒泡 键盘事件

2022 年行摄回忆录

穿过生命散发芬芳

盘点2022 行摄回忆录

也谈证券行业数字化转型中的业务与IT融合(上)

王和全

敏捷 需求管理 需求 数字化转型 需求分析

高效节能 | 智慧灯杆综合管理解决方案

AIRIOT

物联网 智慧灯杆

ZBC即将登录Coinbase Institutional,生态开年迎新利好

股市老人

ZBC即将登录Coinbase Institutional,生态开年迎新利好

鳄鱼视界

软件测试/测试开发 | 接口自动化测试之JSON Schema模式该如何使用?

测试人

软件测试 接口测试 测试开发 JSON Schema 测试开发自动化测试

代码影响范围工具探索

京东科技开发者

测试 源代码 企业号 1 月 PK 榜 代码影响范围

Linux Radix Tree详解

Linux内核拾遗

数据结构 Linux内核 Radix Tree

业务-研发一体化管理平台,存在吗?

FinFish

小程序 小程序管理平台 小程序技术

ZBC即将登录Coinbase Institutional,生态开年迎新利好

西柚子

大型软件通过“云应用”即点即用,能解决元宇宙的开发之难吗?

B Impact

2022年的魔力象限领导者,为什么是华为数通?

白洞计划

华为

「Go框架」剖析iris中错误码路由的运行机制

Go学堂

golang 开源 个人成长 签约计划第三季

一种面向业务配置基于JSF广播定时生效的工具

京东科技开发者

jdk 后段技术 企业号 1 月 PK 榜 ducc jsf

从做技术到做技术管理

石云升

极客时间 技术管理 1月月更 技术领导力实战笔记

“零”代码改动,静态编译让太乙Stable Diffusion推理速度翻倍

OneFlow

人工智能 深度学习

一份价格,双份收货,彻底搞定 PPT,兔年解放你自己

博文视点Broadview

华为云服务治理 — 隔离仓的作用

秃头也爱科技

DCS分布式缓存服务实例类型介绍

秃头也爱科技

华为云发布CodeArts Req需求管理工具,让需求管理化繁为简

科技怪授

华为云

“会说话”的产品包装?“码”上查看!

旺链科技

区块链 区块链技术 区块链溯源

推荐一款较好的小程序管理平台

FinFish

小程序 小程序管理平台 小程序管理

揭开华为云CodeArts TestPlan启发式测试设计神秘面纱!

科技怪授

华为云

标准发布 |《企业数字化成熟度模型IOMM》(中小企业)发布

信通院IOMM数字化转型团队

数字化转型 IOMM ICT深度观察

2022年度 FinClip 扩展SDK推荐!

FinClip

Facebook开源分布式日志存储系统LogDevice_Meta_Hrishikesh Barua_InfoQ精选文章