写点什么

Spotify 的高可靠性事件分发系统概述

  • 2017-04-09
  • 本文字数:836 字

    阅读完需:约 3 分钟

Igor Maravic 在最近的 QCon London 大会上出席演讲,高度概述了Spotify 的事件分发系统和一些运维方面的关键点。他提到Spotify 的事件分发系统在设计上拥有可控延迟,能够处理由Spotify 客户端在高峰时刻每秒生成的150 万事件,且永不丢失事件。

由各种不同的客户端产生的事件有超过250 种事件类型,并且大小从几个字节到几KB 不等。有些事件对零丢失率有严格要求,其中一个例子是歌曲特许权使用费的计算,但是为了简化系统设计,Spotify 的事件分发系统对所有事件都保证100% 分发。所有事件都被存储在按小时归集的区间内,每个区间包含了特定日期某个小时的所有事件。所有的事件都被标记上到达时间,以此来保证事件被存放到相应的区间内。

Spotify 的软件工程师 Maravic 强调,在设计上保证所有事件分发还不够,还必须通过监控来验证设计需求是否被真正的满足了。Spotify 的事件分发系统是由许多微服务构成的复杂的分布式系统。为了发现系统哪部分需要改进、在突发事故发生时简便地找到真实原因以及在数据分发时存在的问题,每一个组件都需要被监控。他们总结了三种类型的监控:

  • 系统监控,用来监控系统的整体运行情况,例如 CPU 和内存的使用情况等。
  • 数据监控,用来检查数据的时效性,保证数据在要求的延迟内分发。
  • 数据丢失率监控,用来监控事件分发的完整性。为了达到这一目的,他们构建了一个工具来监控所有的输入和所有的输出,以此发现数据丢失和其他数据传输问题。

Maravic 提到,尽管他们的系统需要 7*24 小时运行,但是他们并没有一个运维团队;相反,负责开发系统的开发人员也会负责系统的运维,他认为这有益于推动优秀的开发人员成长为卓越的开发人员。

Maravic 曾写过一系列关于系统架构详情的博客,其中包括一些性能报表。

查看英文原文: Overview of the Reliable Event Delivery System at Spotify


感谢冬雨对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-04-09 19:001767

评论

发布
暂无评论
发现更多内容

用友BIP时间轴——回溯历史 预置未来

用友BIP

人力资源

10个不容错过的VSCode插件

互联网工科生

Visual Studio Code

开发者的秘密武器:人工智能与开发工具的完美结合

知者如C

MobPush 最佳实践:消息重弹

MobTech袤博科技

前端 后端 开发者工具 开发 开发工具

NFTScan 与 Decert 达成合作伙伴,双方在 NFT 数据方面展开合作

NFT Research

Web3 Daily NFT\

2023算网融合产业峰会,网心科技边缘计算+AI创新实践获权威认可

网心科技

边缘计算 边缘云 AIGC

版本更新|OpenTiny Vue 发布了 v3.9.0 🎉。

OpenTiny社区

开源 前端 UI组件库

Sentieon | 每周文献-Population Sequencing-第一期

INSVAST

基因数据分析 生信服务 群体基因

低代码技术:提高效率降低成本的全新选择

互联网工科生

软件开发 低代码 应用程序

软件测试/测试开发丨Selenium如何复用已打开浏览器

测试人

Python 程序员 浏览器 软件测试 selenium

华为云Astro低代码三侠「踢馆」 学员:也带带我! ——低代码设计师混入极客挑战赛

华为云PaaS服务小智

云计算 低代码 华为云 华为开发者大会2023

面试上海某小厂Java岗,全程一小时问的全是细节

程序员小毕

数据库 程序员 后端 java面试 八股文

一文看懂SBD(一种基于存储的扩展防护服务)

统信软件

储存

英特尔Lisa Spelman浅谈未来计算:驱动AI创新 释放至强力量

E科讯

Java面试为什么会越来越难?

程序员小毕

程序员 后端 架构师 java面试 八股文

平衡业务合作,推动企业全面预算管理取得成功

智达方通

数据分析 全面预算管理 业务合作

十大功能特性,助力开发者玩转API Explorer

华为云开发者联盟

云计算 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

小红书Java后端一面,被问麻了

程序员小毕

程序员 高并发 架构师 java面试 计算机底层

共筑开源新长城 龙蜥社区走进开放原子校源行-清华大学站

OpenAnolis小助手

操作系统 容器云 开放原子开源基金会 龙蜥社区 清华大学

龙蜥白皮书精选:面向 HTTP 3.0 时代的高性能网络协议栈

OpenAnolis小助手

开源 HTTP 标准化 QUIC 龙蜥白皮书

解读 6 月 NFT 行业:市场停滞,Azuki 崩跌

Footprint Analytics

区块链游戏 NFT NFT链游

比较Postman和JMeter

Liam

程序员 开发 Jmeter Postman

Spotify的高可靠性事件分发系统概述_DevOps & 平台工程_Jan Stenberg_InfoQ精选文章