FinOps有望降低企业50%+的云成本! 了解详情
写点什么

LinkedIn 使用 Kafka 日均处理消息超 4.5 万亿条

  • 2019-08-13
  • 本文字数:997 字

    阅读完需:约 3 分钟

LinkedIn使用Kafka日均处理消息超4.5万亿条


LinkedIn总部位于美国加利福尼亚州山景城,是一家全球最大的职业社交网站,成立于 2002 年 12 月,于 2011 年 5 月 20 日在美上市。截至目前,LinkedIn 一共有超过 6.45 亿会员,超过 2000 万个工作岗位。LinkedIn 目前使用 Kafka 日均处理消息超 4.5 万亿条,并已决定将所有工作负载迁移到 Azure 公有云上。


2009 年,LinkedIn 注册用户超过 5000 万人。2014 年,其注册用户规模已经超过 3 亿。而今天,LinkedIn 已经拥有超过 6.45 亿注册用户,超过 2000 万个工作岗位,每八秒钟就有一个人通过 LinkedIn 被雇佣。


伴随业务规模的不断扩大,LinkedIn 的技术团队需要成长得更加健壮,才能满足业务需求。LinkedIn 的技术团队创造了一个世界级的基础设施和一套工具和产品,使用 Project Inversion 重建了整个软件开发基础设施,并且选择将技术团队造的轮子开源,回馈社区与其他公司。在 LinkedIn 的数据基础设施中,Kafka 是核心支柱之一。


LinkedIn 在 2011 年 7 月开始大规模使用 Kafka,当时 Kafka 每天大约处理 10 亿条消息,这一数据在 2012 年达到了每天 200 亿条,而到了 2013 年 7 月,每天处理的消息达到了 2000 亿条。2015 年,他们的最新记录是每天利用 Kafka 处理的消息超过 1 万亿条,在峰值时每秒钟会发布超过 450 万条消息,每周处理的信息是 1.34 PB。每条消息平均会被 4 个应用处理。在使用 Kafka 的最初四年中,实现了 1200 倍的增长。2019 年,这个数字已经变成了 4.5 万亿条。


LinkedIn 在将 Kafka 捐献给 Apache 基金会后,也在持续打磨、优化着 Kafka 的使用与生态。随着规模的不断扩大,LinkedIn 更加关注于 Kafka 的可靠性、成本、安全性、可用性以及其他的基础指标。


LinkedIn 在 Kafka 上的主要关注领域包括:


  • 配额(Quotas)

  • 开发新的 Consumer

  • 可靠性和可用性的提升

  • 安全性

  • ……


除了关注打磨 Kafka 技术本身以外,LinkedIn 还针对 Kafka 构建了一套完整的生态系统,以解决日益增长的业务规模所带来的新挑战。



上图并不能完全反映 LinkedIn 的各种数据管道和拓扑结构,但足以说明 LinkedIn 的 Kafka 部署的关键部分,以及它们是怎样相互作用。


另据了解,LinkedIn 目前正在更换其数据中心,计划在未来几年向 Azure 迁移,并将关键业务数据委托给云平台。LinkedIn 高级副总裁 Mohak Shroff 表示,这将是该公司史上最大的技术转型之一,预计至少需要三年时间才能完成 6.45 亿用户数据迁移,以避免损害网站的可访问性、可靠性和性能。


2019-08-13 11:5817675
用户头像
小智 让所有人认同的文字称不上表达

发布了 408 篇内容, 共 363.7 次阅读, 收获喜欢 1952 次。

关注

评论

发布
暂无评论
发现更多内容

人设崩塌的美国生物实验室

脑极体

疫情闭关修炼半个月,我竟把JDK源码都读懂了!

996小迁

Java 编程 架构 面试 程序人生

【高并发】ReadWriteLock怎么和缓存扯上关系了?!

冰河

并发编程 读写锁 高并发 ReadWriteLock 签约计划第二季

week9-homework

J

5G最核心的本质是能力可被编排及开放

JiangX

5G 数字化转型 28天写作

大数据知识专栏 - Hadoop的资源管理 Yarn介绍

小马哥

大数据 hadoop YARN 七日更

HTML(六)——html表单

程序员的时光

程序员 大前端 七日更 28天写作

从零开始学java第一天(为报训练营做准备)

落曦

用docker-compose快速部署ChirpStack

远鹏

Docker-compose IoT ChirpStack LoraWan Go 语言

你有多久没去看海了呢「幻想短篇 15/28」

道伟

28天写作

厉害!腾讯T3-2都还在学的微服务+MySQL+Kafka+boot2.x+虚拟机PDF

Java架构之路

Java 程序员 架构 面试 编程语言

28天瞎写的第二百二十六天:TechCrunch Hackathon 的故事

树上

28天写作

soul 数据同步(三)http长轮询 同步策略

xzy

项目管理系列(8)-从0到1搭建PMO(一)

Ian哥

28天写作

惊悚,单个java进程占用700%的CPU

万里无云

Java 后端 cpu

【并发编程的艺术】JVM内存模型

程序员架构进阶

架构 Java内存模型 Java虚拟机 28天写作

关于“为更新而更新”的一种新的理解

Nydia

深度 | 阿里云蒋江伟:什么是真正的云原生?

阿里巴巴云原生

云计算 容器 运维 云原生 k8s

一个系统小BUG修复投产居然花了3个小时来处理(上)

罗小龙

28天写作 投产事故 解决思路

如何开发一个完善的Kafka生产者客户端?

码农架构

kafka 架构 中间件 消息中间件

区块链数字货币钱包系统软件开发|区块链数字货币钱包APP开发

系统开发

史上最全!阿里巴巴2021年最新最全500道Java后端面试大全(值得收藏)

Java 编程 程序员 面试

Windows AD 是否开启或者关闭了UAC服务

BigYoung

windows Windows 10

历史上的今天

IT蜗壳-Tango

七日更

技术招聘常被吐槽,企业应该考虑好这一点

李忠良

28天写作

2020 总结 | VoltDB的亮点,你了解多少?

VoltDB

数据库 物联网 VoltDB

2050年的一次出游 (28天写作 Day15/28)

mtfelix

自动驾驶 28天写作 科幻写作

week9-conclusion

J

共识算法的简单理解(一)

石君

28天写作

产品质量管理活动流程

L3C老司机

无代码、Excel与Airtable

lidaobing

低代码 Excel 无代码开发 28天写作 Airtable

  • 需要帮助,请添加网站小助手,进入 InfoQ 技术交流群
LinkedIn使用Kafka日均处理消息超4.5万亿条_大数据_小智_InfoQ精选文章