50万奖金+官方证书,深圳国际金融科技大赛正式启动,点击报名 了解详情
写点什么

Pinterest 基于 AWS 规模化使用 Apache Kafka 的实践经验

  • 2018-12-13
  • 本文字数:999 字

    阅读完需:约 3 分钟

Pinterest基于AWS规模化使用Apache Kafka的实践经验

在 Pinterest,Apache Kafka 被用于为实时流应用程序传输数据、记录日志和可视化监控指标。Pinterest 的 Kafka 托管在 AWS 上,为了实现复制和高可用性,其安装使用了 MirrorMaker 和 DoctorKafka 工具。


Pinterest 的技术主管Yu Yang写道,Pinterest 的Kafka安装运行在 2000 多个“代理(broker)”上,分布在 AWS 的三个地区,每天处理 8 亿多条、1.2PB 消息。他们的主要 Kafka 工具集包括 Kafka 的 MirrorMaker 和 Pinterest 自己的 DoctorKafka。MirrorMaker 消费源集群中的数据并将其发布到目标集群,实际上是创建源集群的副本。Pinterest 的团队使用它在三个 AWS 区域之间传播数据。大多数代理都位于 us-east-1,尽管这是 AWS 历史最悠久的区域,但它也有自己的问题。每个集群中的 Kafka 代理分布在三个可用性区域中,每个主题分区的副本都分布在三个区域中,因此,最多可以承受两个代理失败。


Kafka 代理失败很常见。替换失败的代理和重新平衡工作负载“需要谨慎地创建和编辑分区再分配文件,并手动执行 Kafka 脚本命令”,Yang 在前一篇文章中写道。其结果是DoctorKafka,一个自动化这些步骤的开源工具。DoctorKafka 可以检测失败,并自动将工作负载分配给健康的代理。它基于“主代理(master-agent)”模型。“代理体(agent)”在每个代理上运行并收集指标,中央主服务器分析这些指标。中央服务器确定故障并运行命令采取纠正措施。DoctorKafka 是“保守”的,因为它只有在确定的时候才会采取纠正措施,否则就会发出警告。大多数大型 Kafka 部署都会使用一种复制策略,使用 MirrorMaker 或类似的工具


Pinterest 在 AWS d2.2xlarge 实例上运行 Kafka。据 Yang 介绍,由于EBS争用导致的性能问题,他们从st1 EBS磁盘经过吞吐量优化的 c3.2xlarge 实例转到了有本地存储的 d2 实例。然而,其他人在他们的基准测试中报告了相反的结果。Kafka 还构成了 Pinterest 日志基础设施的基础,每天处理 100+TB 的数据。服务将数据写到磁盘,日志代理Singer从磁盘获取数据并写到 Kafka。另一个自定义工具Secor从 Kafka 获取日志消息,并将它们持久化到 S3,以克服“Kafka 的弱最终一致性模型”的不足。


未来,Pinterest 将探索把Kubernetes作为 Kafka 部署的抽象层,一些组织已经在这样做了。Pinterest 的一些服务已经转移到容器中。另一个目标是再次探索 EBS 存储,因为新的 EBS 产品经过了更好的优化。


查看英文原文:Scaling Apache Kafka at Pinterest


2018-12-13 14:001750
用户头像

发布了 1008 篇内容, 共 441.2 次阅读, 收获喜欢 346 次。

关注

评论 2 条评论

发布
用户头像
企鹅3362六29503 高速外..网.梯.子 免.费试..用 gma.il/ytb/twi.tt无限.制 这世上有一条路无论如何也不能走,那就是歧途,只要走错一步结果都会是粉身碎骨。
2019-01-02 20:21
回复
没有更多了
发现更多内容

pha挖矿/phala挖矿APP系统开发内容

妇与术(三):机器人可以没有性别,但关系技术离不开女性

脑极体

🏆 【JVM 性能调优】「对象内存分配」输出常用参数

码界西柚

JVM 7月日更

Spring到底应该学哪些内容?

冰河

spring aop ioc 注解驱动 依赖反转

如何看待技术采用生命周期 | 【话题讨论】

耳东@Erdong

云原生 话题讨论 7月日更

腾讯一面 Java Phaser 并发编程的理解与应用

陈皮的JavaLib

Java 面试 多线程

IntelliJ IDEA必备7款Python插件

Jackpop

IDEA pycharm

架构实战营模块8 课后作业

En wei

架构实战营

就在今天,浪潮云说第二期来啦

云计算

见康乘拼团软件开发|见康乘拼团系统APP开发

为啥Java应用迁移到容器后会出现OOM?

Java架构师迁哥

2020年的焦虑与忧伤

Emotion

疫情 考研 研究生

Rust从0到1-智能指针-Drop trait

rust smart pointer drop trait

与微软、IBM同台 斯图飞腾Stratifyd入选G2文本分析Grid报告

十二张图,一脚踹开消息队列的大门

三分恶

消息队列

Python利器!Jupyter最大威胁终于来了

Jackpop

Python Jupyter Notebook

什么是数据集市

奔向架构师

数据仓库 数据架构 7月日更

React 18探秘(上)

Teobler

大前端 React

领域驱动设计101 - 聚合

luojiahu

领域驱动设计 DDD

多地“真金白银”力撑区块链,中西部欲弯道超车新赛道

CECBC

公司内部使用的数仓命名规范

白贺BaiHe

大数据 数仓 数仓规范 7月日更

深入理解搜索引擎——初识query理解

药老算法

搜索引擎 中文分词 query理解 query纠错 query分析

【LeetCode】主要元素Java题解

Albert

算法 LeetCode 7月日更

图的应用——关键路径

若尘

数据结构

测试开发之网络篇-常用命令

禅道项目管理

Linux 命令行

魔方、齿轮、融合剂:当新ICT技术邂逅教育产业

脑极体

Vue3 + TypeScript 开发实践总结

程序员海军

typescript 大前端 Vue3 框架

在线base64加密解密工具

入门小站

工具

【Flutter 专题】92 图解 Dart 单线程实现异步处理之 Isolate (一)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 7月日更

凭借这5步,我30分钟学会了Python爬虫!

Jackpop

爬虫 爬虫教程

Linux之find exec

入门小站

Linux

Pinterest基于AWS规模化使用Apache Kafka的实践经验_语言 & 开发_Hrishikesh Barua_InfoQ精选文章