Kafka无法消费，究竟是bug的错还是配置的问题？_文化 & 方法_余洲_InfoQ精选文章

AICon 北京站 Keynote 亮点揭秘，想了解 Agent 智能体来就对了！了解详情 



 写点什么

登录/注册

Kafka无法消费，究竟是bug的错还是配置的问题？

在一个月黑风高的夜晚，突然收到现网生产环境 Kafka 消息积压的告警，梦中惊醒啊，马上起来排查日志。

问题现象

消费请求卡死在查找 Coordinator

Coordinator 为何物？Coordinator 用于管理 Consumer Group 中各个成员，负责消费 offset 位移管理和 Consumer Rebalance。Consumer 在消费时必须先确认 Consumer Group 对应的 Coordinator，随后才能 join Group，获取对应的 topic partition 进行消费。

那如何确定 Consumer Group 的 Coordinator 呢？分两步走：

1、一个 Consumer Group 对应一个__consumers_offsets 的分区，首先先计算 Consumer Group 对应的__consumers_offsets 的分区，计算公式如下：

__consumers_offsets partition# = Math.abs(groupId.hashCode() % groupMetadataTopicPartitionCount，其中 groupMetadataTopicPartitionCount 由 offsets.topic.num.partitions 指定。

2、1 中计算的该 partition 的 leader 所在的 broker 就是被选定的 Coordinator。

定位过程

Coordinator 节点找到了，现在看看 Coordinator 是否有问题：

不出所料，Coordinator 对应分区 Leader 为-1，消费端程序会一直等待，直到 Leader 选出来为止，这就直接导致了消费卡死。

为啥 Leader 无法选举？Leader 选举是由 Controller 负责的。Controller 节点负责管理整个集群中分区和副本的状态，比如 partition 的 Leader 选举，topic 创建，副本分配，partition 和 replica 扩容等。现在我们看看 Controller 的日志：

1.6 月 10 日 15:48:30,006 秒 Broker 1 成为 controller

此时感知的节点为 1 和 2，节点 3 在 zk 读不出来：

31 秒 847 的时候把__consumer_offsets 的分区 3 的 Leader 选为 1，ISR 为[1,2]，leader_epoch 为 14：

再过 1 秒后才感知到 Controller 发生变化，自身清退

2.Broker 2 在其后几百毫秒后(15:48:30,936)也成为 Controller

但是 Broker2 是感知到 Broker 3 节点是活的，日志如下：

注意这个时间点，Broker1 还没在 zk 把__consumer_offsets 的分区 3 的 Leader 从节点 3 改为 1，这样 Broker 2 还认为 Broker 3 是 Leader，并且 Broker 3 在它认为是活的，所以不需要重新选举 Leader。这样一直保持了相当长的时间，即使 Broker 1 已经把这个分区的 Leader 切换了，它也不感知。

3.Broker 2 在 12 号的 21:43:19 又感知 Broker 1 网络中断，并处理节点失败事件：

因为 Broker 2 内存中认为__consumer_offsets 分区 3 的 Leader 是 broker 3，所以不会触发分区 3 的 Leader 切换。

Broker 2 但是在处理失败的节点 Broker 1 时，会把副本从 ISR 列表中去掉，去掉前会读一次 zk，代码如下：

但是发现 zk 中分区 3 的 Leader 已经变为 1，ISR 列表为[1,2]，当要去掉的节点 1 就是 Leader 的时候，Leader 就会变为-1， ISR 只有[2]，从日志也可以看到：

这样分区 3 的 Leader 一直为-1，直到有新的事件触发节点 2 重新选举才能恢复（例如重启某个节点）。

根因总结

出现网络异常后，由于新老 controller 之间感知的可用节点不同，导致新 controller 对某个分区的 Leader 在内存中的信息与 zk 记录元数据的信息不一致，导致 controller 选举流程出现错误，选不出 Leader。需要有新的选举事件才能触发 Leader 选出来，例如重启。

问题总结

这是一个典型的由于网络异常导致脑裂，进而出现了多个 Controller，华为云分布式消息服务（DMS）Kafka 经过电信级的可靠性验证，已经完美解决了这些问题，快点击“阅读原文”了解更多吧！

本文转载自公众号中间件小哥（ID：huawei_kevin）。

原文链接：

https://mp.weixin.qq.com/s/baxyONDEHTlPrSwszjo3Jw

评论

发布

暂无评论

为什么很多程序员，成为不了技术大牛？

实力程序员

一种基于实时分位数计算的系统及方法

云计算大前端云服务

网页端IM通信技术快速入门：短轮询、长轮询、SSE、WebSocket

websocket 消息推送即时通讯 IM

防火墙

学习极客时间安全 5月日更安全攻防技能30讲

前端开发：node.js的node包管理器npm安装以及使用

【数据标注的类型有哪些】看懂这篇文章就够了！

人工智能机器学习大数据数据标注

Flink 实时计算在微博的应用

Docker挂了，数据如何找回

运维研习社

Docker 运维数据恢复 5月日更

深度分享｜中小银行如何实现数字化转型，建设智能营销新体系？

索信达控股

大数据数字化转型金融银行营销数字化

【Flutter 专题】121 图解简易 Slider 滑动条

阿策小和尚

5月日更 Flutter 小菜 0 基础学习 Flutter Android 小菜鸟

微服务架构设计之解耦合

微服务 5月日更

☕【JVM 技术之旅】带你重塑对类加载机制的认识

JVM Java虚拟机类加载器原理分析 5月日更

dubbo的前世今生

k8s 上运行我们的 springboot 服务之——技术方案实现图

k8s SpringBoot 2

多元线性回归模型 - DAY14

5月日更多元线性回归

架构实战营模块4作业

Rust从0到1-泛型-定义

rust 泛型 generic

云智慧发布《智能业务运维》2021年刊邀您共览数字化运维全景象

云智慧AIOps社区

AIOPS 智能运维

一文带你认识MindSpore新一代分子模拟库SPONGE

华为云开发者联盟

神经网络 mindspore 新一代分子模拟库 SPONGE 分子结构

毕业设计So Easy：基于Java语言西餐厅点餐系统

不脱发的程序猿

Java 开源 Java语言西餐厅点餐系统毕业设计

ASP.NET Core整合Zipkin链路跟踪

架构是什么？空中楼阁？不切实际？

Java架构师迁哥

教你用 3 行代码发邮件

Python 学习自动化

超详细的JQuery的 DOM操作，一篇就足够！

华为云开发者联盟

html 大前端 DOM 函数 JQuery框架

树莓派上的 K8S 集群挂了，怎么办？

百度开发者中心

百度技术经验分享

小走神

谈一谈Java的前生今世

Java jdk 发展史

☕【JVM 技术之旅】深入挖掘Java对象的内存结构

JVM java对象分析 java对象 5月日更内存对象结构

Github Action 自动构建 Flutter Android Apk

flutter Github Actions

解密华为云FusionInsight MRS新特性：一架构三湖

华为云开发者联盟

数据湖云原生华为云 FusionInsight MRS TechWave

做开发，这几种锁机制你不得不了解一下

华为云开发者联盟

锁读写锁自旋锁互斥锁优先锁