深入了解Kafka【五】Partition和消费者的关系
1、消费者与Partition
以下来自《kafak权威指南》第4章。
假设主题T1有四个分区。
1.1、一个消费者组
1.1.1、消费者数量小于分区数量
只有一个消费者时,消费者1将收到4个分区的全部消息。
当有两个消费者时,每个消费者将分别从两个分区接受消息。
1.1.2、消费者数量等于分区数量
当有四个消费者时,每个消费者都可以接受一个分区的消息。
1.1.3、消费者数量大于于分区数量
当有五个消费者时,会有闲置的消费者。
1.2、两个消费者组
消费者群组之间是互不影响的,如图:
2、分区分配策略
当消费者加入群组的时候,会根据分区分配策略决定哪些分区分配给哪些消费者。
Kafka有两种分配策略:Range和RoundRobin。
- Range
Topic的若干个连续的Partition分配给消费者。 - RoundRobin
Topic的所有Partition逐个分配给消费者。
3、分区Rebalance(再均衡)
- 有新的消费者加入消费者群组
- 已有的消费者退出消费者群组
- 订阅的主题的分区发生变化
以上三种情况都会触发分区的重新分配,重新分配的过程叫Rebalance(再均衡)。
Rebalance给消费者群组带来了高可用性与伸缩性,但是在Rebalance期间,消费者无法读取消息,整个群组一小段时间不可用,而且当分区被重新分配给另一个消费者时,消费者当前的读取状态会丢失。
文章首发于:ClawHub的博客