Kafka
中的ISR
、AR
又代表什么?
ISR
:与leader
保持同步的follower
集合;AR
:分区的所有副本。
Kafka
中的HW
、LEO
等分别代表什么
LEO
:每个副本的最后条消息的offset
;HW
:一个分区中所有副本最小的offset
。
Kafka
中是怎么体现消息顺序性的?
每个分区内,每条消息都有一个offset
,故只能保证分区内有序。
Kafka
中的分区器、序列化器、拦截器是否了解?它们之间的处理顺序是什么?
拦截器 -> 序列化器 -> 分区器
Kafka
生产者客户端的整体结构是什么样子的?使用了几个线程来处理?分别是什么?
- “消费组中的消费者个数如果超过
topic
的分区,那么就会有消费者消费不到数据”这句话是否正确?
正确
- 消费者提交消费位移时提交的是当前消费到的最新消息的
offset
还是offset
+1?
offset
+1
- 有哪些情形会造成重复消费?
commitSync
(同步提交)和commitAsync
(异步提交)均可能会提交offset
失败。commitSync
会失败重试,一直到提交成功(如果由于不可恢复原因导致,也会提交失败);而commitAsync
则没有失败重试机制,故有可能提交失败。
- 那些情景会造成消息漏消费?
先提交offset
,后消费
- 当你使用
kafka-topics.sh
创建(删除)了一个topic
之后,Kafka
背后会执行什么逻辑?
①会在zookeeper
中的/brokers/topics
节点下创建一个新的topic
节点;
②触发Controller
的监听程序;
③kafka Controller
负责topic
的创建工作,并更新metadata cache
。
topic
的分区数可不可以增加?如果可以怎么增加?如果不可以,那又是为什么?
bin/kafka-topics.sh --zookeeper localhost:2181/kafka --alter --topic
topic-config --partitions 3
topic
的分区数可不可以减少?如果可以怎么减少?如果不可以,那又是为什么?
不可以减少,被删除的分区数据难以处理。
Kafka
有内部的topic
吗?如果有是什么?有什么所用?
__consumer_offsets
:保存消费者offset
Kafka
分区分配的概念?
一个topic
多个分区,一个消费者组多个消费者,故需要将分区分配个消费者(roundrobin
、range
)
- 简述
Kafka
的日志目录结构?
每个分区对应一个文件夹,文件夹的命名为topic-0
,topic-1
,内部为.log
和.index
文件。
- 如果我指定了一个
offset
,Kafka Controller
怎么查找到对应的消息?
offset
-当前分区第一个offset
的值然后就是对应的offset
的值。
- 聊一聊
Kafka Controller
的作用?
负责管理集群broker
的上下线,所有topic
的分区副本分配和leader
选举等工作。
Kafka
中有那些地方需要选举?这些地方的选举策略又有哪些?
partition leader
(ISR
),controller
(先到先得)
- 失效副本是指什么?有那些应对措施?
不能及时与leader
同步,暂时踢出ISR
,等其追上leader
之后再重新加入
Kafka
的那些设计让它有如此高的性能?
分区,顺序写磁盘,0-copy