随笔分类 - kafka
摘要:Kafka-Eagle框架可以监控Kafka集群的整体运行情况,在生产环境中经常使用。 1、MySQL环境准备 Kafka-Eagle的安装依赖于MySQL,MySQL主要用来存储可视化展示的数据。 链接:https://pan.baidu.com/s/1fRHTwUgJciAT8g8IZhdrFQ
阅读全文
摘要:1、offset位移 1.1、offset的默认维护位置 从0.9版本开始,consumer默认将offset保存在Kafka一个内置的topic中,该topic为__consumer_offsets,Kafka0.9版本之前,consumer默认将offset保存在Zookeeper中 __con
阅读全文
摘要:1、kafka 消费方式 pull(拉)模式:Kafka 消费方式消费速度:10m/s消费速度:20m/s消费速度:50m/s➢push(推)模式:consumer采用从broker中主动拉取数据。Kafka采用这种方式。 push(推)模式:Kafka没有采用这种方式,因为由broker决定消息发
阅读全文
摘要:1.1、副本基本信息 Kafka副本作用:提高数据可靠性。 Kafka默认副本1个,生产环境一般配置为2个,保证数据可靠性;太多副本会增加磁盘存储空间,增加网络上数据传输,降低效率。 Kafka中副本分为:Leader和Follower。Kafka生产者只会把数据发往Leader,然后Followe
阅读全文
摘要:1、Kafka Broker 工作流程 1.1、Zookeeper 存储的 Kafka 信息 [hui@hadoop103 zookeeper-3.4.10]$ bin/zkCli.sh [zk: localhost:2181(CONNECTED) 0] ls / [zookeeper, spark
阅读全文
摘要:1、提高吞吐量 想要提高生产者的吞吐量可以通过调整一下4个参数来实现 batch.size:批次大小,默认16k linger.ms:等待时间,修改为5-100ms compression.type:压缩snappy RecordAccumulator:缓冲区大小,修改为64m 代码实现 publi
阅读全文
摘要:1、生产者消息发送流程 1.1、发送原理 在消息发送的过程中,涉及到了两个线程——main线程和Sender线程。在main线程中创建了一个双端队列RecordAccumulator。main线程将消息发送给RecordAccumulator,Sender线程不断从RecordAccumulator
阅读全文
摘要:1、安装部署 1.1、集群规划 hadoop103 hadoop104 hadoop105 zk zk zk kafka kafka kafka 1.2、安装&配置 下载地址 https://kafka.apache.org/downloads.html 解压安装包,重命名安装路径 [hui@had
阅读全文
摘要:问题场景 单独执行 /opt/module/kafka/bin/kafka-server-start.sh -daemon /opt/module/kafka/config/server.properties 可以正常启动 kafka 但是封装了群起脚本如下 #!/bin/sh case $1 in
阅读全文
摘要:1、Kafka 定义 Kafka传统定义:Kafka是一个分布式的基于发布/订阅模式的消息队列(MessageQueue),主要应用于大数据实时处理领域; 发布/订阅:消息的发布者不会将消息直接发送给特定的订阅者,而是将发布的消息分为不同的类别,订阅者只接收感兴趣的消息; Kafka最新定义:Kaf
阅读全文