kafka - 随笔分类 - 晓枫的春天

Kafka-Eagle监控

摘要：Kafka-Eagle框架可以监控Kafka集群的整体运行情况，在生产环境中经常使用。 1、MySQL环境准备 Kafka-Eagle的安装依赖于MySQL，MySQL主要用来存储可视化展示的数据。链接：https://pan.baidu.com/s/1fRHTwUgJciAT8g8IZhdrFQ 阅读全文

posted @ 2022-04-06 11:38 晓枫的春天阅读(457) 评论(0) 推荐(0) 编辑

Kafka 消费者（二）

摘要：1、offset位移 1.1、offset的默认维护位置从0.9版本开始，consumer默认将offset保存在Kafka一个内置的topic中，该topic为__consumer_offsets，Kafka0.9版本之前，consumer默认将offset保存在Zookeeper中 __con 阅读全文

posted @ 2022-04-05 11:44 晓枫的春天阅读(188) 评论(0) 推荐(0) 编辑

Kafka 消费者（一）

摘要：1、kafka 消费方式 pull（拉）模式：Kafka 消费方式消费速度：10m/s消费速度：20m/s消费速度：50m/s➢push（推）模式：consumer采用从broker中主动拉取数据。Kafka采用这种方式。 push（推）模式：Kafka没有采用这种方式，因为由broker决定消息发阅读全文

posted @ 2022-04-04 20:55 晓枫的春天阅读(384) 评论(0) 推荐(0) 编辑

Kafka Broker（二）

摘要：1.1、副本基本信息 Kafka副本作用：提高数据可靠性。 Kafka默认副本1个，生产环境一般配置为2个，保证数据可靠性；太多副本会增加磁盘存储空间，增加网络上数据传输，降低效率。 Kafka中副本分为：Leader和Follower。Kafka生产者只会把数据发往Leader，然后Followe 阅读全文

posted @ 2022-04-04 16:20 晓枫的春天阅读(75) 评论(0) 推荐(0) 编辑

Kafka Broker（一）

摘要：1、Kafka Broker 工作流程 1.1、Zookeeper 存储的 Kafka 信息 [hui@hadoop103 zookeeper-3.4.10]$ bin/zkCli.sh [zk: localhost:2181(CONNECTED) 0] ls / [zookeeper, spark 阅读全文

posted @ 2022-03-31 08:02 晓枫的春天阅读(321) 评论(0) 推荐(0) 编辑

kafka 生产者（二）

摘要：1、提高吞吐量想要提高生产者的吞吐量可以通过调整一下4个参数来实现 batch.size：批次大小，默认16k linger.ms：等待时间，修改为5-100ms compression.type：压缩snappy RecordAccumulator：缓冲区大小，修改为64m 代码实现 publi 阅读全文

posted @ 2022-03-30 07:22 晓枫的春天阅读(95) 评论(0) 推荐(0) 编辑

kafka 生产者（一）

摘要：1、生产者消息发送流程 1.1、发送原理在消息发送的过程中，涉及到了两个线程——main线程和Sender线程。在main线程中创建了一个双端队列RecordAccumulator。main线程将消息发送给RecordAccumulator，Sender线程不断从RecordAccumulator 阅读全文

posted @ 2022-03-29 16:35 晓枫的春天阅读(362) 评论(0) 推荐(0) 编辑

Kafka 基本使用

摘要：1、安装部署 1.1、集群规划 hadoop103 hadoop104 hadoop105 zk zk zk kafka kafka kafka 1.2、安装&配置下载地址 https://kafka.apache.org/downloads.html 解压安装包，重命名安装路径 [hui@had 阅读全文

posted @ 2022-03-28 14:37 晓枫的春天阅读(103) 评论(0) 推荐(0) 编辑

nohup: 无法运行命令 ‘/bin/java‘: 没有那个文件或目录

摘要：问题场景单独执行 /opt/module/kafka/bin/kafka-server-start.sh -daemon /opt/module/kafka/config/server.properties 可以正常启动 kafka 但是封装了群起脚本如下 #!/bin/sh case $1 in 阅读全文

posted @ 2022-03-27 12:30 晓枫的春天阅读(1264) 评论(0) 推荐(1) 编辑

Kafka 概述

摘要：1、Kafka 定义 Kafka传统定义：Kafka是一个分布式的基于发布/订阅模式的消息队列（MessageQueue），主要应用于大数据实时处理领域；发布/订阅：消息的发布者不会将消息直接发送给特定的订阅者，而是将发布的消息分为不同的类别，订阅者只接收感兴趣的消息； Kafka最新定义：Kaf 阅读全文

posted @ 2022-03-27 09:24 晓枫的春天阅读(94) 评论(0) 推荐(0) 编辑

滴水穿石不是靠力，而是因为不舍昼夜。

随笔分类 - kafka

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论