kafka集群搭建文档
概览
Kafka依赖ZooKeeper,所以需要先部署ZooKeeper集群。
环境准备
主机名 | IP |
---|---|
aming01 | 192.168.222.128 |
aming02 | 192.168.222.129 |
aming03 | 192.168.222.130 |
设置主机名,并设置hosts
关闭Selinux、firewalld并安装JDK
安装部署ZooKeeper
说明:以下操作在aming01上操作
-
下载ZooKeeper安装包
wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/stable/zookeeper-3.4.13.tar.gz
-
解压并挪到/usr/local/下
tar zxf zookeeper-3.4.13.tar.gz
mv zookeeper-3.4.13 /usr/local/zookeeper
-
创建数据、日志存放目录及当前节点ID
cd /usr/local/zookeeper
mkdir data
mkdir dataLog
echo "1" > data/myid
-
配置
cp conf/zoo_sample.cfg conf/kafka_zk.cfg
vi conf/kafka_zk.cfg ##更改为如下配置
tickTime=2000
# 数据文件存放位置
dataDir=/usr/local/zookeeper/data
dataLogDir=/usr/local/zookeeper/dataLog
#服务监听端口
clientPort=2181
#选举等待时间
initLimit=5
syncLimit=2
#集群节点信息
server.1=aming01:2888:3888
server.2=aming02:2888:3888
server.3=aming03:2888:3888 -
分发文件
scp -r /usr/local/zookeeper aming02:/usr/local/
scp -r /usr/local/zookeeper aming02:/usr/local/
-
修改id
在aming02上,修改/usr/local/zookeeper/data/myid内容为2,aming03上修改为3
-
添加同步时间的任务计划啊(三台机器都执行)
yum install -y ntpdate
echo "*/5 * * * * ntpdate time.windows.com" >> /var/spool/cron/root
-
启动集群(三台都执行)
/usr/local/zookeeper/bin/zkServer.sh start /usr/local/zookeeper/conf/kafka_zk.cfg
/usr/local/zookeeper/bin/zkServer.sh status /usr/local/zookeeper/conf/kafka_zk.cfg #查看集群状态
/usr/local/zookeeper/bin/zkServer.sh stop /usr/local/zookeeper/conf/kafka_zk.cfg #关闭集群
-
测试连接ZooKeeper
/usr/local/zookeeper/bin/zkCli.sh -server aming01:2181
ZooKeeper常见用法
首先进入到ZooKeeper命令行模式下,可以进行如下操作:
1)查询节点
ls /
2)创建节点
create /test_node 'test node'
说明:节点名称必须以/开头,test_node为节点名称,'test node'为具体数据
创建临时节点
create -e /test_node2 'ephemeral node'
创建序列节点,它会自动加上一堆数字
create -s /s_node 'sequential node'
创建临时序列节点
create -e -s /e_s_node 'ephemeral and sequential node'
3)查看节点状态
stat /test_node
4)查看节点数据内容
get /test_node
5)设置节点数据
set /test_node 'update node data' 10
说明:最后面的数字为版本号
6)删除节点
delete /test_node
注意:如果/test_node下有子节点,则删除会报错,此时可以使用递归删除命令rmr
rmr /test_node
7)设置节点Acl
setAcl /test_node ip:192.168.222.129:rcdwa
8)获取节点Acl
getAcl /test_node
更多指令参考 https://blog.csdn.net/xyang81/article/details/53053642
Kafka集群搭建
说明:我们使用三台机器搭建Kafka集群
-
下载安装包(aming01操作)
wget https://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.1.1/kafka_2.11-2.1.1.tgz
-
解压并挪到/usr/local(aming01操作)
tar zxf kafka_2.11-2.1.1.tgz
mv kafka__2.11-2.1.1 /usr/local/kafka
-
配置(aming01操作)
cd /usr/local/kafka
mkdir logs
vim config/server.properties #按如下方法配置
broker.id=1 #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
port=9092 #当前kafka对外提供服务的端口默认是9092
host.name=192.168.222.128 #本机IP
num.network.threads=3 #这个是borker进行网络处理的线程数
num.io.threads=8 #这个是borker进行I/O处理的线程数
log.dirs=/usr/local/kafka/logs #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
socket.send.buffer.bytes=102400 #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
num.partitions=1 #默认的分区数,一个topic默认1个分区数
log.retention.hours=168 #默认消息的最大持久化时间,168小时,7天
message.max.byte=5242880 #消息保存的最大值5M
default.replication.factor=2 #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
replica.fetch.max.bytes=5242880 #取消息的最大直接数
log.segment.bytes=1073741824 #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168 ),到目录查看是否有过期的消息如果有,删除
log.cleaner.enable=false #是否启用log压缩,一般不用启用,启用的话可以提高性能
zookeeper.connect=aming01:2181,aming02:2181,aming03:2181 #设置zookeeper的连接端口 -
分发到另外两台机器(aming01操作)
scp -r /usr/local/kafka aming02:/usr/local/
scp -r /usr/local/kafka aming03:/usr/local/
-
修改配置文件(aming02/aming03操作)
vim config/server.properties #aming02, 将brokerid设置为2,host.name设置为192.168.222.129
vim config/server.properties #aming03, 将brokerid设置为3,host.name设置为192.168.222.130
-
启动服务(三台都操作)
/usr/local/kafka/bin/kafka-server-start.sh -daemon /usr/local/kafka/config/server.properties
测试
aming01作为生产者,aming03作为消费者
在aming01上执行:
创建一个主题test:一个分区,两个副本
/usr/local/kafka/bin/kafka-topics.sh --create --zookeeper aming01:2181 --replication-factor 2 --partitions 1 --topic test
创建一个生产者(消息发布者)
/usr/local/kafka/bin/kafka-console-producer.sh --broker-list aming01:9092 --topic test
#此时会进入到新的console(以>开头)
在aming03上执行
创建一个消费者(消息订阅者)
/usr/local/kafka/bin/kafka-console-consumer.sh --bootstrap-server aming01:9092 --topic test --from-beginning
#此时也会进入到另外一个console下
再到aming01上的> 下输入一些字符,然后aming03上就可以看到了。
常用命令
-
查看主题
/usr/local/kafka/bin/kafka-topics.sh --list --zookeeper localhost:2181
-
查看主题详情
/usr/local/kafka/bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test
-
删除主题(需设置参数delete.topic.enable=true)
/usr/local/kafka/bin/kafka-topics.sh --zookeeper localhost:2181 --delete --topic test
-
生产者参数查看
/usr/local/kafka/bin/kafka-console-producer.sh
-
消费者参数查看
/usr/local/kafka/bin/kafka-console-consumer.sh