kafka集群搭建文档

概览

Kafka依赖ZooKeeper,所以需要先部署ZooKeeper集群。

环境准备

主机名IP
aming01 192.168.222.128
aming02 192.168.222.129
aming03 192.168.222.130

设置主机名,并设置hosts

关闭Selinux、firewalld并安装JDK

安装部署ZooKeeper

说明:以下操作在aming01上操作

  • 下载ZooKeeper安装包

    wget https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/stable/zookeeper-3.4.13.tar.gz

  • 解压并挪到/usr/local/下

    tar zxf zookeeper-3.4.13.tar.gz

    mv zookeeper-3.4.13 /usr/local/zookeeper

  • 创建数据、日志存放目录及当前节点ID

    cd /usr/local/zookeeper

    mkdir data

    mkdir dataLog

    echo "1" > data/myid

  • 配置

    cp conf/zoo_sample.cfg conf/kafka_zk.cfg

    vi conf/kafka_zk.cfg ##更改为如下配置

     tickTime=2000
    # 数据文件存放位置
    dataDir=/usr/local/zookeeper/data
    dataLogDir=/usr/local/zookeeper/dataLog
    #服务监听端口
    clientPort=2181
    #选举等待时间
    initLimit=5
    syncLimit=2
    #集群节点信息
    server.1=aming01:2888:3888
    server.2=aming02:2888:3888
    server.3=aming03:2888:3888
  • 分发文件

    scp -r /usr/local/zookeeper aming02:/usr/local/

    scp -r /usr/local/zookeeper aming02:/usr/local/

  • 修改id

    在aming02上,修改/usr/local/zookeeper/data/myid内容为2,aming03上修改为3

  • 添加同步时间的任务计划啊(三台机器都执行)

    yum install -y ntpdate

    echo "*/5 * * * * ntpdate time.windows.com" >> /var/spool/cron/root

  • 启动集群(三台都执行)

    /usr/local/zookeeper/bin/zkServer.sh start /usr/local/zookeeper/conf/kafka_zk.cfg

    /usr/local/zookeeper/bin/zkServer.sh status /usr/local/zookeeper/conf/kafka_zk.cfg #查看集群状态

    /usr/local/zookeeper/bin/zkServer.sh stop /usr/local/zookeeper/conf/kafka_zk.cfg #关闭集群

  • 测试连接ZooKeeper

    /usr/local/zookeeper/bin/zkCli.sh -server aming01:2181

ZooKeeper常见用法

首先进入到ZooKeeper命令行模式下,可以进行如下操作:

1)查询节点

ls /

2)创建节点

create /test_node 'test node' 
说明:节点名称必须以/开头,test_node为节点名称,'test node'为具体数据

创建临时节点
create -e /test_node2 'ephemeral node'

创建序列节点,它会自动加上一堆数字
create -s /s_node 'sequential node'

创建临时序列节点
create -e -s /e_s_node 'ephemeral and sequential node'

3)查看节点状态

stat /test_node

4)查看节点数据内容

get /test_node

5)设置节点数据

set /test_node 'update node data' 10
说明:最后面的数字为版本号

6)删除节点

delete /test_node
注意:如果/test_node下有子节点,则删除会报错,此时可以使用递归删除命令rmr

rmr /test_node

7)设置节点Acl

setAcl /test_node ip:192.168.222.129:rcdwa

8)获取节点Acl

getAcl /test_node

更多指令参考 https://blog.csdn.net/xyang81/article/details/53053642

Kafka集群搭建

说明:我们使用三台机器搭建Kafka集群

  • 下载安装包(aming01操作)

    wget https://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.1.1/kafka_2.11-2.1.1.tgz

  • 解压并挪到/usr/local(aming01操作)

    tar zxf kafka_2.11-2.1.1.tgz

    mv kafka__2.11-2.1.1 /usr/local/kafka

  • 配置(aming01操作)

    cd /usr/local/kafka

    mkdir logs

    vim config/server.properties #按如下方法配置

     broker.id=1  #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
    port=9092 #当前kafka对外提供服务的端口默认是9092
    host.name=192.168.222.128 #本机IP
    num.network.threads=3 #这个是borker进行网络处理的线程数
    num.io.threads=8 #这个是borker进行I/O处理的线程数
    log.dirs=/usr/local/kafka/logs #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
    socket.send.buffer.bytes=102400 #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
    socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
    socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
    num.partitions=1 #默认的分区数,一个topic默认1个分区数
    log.retention.hours=168 #默认消息的最大持久化时间,168小时,7天
    message.max.byte=5242880 #消息保存的最大值5M
    default.replication.factor=2 #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
    replica.fetch.max.bytes=5242880 #取消息的最大直接数
    log.segment.bytes=1073741824 #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
    log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168 ),到目录查看是否有过期的消息如果有,删除
    log.cleaner.enable=false #是否启用log压缩,一般不用启用,启用的话可以提高性能
    zookeeper.connect=aming01:2181,aming02:2181,aming03:2181 #设置zookeeper的连接端口
  • 分发到另外两台机器(aming01操作)

    scp -r /usr/local/kafka aming02:/usr/local/

    scp -r /usr/local/kafka aming03:/usr/local/

  • 修改配置文件(aming02/aming03操作)

    vim config/server.properties #aming02, 将brokerid设置为2,host.name设置为192.168.222.129

    vim config/server.properties #aming03, 将brokerid设置为3,host.name设置为192.168.222.130

  • 启动服务(三台都操作)

    /usr/local/kafka/bin/kafka-server-start.sh -daemon /usr/local/kafka/config/server.properties

测试

aming01作为生产者,aming03作为消费者

在aming01上执行:

创建一个主题test:一个分区,两个副本
/usr/local/kafka/bin/kafka-topics.sh --create --zookeeper aming01:2181 --replication-factor 2 --partitions 1 --topic test

创建一个生产者(消息发布者)
/usr/local/kafka/bin/kafka-console-producer.sh --broker-list aming01:9092 --topic test
#此时会进入到新的console(以>开头)

在aming03上执行

创建一个消费者(消息订阅者)
/usr/local/kafka/bin/kafka-console-consumer.sh --bootstrap-server aming01:9092 --topic test --from-beginning
#此时也会进入到另外一个console下
再到aming01上的> 下输入一些字符,然后aming03上就可以看到了。

常用命令

  • 查看主题

    /usr/local/kafka/bin/kafka-topics.sh --list --zookeeper localhost:2181

  • 查看主题详情

    /usr/local/kafka/bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test

  • 删除主题(需设置参数delete.topic.enable=true)

    /usr/local/kafka/bin/kafka-topics.sh --zookeeper localhost:2181 --delete --topic test

  • 生产者参数查看

    /usr/local/kafka/bin/kafka-console-producer.sh

  • 消费者参数查看

    /usr/local/kafka/bin/kafka-console-consumer.sh

posted @ 2023-04-18 13:34  Linux运维阿铭  阅读(36)  评论(0编辑  收藏  举报