Redis集群部署
一、Redis介绍
-
Redis和Memcached类似,也是NoSQL的一种,是一个基于内存的高性能key-value(k-v)数据库。
-
Redis支持
string(字符串)
、list(列表)
、set(无序集合)
、zset
(有序集合
)和hash(哈希)
类型数据,这些数据类型都支持push/pop、add/remove及取交集、并集和差集及更丰富的操作。 -
Redis持久化方式:全量数据(RDB:Redis DataBase)和增量请求(AOF:Append Only File)。全量数据在指定的时间间隔内生成数据集的时间点快照(point-in-time snapshot);增量请求则是把内存中的数据序列转化为操作请求,用于读取文件进行replay得到数据,这种类似于mysql的binlog。Redis的存储分为内存存储、磁盘存储和log文件三部分。
- Redis有三种集群模式:主从模式,Sentinel(哨兵)模式,Cluster模式
二、主从模式
1)主从模式特点
* 主数据库可以进行读写操作,当读写操作导致数据变化时会自动将数据同步给从数据库 * 从数据库一般都是只读的,并且接收主数据库同步过来的数据 * 一个master可以拥有多个slave,但是一个slave只能对应一个master * slave挂了不影响其他slave的读和master的读和写,重新启动后会将数据从master同步过来 * master挂了以后,不影响slave的读,但redis不再提供写服务,master重启后redis将重新对外提供写服务 * master挂了以后,不会在slave节点中重新选一个master
2)工作机制
-
当slave启动后,主动向master发送SYNC命令。master接收到SYNC命令后在后台保存快照(RDB持久化)和缓存保存快照这段时间的命令,然后将保存的快照文件和缓存的命令发送给slave。slave接收到快照文件和命令后加载快照文件和缓存的执行命令。
-
复制初始化后,master每次接收到的写命令都会同步发送给slave,保证主从数据一致性。
3)安全设置
当master节点设置密码后:
客户端访问master需要密码
启动slave需要密码,在配置文件中配置即可
客户端访问slave不需要密码
4)缺点
- 从上面可以看出,master节点在主从模式中唯一,若master挂掉,则redis无法对外提供写服务。
5)主从模式搭建
1、 环境准备
master节点 192.168.182.129 slave节点 192.168.182.130 slave节点 192.168.182.131
2、全部节点下载安装
mkdir /software && cd /software wget http://download.redis.io/releases/redis-5.0.4.tar.gz tar zxf redis-5.0.4.tar.gz && mv redis-5.0.4/ /usr/local/redis cd /usr/local/redis && make MALLOC=libc && make install
3、全部配置成服务
# 服务文件
cat << EOF > /usr/lib/systemd/system/redis.service [Unit] Description=Redis persistent key-value database After=network.target After=network-online.target Wants=network-online.target [Service] ExecStart=/usr/local/bin/redis-server /usr/local/redis/redis.conf --supervised systemd ExecStop=/usr/libexec/redis-shutdown Type=notify User=redis Group=redis RuntimeDirectory=redis RuntimeDirectoryMode=0755 [Install] WantedBy=multi-user.target EOF
# shutdown脚本
cat << EOF > /usr/libexec/redis-shutdown #!/bin/bash # # Wrapper to close properly redis and sentinel test x"$REDIS_DEBUG" != x && set -x REDIS_CLI=/usr/local/bin/redis-cli # Retrieve service name SERVICE_NAME="$1" if [ -z "$SERVICE_NAME" ]; then SERVICE_NAME=redis fi # Get the proper config file based on service name CONFIG_FILE="/usr/local/redis/$SERVICE_NAME.conf" # Use awk to retrieve host, port from config file HOST=`awk '/^[[:blank:]]*bind/ { print $2 }' $CONFIG_FILE | tail -n1` PORT=`awk '/^[[:blank:]]*port/ { print $2 }' $CONFIG_FILE | tail -n1` PASS=`awk '/^[[:blank:]]*requirepass/ { print $2 }' $CONFIG_FILE | tail -n1` SOCK=`awk '/^[[:blank:]]*unixsocket\s/ { print $2 }' $CONFIG_FILE | tail -n1` # Just in case, use default host, port HOST=${HOST:-127.0.0.1} if [ "$SERVICE_NAME" = redis ]; then PORT=${PORT:-6379} else PORT=${PORT:-26739} fi # Setup additional parameters # e.g password-protected redis instances [ -z "$PASS" ] || ADDITIONAL_PARAMS="-a $PASS" # shutdown the service properly if [ -e "$SOCK" ] ; then $REDIS_CLI -s $SOCK $ADDITIONAL_PARAMS shutdown else $REDIS_CLI -h $HOST -p $PORT $ADDITIONAL_PARAMS shutdown fi EOF
# 授权启动服务
chmod +x /usr/libexec/redis-shutdown useradd -s /sbin/nologin redis chown -R redis:redis /usr/local/redis mkdir -p /data/redis && chown -R redis:redis /data/redis yum install -y bash-completion && source /etc/profile # 命令补全 systemctl daemon-reload systemctl enable redis
# 修改配置
192.168.182.129
$ vim /usr/local/redis/redis.conf bind 192.168.182.129 # 监听ip,多个ip用空格分隔 daemonize yes # 允许后台启动 logfile "/usr/local/redis/redis.log" # 日志路径 dir /data/redis # 数据库备份文件存放目录 masterauth 123456 # slave连接master密码,master可省略 requirepass 123456 # 设置master连接密码,slave可省略 appendonly yes # 在/data/redis/目录生成appendonly.aof文件,将每一次写操作请求都追加到appendonly.aof 文件中 $ echo 'vm.overcommit_memory=1' >> /etc/sysctl.conf $ sysctl -p
192.168.182.130
$ vim /usr/local/redis/redis.conf bind 192.168.182.130 daemonize yes logfile "/usr/local/redis/redis.log" dir /data/redis replicaof 192.168.182.129 6379 masterauth 123456 requirepass 123456 appendonly yes $ echo 'vm.overcommit_memory=1' >> /etc/sysctl.conf $ sysctl -p
192.168.182.131
$ vim /usr/local/redis/redis.conf bind 192.168.182.131 daemonize yes logfile "/usr/local/redis/redis.log" dir /data/redis replicaof 192.168.182.129 6379 masterauth 123456 requirepass 123456 appendonly yes $ echo 'vm.overcommit_memory=1' >> /etc/sysctl.conf $ sysctl -p
从服务器比主服务器多一个slaveof的配置和密码
# 全部启动redis
systemctl start redis
# 查看集群状态
redis-cli -h 192.168.182.129 -a 123456
192.168.182.129:6379> info replication
redis-cli -h 192.168.182.129 -a 123456 info replication
注意:在slave节点上只能读,无法写入数据
三、Sentinel(哨兵)模式
1)Sentinel模式介绍
主从模式的弊端就是不具备高可用性,当master挂掉以后,Redis将不能再对外提供写入操作,因此sentinel应运而生。
sentinel中文含义为哨兵,顾名思义,它的作用就是监控redis集群的运行状况,特点如下:
* sentinel模式是建立在主从模式的基础上,如果只有一个Redis节点,sentinel就没有任何意义 * 当master挂了以后,sentinel会在slave中选择一个做为master,并修改它们的配置文件,其他slave的配置文件也会被修改,比如slaveof属性会指向新的master * 当master重新启动后,它将不再是master而是做为slave接收新的master的同步数据 * sentinel因为也是一个进程有挂掉的可能,所以sentinel也会启动多个形成一个sentinel集群 * 多sentinel配置的时候,sentinel之间也会自动监控 * 当主从模式配置密码时,sentinel也会同步将配置信息修改到配置文件中,不需要担心 * 一个sentinel或sentinel集群可以管理多个主从Redis,多个sentinel也可以监控同一个redis * sentinel最好不要和Redis部署在同一台机器,不然Redis的服务器挂了以后,sentinel也挂了
2)工作机制
* 每个sentinel以每秒钟一次的频率向它所知的master,slave以及其他sentinel实例发送一个 PING 命令 * 如果一个实例距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被sentinel标记为主观下线。 * 如果一个master被标记为主观下线,则正在监视这个master的所有sentinel要以每秒一次的频率确认master的确进入了主观下线状态 * 当有足够数量的sentinel(大于等于配置文件指定的值)在指定的时间范围内确认master的确进入了主观下线状态, 则master会被标记为客观下线 * 在一般情况下, 每个sentinel会以每 10 秒一次的频率向它已知的所有master,slave发送 INFO 命令 * 当master被sentinel标记为客观下线时,sentinel向下线的master的所有slave发送 INFO 命令的频率会从 10 秒一次改为 1 秒一次 * 若没有足够数量的sentinel同意master已经下线,master的客观下线状态就会被移除;若master重新向sentinel的 PING 命令返回有效回复,master的主观下线状态就会被移除
当使用sentinel模式的时候,客户端就不要直接连接Redis,而是连接sentinel的ip和port,由sentinel来提供具体的可提供服务的Redis实现,这样当master节点挂掉以后,sentinel就会感知并将新的master节点提供给使用者。
3)Sentinel模式搭建
# 环境准备
master节点 192.168.182.129 sentinel端口:26379 slave节点 192.168.182.130 sentinel端口:26379 slave节点 192.168.182.131 sentinel端口:26379
# 修改配置,前面已经下载安装了redis,这里省略,直接修改sentinel配置文件
配置3个哨兵,每个哨兵的配置都是一样的
$ vim /usr/local/redis/sentinel.conf daemonize yes logfile "/usr/local/redis/sentinel.log" dir "/usr/local/redis/sentinel" # sentinel工作目录 sentinel monitor mymaster 192.168.182.129 6379 2 # 判断master失效至少需要2个sentinel同意,建议设置为n/2+1,n为sentinel个数 sentinel auth-pass mymaster 123456 sentinel down-after-milliseconds mymaster 30000 # 判断master主观下线时间,默认30s
# 全部启动sentinel
mkdir /usr/local/redis/sentinel && chown -R redis:redis /usr/local/redis
/usr/local/bin/redis-sentinel /usr/local/redis/sentinel.conf
# 任一主机查看日志
$ tail -f /usr/local/redis/sentinel.log 9022:X 29 Mar 2020 12:08:33.180 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo 9022:X 29 Mar 2020 12:08:33.180 # Redis version=5.0.4, bits=64, commit=00000000, modified=0, pid=9022, just started 9022:X 29 Mar 2020 12:08:33.180 # Configuration loaded 9023:X 29 Mar 2020 12:08:33.181 * Increased maximum number of open files to 10032 (it was originally set to 1024). 9023:X 29 Mar 2020 12:08:33.185 * Running mode=sentinel, port=26379. 9023:X 29 Mar 2020 12:08:33.185 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128. 9023:X 29 Mar 2020 12:08:33.187 # Sentinel ID is 769e65e468afa221a1a83f7bd5c526252026d0ed 9023:X 29 Mar 2020 12:08:33.187 # +monitor master mymaster 192.168.182.129 6379 quorum 2 9023:X 29 Mar 2020 12:08:33.188 * +slave slave 192.168.182.131:6379 192.168.182.131 6379 @ mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:08:33.188 * +slave slave 192.168.182.130:6379 192.168.182.130 6379 @ mymaster 192.168.182.129 6379
# Sentinel模式下的几个事件
· +reset-master :主服务器已被重置。 · +slave :一个新的从服务器已经被 Sentinel 识别并关联。 · +failover-state-reconf-slaves :故障转移状态切换到了 reconf-slaves 状态。 · +failover-detected :另一个 Sentinel 开始了一次故障转移操作,或者一个从服务器转换成了主服务器。 · +slave-reconf-sent :领头(leader)的 Sentinel 向实例发送了 [SLAVEOF](/commands/slaveof.html) 命令,为实例设置新的主服务器。 · +slave-reconf-inprog :实例正在将自己设置为指定主服务器的从服务器,但相应的同步过程仍未完成。 · +slave-reconf-done :从服务器已经成功完成对新主服务器的同步。 · -dup-sentinel :对给定主服务器进行监视的一个或多个 Sentinel 已经因为重复出现而被移除 —— 当 Sentinel 实例重启的时候,就会出现这种情况。 · +sentinel :一个监视给定主服务器的新 Sentinel 已经被识别并添加。 · +sdown :给定的实例现在处于主观下线状态。 · -sdown :给定的实例已经不再处于主观下线状态。 · +odown :给定的实例现在处于客观下线状态。 · -odown :给定的实例已经不再处于客观下线状态。 · +new-epoch :当前的纪元(epoch)已经被更新。 · +try-failover :一个新的故障迁移操作正在执行中,等待被大多数 Sentinel 选中(waiting to be elected by the majority)。 · +elected-leader :赢得指定纪元的选举,可以进行故障迁移操作了。 · +failover-state-select-slave :故障转移操作现在处于 select-slave 状态 —— Sentinel 正在寻找可以升级为主服务器的从服务器。 · no-good-slave :Sentinel 操作未能找到适合进行升级的从服务器。Sentinel 会在一段时间之后再次尝试寻找合适的从服务器来进行升级,又或者直接放弃执行故障转移操作。 · selected-slave :Sentinel 顺利找到适合进行升级的从服务器。 · failover-state-send-slaveof-noone :Sentinel 正在将指定的从服务器升级为主服务器,等待升级功能完成。 · failover-end-for-timeout :故障转移因为超时而中止,不过最终所有从服务器都会开始复制新的主服务器(slaves will eventually be configured to replicate with the new master anyway)。 · failover-end :故障转移操作顺利完成。所有从服务器都开始复制新的主服务器了。 · +switch-master :配置变更,主服务器的 IP 和地址已经改变。 这是绝大多数外部用户都关心的信息。 · +tilt :进入 tilt 模式。 · -tilt :退出 tilt 模式。
# master宕机演示
192.168.182.129
$ systemctl stop redis [root@host1 redis]# tail -f /usr/local/redis/sentinel.log 9023:X 29 Mar 2020 12:29:53.503 # +failover-state-reconf-slaves master mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:29:53.602 * +slave-reconf-sent slave 192.168.182.130:6379 192.168.182.130 6379 @ mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:29:54.078 # -odown master mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:29:54.514 * +slave-reconf-inprog slave 192.168.182.130:6379 192.168.182.130 6379 @ mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:29:54.514 * +slave-reconf-done slave 192.168.182.130:6379 192.168.182.130 6379 @ mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:29:54.604 # +failover-end master mymaster 192.168.182.129 6379 9023:X 29 Mar 2020 12:29:54.604 # +switch-master mymaster 192.168.182.129 6379 192.168.182.131 6379 9023:X 29 Mar 2020 12:29:54.604 * +slave slave 192.168.182.130:6379 192.168.182.130 6379 @ mymaster 192.168.182.131 6379 9023:X 29 Mar 2020 12:29:54.604 * +slave slave 192.168.182.129:6379 192.168.182.129 6379 @ mymaster 192.168.182.131 6379 9023:X 29 Mar 2020 12:30:24.627 # +sdown slave 192.168.182.129:6379 192.168.182.129 6379 @ mymaster 192.168.182.131 6379
从日志中可以看到,master已经从192.168.182.129转移到192.168.182.131上
192.168.182.131上查看集群信息
/usr/local/bin/redis-cli -h 192.168.182.131 -p 6379 -a 123456 info replication
# 恢复:重新把192.168.182.129上进程启动
systemctl start redis
tail -f /usr/local/redis/sentinel.log
# 查看集群信息
[root@host1 redis]# /usr/local/bin/redis-cli -h 192.168.182.129 -p 6379 -a 123456 info replication Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe. # Replication role:slave master_host:192.168.182.131 master_port:6379 master_link_status:down master_last_io_seconds_ago:-1 master_sync_in_progress:0 slave_repl_offset:1 master_link_down_since_seconds:1585456643 slave_priority:100 slave_read_only:1 connected_slaves:0 master_replid:9b6b6d71664d51010ccf71b4a291af92399cd8c4 master_replid2:0000000000000000000000000000000000000000 master_repl_offset:0 second_repl_offset:-1 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0
即使192.168.182.129重新启动redis服务,也是作为slave加入redis集群,192.168.182.131仍然是master。
四、Cluster模式
1)Cluster模式介绍
-
sentinel模式基本可以满足一般生产的需求,具备高可用性。但是当数据量过大到一台服务器存放不下的情况时,主从模式或sentinel模式就不能满足需求了,这个时候需要对存储的数据进行分片,将数据存储到多个Redis实例中。cluster模式的出现就是为了解决单机Redis容量有限的问题,将Redis的数据根据一定的规则分配到多台机器。
-
cluster可以说是sentinel+主从模式的结合体,通过cluster可以实现主从和master重选功能,所以如果配置两个副本三个分片的话,就需要六个Redis实例。因为Redis的数据是根据一定规则分配到cluster的不同机器的,当数据量过大时,可以新增机器进行扩容。
-
使用集群,只需要将redis配置文件中的
cluster-enable
配置打开即可。每个集群中至少需要三个主数据库才能正常运行,新增节点非常方便。
2)cluster集群特点
* 多个redis节点网络互联,数据共享 * 所有的节点都是一主一从(也可以是一主多从),其中从不提供服务,仅作为备用 * 不支持同时处理多个key(如MSET/MGET),因为redis需要把key均匀分布在各个节点上,并发量很高的情况下同时创建key-value会降低性能并导致不可预测的行为 * 支持在线增加、删除节点 * 客户端可以连接任何一个主节点进行读写
# 环境准备
三台机器,分别开启两个redis服务(端口) 192.168.182.129 端口:7001,7002 192.168.182.130 端口:7003,7004 192.168.182.131 端口:7005,7006
# 修改配置文件
192.168.182.129
mkdir /usr/local/redis/cluster cp /usr/local/redis/redis.conf /usr/local/redis/cluster/redis_7001.conf cp /usr/local/redis/redis.conf /usr/local/redis/cluster/redis_7002.conf chown -R redis:redis /usr/local/redis mkdir -p /data/redis/cluster/{redis_7001,redis_7002} && chown -R redis:redis /data/redis
# 修改配置文件vim /usr/local/redis/cluster/redis_7001.conf
bind 192.168.182.129 port 7001 daemonize yes pidfile "/var/run/redis_7001.pid" logfile "/usr/local/redis/cluster/redis_7001.log" dir "/data/redis/cluster/redis_7001" #replicaof 192.168.182.129 6379 masterauth "123456" requirepass "123456" appendonly yes cluster-enabled yes cluster-config-file nodes_7001.conf cluster-node-timeout 15000
# 修改配置文件vim /usr/local/redis/cluster/redis_7002.conf
bind 192.168.182.129 port 7002 daemonize yes pidfile "/var/run/redis_7002.pid" logfile "/usr/local/redis/cluster/redis_7002.log" dir "/data/redis/cluster/redis_7002" #replicaof 192.168.182.131 6379 masterauth "123456" requirepass "123456" appendonly yes cluster-enabled yes cluster-config-file nodes_7002.conf cluster-node-timeout 15000
其它两台机器配置与192.168.182.129一致,只是ip不同,此处省略
# 启动redis服务
redis-server /usr/local/redis/cluster/redis_7001.conf tail -f /usr/local/redis/cluster/redis_7001.log redis-server /usr/local/redis/cluster/redis_7002.conf tail -f /usr/local/redis/cluster/redis_7002.log
其它两台机器启动与192.168.182.129一致,此处省略
# 创建集群
# 我这里是redis5.0.4,所以不需要安装ruby,直接创建集群即可
[root@host1 redis]# redis-cli -a 123456 --cluster create 192.168.182.129:7001 192.168.182.129:7002 192.168.182.130:7001 192.168.182.130:7002 192.168.182.131:7001 192.168.182.131:7002 --cluster-replicas 1 Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe. >>> Performing hash slots allocation on 6 nodes... Master[0] -> Slots 0 - 5460 Master[1] -> Slots 5461 - 10922 Master[2] -> Slots 10923 - 16383 Adding replica 192.168.182.130:7002 to 192.168.182.129:7001 Adding replica 192.168.182.131:7002 to 192.168.182.130:7001 Adding replica 192.168.182.129:7002 to 192.168.182.131:7001 M: 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001 slots:[0-5460] (5461 slots) master S: 6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002 replicates 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 M: 8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001 slots:[5461-10922] (5462 slots) master S: 28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002 replicates 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 M: 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001 slots:[10923-16383] (5461 slots) master S: 7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002 replicates 8b37c09a970998f3605b70bd66b1631837a984dd Can I set the above configuration? (type 'yes' to accept): yes # 输入yes,接受上面配置 >>> Nodes configuration updated >>> Assign a different config epoch to each node >>> Sending CLUSTER MEET messages to join the cluster Waiting for the cluster to join ..... >>> Performing Cluster Check (using node 192.168.182.129:7001) M: 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001 slots:[0-5460] (5461 slots) master 1 additional replica(s) M: 8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001 slots:[5461-10922] (5462 slots) master 1 additional replica(s) S: 6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002 slots: (0 slots) slave replicates 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 S: 7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002 slots: (0 slots) slave replicates 8b37c09a970998f3605b70bd66b1631837a984dd S: 28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002 slots: (0 slots) slave replicates 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 M: 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001 slots:[10923-16383] (5461 slots) master 1 additional replica(s) [OK] All nodes agree about slots configuration. >>> Check for open slots... >>> Check slots coverage... [OK] All 16384 slots covered.
# 自动生成nodes.conf文件
[root@host1 redis]# ls /data/redis/cluster/redis_7001/
appendonly.aof dump.rdb nodes_7001.conf
3)集群操作
# 登录集群
redis-cli -c -h 192.168.182.129 -p 7001 -a 123456
# 查看集群信息
redis-cli -c -h 192.168.182.129 -p 7001 -a 123456 CLUSTER INFO
# 列出节点信息
redis-cli -c -h 192.168.182.129 -p 7001 -a 123456 CLUSTER NODES
这里与nodes.conf文件内容相同
4)增加节点
# 192.168.182.130上增加一节点
$ cp /usr/local/redis/cluster/redis_7002.conf /usr/local/redis/cluster/redis_7003.conf $ vim /usr/local/redis/cluster/redis_7003.conf bind 192.168.182.130 port 7003 daemonize yes pidfile "/var/run/redis_7003.pid" logfile "/usr/local/redis/cluster/redis_7003.log" dir "/data/redis/cluster/redis_7003" #replicaof 192.168.182.131 6379 masterauth "123456" requirepass "123456" appendonly yes cluster-enabled yes cluster-config-file nodes_7003.conf cluster-node-timeout 15000
$ mkdir /data/redis/cluster/redis_7003
$ chown -R redis:redis /usr/local/redis && chown -R redis:redis /data/redis
$ redis-server /usr/local/redis/cluster/redis_7003.conf
192.168.182.131上增加一节点,跟上面配置一致,此处省略
# 集群中增加节点
192.168.182.129:7001> CLUSTER MEET 192.168.182.130 7003
OK
192.168.182.129:7001> CLUSTER MEET 192.168.182.131 7003
OK
192.168.182.129:7001> CLUSTER NODES
8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001@17001 master - 0 1585462561000 3 connected 5461-10922
6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002@17002 slave 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 0 1585462559281 5 connected
2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001@17001 myself,master - 0 1585462558000 1 connected 0-5460
7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002@17002 slave 8b37c09a970998f3605b70bd66b1631837a984dd 0 1585462561000 6 connected
28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002@17002 slave 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 0 1585462562000 4 connected
3609d9cbc067de02265e69540bcad649edd80b43 192.168.182.131:7003@17003 master - 0 1585462562301 7 connected
bf08ee348f9792a3bd7d18ede019d9f65472c98b 192.168.182.130:7003@17003 master - 0 1585462561000 0 connected
5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001@17001 master - 0 1585462563308 5 connected 10923-16383
可以看到,新增的节点都是以master身份加入集群的
# 更换节点身份
# 将新增的192.168.182.131:7003节点身份改为192.168.182.130:7003的slave
redis-cli -c -h 192.168.182.131 -p 7003 -a 123456 cluster replicate bf08ee348f9792a3bd7d18ede019d9f65472c98b
cluster replicate
后面跟node_id,更改对应节点身份。也可以登入集群更改
# 查看相应的nodes.conf文件,可以发现有更改,它记录当前集群的节点信息
192.168.182.131:7003> CLUSTER NODES 8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001@17001 master - 0 1585463048000 3 connected 5461-10922 bf08ee348f9792a3bd7d18ede019d9f65472c98b 192.168.182.130:7003@17003 master - 0 1585463047808 0 connected 6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002@17002 slave 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 0 1585463048000 5 connected 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001@17001 master - 0 1585463050000 5 connected 10923-16383 28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002@17002 slave 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 0 1585463049822 1 connected 7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002@17002 slave 8b37c09a970998f3605b70bd66b1631837a984dd 0 1585463048000 3 connected 3609d9cbc067de02265e69540bcad649edd80b43 192.168.182.131:7003@17003 myself,slave bf08ee348f9792a3bd7d18ede019d9f65472c98b 0 1585463046000 7 connected 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001@17001 master - 0 1585463046000 1 connected 0-5460
# 删除节点
192.168.182.131:7003> CLUSTER FORGET bf08ee348f9792a3bd7d18ede019d9f65472c98b (error) ERR Can't forget my master! # 不能删除本身的master节点 192.168.182.131:7003> CLUSTER FORGET 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 # 可以删除其它节点上的master OK 192.168.182.131:7003>
# 保存配置
192.168.182.131:7003> CLUSTER SAVECONFIG OK
192.168.182.131:7003> CLUSTER NODES 8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001@17001 master - 0 1585463364080 3 connected 5461-10922 bf08ee348f9792a3bd7d18ede019d9f65472c98b 192.168.182.130:7003@17003 master - 0 1585463366093 0 connected 6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002@17002 slave 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 0 1585463368108 5 connected 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001@17001 master - 0 1585463366000 5 connected 10923-16383 28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002@17002 slave 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 0 1585463365087 1 connected 7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002@17002 slave 8b37c09a970998f3605b70bd66b1631837a984dd 0 1585463367102 3 connected 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001@17001 master - 0 1585463363000 1 connected 0-5460 3609d9cbc067de02265e69540bcad649edd80b43 192.168.182.131:7003@17003 myself,slave bf08ee348f9792a3bd7d18ede019d9f65472c98b 0 1585463366000 7 connected
可以看到,之前删除的节点又恢复了,这是因为对应的配置文件没有删除,执行CLUSTER SAVECONFIG
恢复。
# 模拟master节点挂掉
[root@host1 redis]# netstat -lntp |grep 7001 tcp 0 0 192.168.182.129:7001 0.0.0.0:* LISTEN 11567/redis-server tcp 0 0 192.168.182.129:17001 0.0.0.0:* LISTEN 11567/redis-server
[root@host1 redis]# kill 11567
[root@host1 redis]# netstat -lntp |grep 7001
[root@host1 redis]# redis-cli -c -h 192.168.182.130 -p 7001 -a 123456 CLUSTER NODES
Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe.
3609d9cbc067de02265e69540bcad649edd80b43 192.168.182.131:7003@17003 slave bf08ee348f9792a3bd7d18ede019d9f65472c98b 0 1585463568000 7 connected
6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002@17002 slave 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 0 1585463571000 5 connected
28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002@17002 master - 0 1585463569000 8 connected 0-5460
2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001@17001 master,fail - 1585463511155 1585463507125 1 disconnected
5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001@17001 master - 0 1585463571000 5 connected 10923-16383
bf08ee348f9792a3bd7d18ede019d9f65472c98b 192.168.182.130:7003@17003 master - 0 1585463571577 0 connected
8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001@17001 myself,master - 0 1585463567000 3 connected 5461-10922
7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002@17002 slave 8b37c09a970998f3605b70bd66b1631837a984dd 0 1585463572585 6 connected
对应192.168.182.129:7001的一行可以看到,master fail,状态为disconnected;而对应192.168.182.130:7002的一行,slave已经变成master。
# 重新启动192.168.182.129:7001节点
[root@host1 redis]# redis-server /usr/local/redis/cluster/redis_7001.conf [root@host1 redis]# redis-cli -c -h 192.168.182.130 -p 7001 -a 123456 CLUSTER NODES Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe. 3609d9cbc067de02265e69540bcad649edd80b43 192.168.182.131:7003@17003 slave bf08ee348f9792a3bd7d18ede019d9f65472c98b 0 1585463951288 7 connected 6e8006eee7991ee52339c4e4732a29e6bdff497e 192.168.182.129:7002@17002 slave 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 0 1585463953301 5 connected 28f6a14c4410b3befe7942a6d60c97fd83e24fdd 192.168.182.130:7002@17002 master - 0 1585463954311 8 connected 0-5460 2b89f586bfe1f90b98ef490aafd2ae4535bc4a54 192.168.182.129:7001@17001 slave 28f6a14c4410b3befe7942a6d60c97fd83e24fdd 0 1585463949576 8 connected 5a2c1bdb65cdbf8f072e03d3f24963d3406fdbf3 192.168.182.131:7001@17001 master - 0 1585463952293 5 connected 10923-16383 bf08ee348f9792a3bd7d18ede019d9f65472c98b 192.168.182.130:7003@17003 master - 0 1585463951000 0 connected 8b37c09a970998f3605b70bd66b1631837a984dd 192.168.182.130:7001@17001 myself,master - 0 1585463952000 3 connected 5461-10922 7acbd9438ada117f7bd8207c98af9ba0534cc914 192.168.182.131:7002@17002 slave 8b37c09a970998f3605b70bd66b1631837a984dd 0 1585463949000 6 connected
可以看到,192.168.182.129:7001节点启动后为slave节点,并且是192.168.182.130:7002的slave节点。即master节点如果挂掉,它的slave节点变为新master节点继续对外提供服务,而原来的master节点如果重启,则变为新master节点的slave节点。
另外,如果这里是拿192.168.182.130:7003节点做测试的话,会发现192.168.182.131:7003节点并不会切换,这是因为192.168.182.130:7003节点上根本没数据。集群数据被分为三份,采用哈希槽 (hash slot)的方式来分配16384个slot的话,它们三个节点分别承担的slot 区间是:
节点192.168.182.130:7002覆盖0-5460 节点192.168.182.130:7001覆盖5461-10922 节点192.168.182.131:7001覆盖10923-16383
5)集群客户端命令(redis-cli -c -p port)
集群 cluster info :打印集群的信息 cluster nodes :列出集群当前已知的所有节点( node),以及这些节点的相关信息。 节点 cluster meet <ip> <port> :将 ip 和 port 所指定的节点添加到集群当中,让它成为集群的一份子。 cluster forget <node_id> :从集群中移除 node_id 指定的节点。 cluster replicate <node_id> :将当前节点设置为 node_id 指定的节点的从节点。 cluster saveconfig :将节点的配置文件保存到硬盘里面。 槽(slot) cluster addslots <slot> [slot ...] :将一个或多个槽( slot)指派( assign)给当前节点。 cluster delslots <slot> [slot ...] :移除一个或多个槽对当前节点的指派。 cluster flushslots :移除指派给当前节点的所有槽,让当前节点变成一个没有指派任何槽的节点。 cluster setslot <slot> node <node_id> :将槽 slot 指派给 node_id 指定的节点,如果槽已经指派给 另一个节点,那么先让另一个节点删除该槽>,然后再进行指派。 cluster setslot <slot> migrating <node_id> :将本节点的槽 slot 迁移到 node_id 指定的节点中。 cluster setslot <slot> importing <node_id> :从 node_id 指定的节点中导入槽 slot 到本节点。 cluster setslot <slot> stable :取消对槽 slot 的导入( import)或者迁移( migrate)。 键 cluster keyslot <key> :计算键 key 应该被放置在哪个槽上。 cluster countkeysinslot <slot> :返回槽 slot 目前包含的键值对数量。 cluster getkeysinslot <slot> <count> :返回 count 个 slot 槽中的键
~~~以上就是redis集群的部署步骤~~~