spring集成redis——主从配置以及哨兵监控
Redis主从模式配置:
Redis的主从模式配置是非常简单的,首先我们需要有2个可运行的redis环境:
master node : 192.168.56.101 8887
slave node: 192.168.56.102 7777
我们只要在slave 节点的配置文件中,找到 slaveof开头
然后修改为:(master的ip与端口)
slaveof 192.168.56.101 8777
这样就可以了,下面我们来验证一下,首先启用master和slave的redis服务,然后登录redis-cli,输入info
然后看下192.168.56.101:8887的信息,红色的地方,表示当前节点为master节点,有几个从节点和从节点的信息
192.168.56.101:8887> info
# Replication role:master connected_slaves:1 slave0:ip=192.168.56.102,port=7777,state=online,offset=568,lag=1 master_repl_offset:568 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:2 repl_backlog_histlen:567
在看192.168.56.102:7777的信息
192.168.56.102:7777> info
# Replication role:slave master_host:192.168.56.101 master_port:8887 master_link_status:up master_last_io_seconds_ago:10 master_sync_in_progress:0 slave_repl_offset:918 slave_priority:100 slave_read_only:1 connected_slaves:0 master_repl_offset:0 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0
在master,创建一个key-value:
192.168.56.101:8887> set aa aa OK
在slave节点
192.168.56.102:7777> get aa "aa"
因为默认的设置从节点是不能写只能读的,所以如果要在从节点写东西是报错的,如下:
192.168.56.102:7777> set aa 2a (error) READONLY You can't write against a read only slave.
这样一来主从模式就好了,如果要有多个从节点,只要改变他们的slaveof的配置就行了。
当然如果只这样配置,在生产上面是没有多大用处的,因为如果无论master节点还是slave节点挂了,我们都要手动启动来让他继续恢复工作,那么能不能让他自动恢复呢?比如master挂掉了,在slave节点中选一个节点自动更换成master。根据这个需求,redis在2.4之后出现了sentinel,其目的就是监控主从节点的健壮性,然后自动选举master节点下面就来看看如何配置sentinel。
Redis 的 Sentinel配置
一、Sentinel介绍
Sentinel是Redis的高可用性(HA)解决方案,由一个或多个Sentinel实例组成的Sentinel系统可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,并在被监视的主服务器进行下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器,然后由新的主服务器代替已下线的主服务器继续处理命令请求。Redis提供的sentinel(哨兵)机制,通过sentinel模式启动redis后,自动监控master/slave的运行状态,基本原理是:心跳机制+投票裁决
- 监控(Monitoring): Sentinel 会不断地检查你的主服务器和从服务器是否运作正常。
- 提醒(Notification): 当被监控的某个 Redis 服务器出现问题时, Sentinel 可以通过 API 向管理员或者其他应用程序发送通知。
- 自动故障迁移(Automatic failover): 当一个主服务器不能正常工作时, Sentinel 会开始一次自动故障迁移操作, 它会将失效主服务器的其中一个从服务器升级为新的主服务器, 并让失效主服务器的其他从服务器改为复制新的主服务器; 当客户端试图连接失效的主服务器时, 集群也会向客户端返回新主服务器的地址, 使得集群可以使用新主服务器代替失效服务器
二、Sentinel的主从原理
三、Redis Sentinel配置
这里采用了一个master 一个slave 一个sentinel
master 的redis.conf配置,找到下面的并修改:
port 8887 bind 192.168.56.101
slave 的redis.conf配置,找到下面的并修改,如果master节点设置了密码,下面红色部分要加上
port 7777 bind 192.168.56.102 slaveof 192.168.56.101 8887
masterauth master的密码
sentinel的sentinel.conf 配置
port 9999 protected-mode yes bind 192.168.56.101 dir /tmp sentinel monitor mymaster 192.168.56.101 8887 1 sentinel down-after-milliseconds mymaster 5000 sentinel parallel-syncs mymaster 1 sentinel failover-timeout mymaster 15000
tips:
如果停掉master 后,sentinel 显示足够数量的 sdown 后,没有出现odown或try-failover,则检查密码等配置是否正确
如果停掉master后,试图切换的时候出现 failover-abort-not-elected
1)如果redis实例没有配置
protected-mode yes
bind 192.168.56.101
则在sentinel 配置文件加上
protected-mode no
2)如果redis实例有配置
protected-mode yes
bind 192.168.56.101
则在sentinel 配置文件加上
protected-mode yes
bind 192.168.56.101
上面的配置都弄好之后,分别启动master、slave、sentinel(前面2个是redis-service 启动,后面是redis-sentinel)服务,然后我们可以redis-cli查看对于的info信息(跟上面主从操作是一样的)
master节点
[root@localhost 8887]# ./redis-cli -h 192.168.56.101 -p 8887 192.168.56.101:8887> info …… # Replication role:master connected_slaves:1 slave0:ip=192.168.56.102,port=7777,state=online,offset=6503,lag=1 master_repl_offset:6647 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:2 repl_backlog_histlen:6646 ……
slave节点
[root@localhost 7777]# ./redis-cli -h 192.168.56.102 -p 7777 192.168.56.102:7777> info …… # Replication role:slave master_host:192.168.56.101 master_port:8887 master_link_status:up master_last_io_seconds_ago:10 master_sync_in_progress:0 slave_repl_offset:918 slave_priority:100 slave_read_only:1 connected_slaves:0 master_repl_offset:0 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0 ……
sentinel节点信息
[root@localhost 8887]# ./redis-cli -h 192.168.56.101 -p 9999 192.168.56.101:9999> info …… # Sentinel sentinel_masters:1 sentinel_tilt:0 sentinel_running_scripts:0 sentinel_scripts_queue_length:0 sentinel_simulate_failure_flags:0 master0:name=mymaster,status=ok,address=192.168.56.101:8887,slaves=1,sentinels=1 ……
下面我们把master节点给干掉,
192.168.56.101:8887> SHUTDOWN not connected>
这个时候,在sentinel界面会输出下面的信息:
4338:X 05 Jun 14:57:27.313 # +sdown master mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:27.313 # +odown master mymaster 192.168.56.101 8887 #quorum 1/1 4338:X 05 Jun 14:57:27.313 # +new-epoch 17 4338:X 05 Jun 14:57:27.313 # +try-failover master mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:27.317 # +vote-for-leader 9354edabc95f19b3d99991f0877d0e66ada04e5b 17 4338:X 05 Jun 14:57:27.317 # +elected-leader master mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:27.317 # +failover-state-select-slave master mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:27.384 # +selected-slave slave 192.168.56.102:7777 192.168.56.102 7777 @ mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:27.384 * +failover-state-send-slaveof-noone slave 192.168.56.102:7777 192.168.56.102 7777 @ mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:27.450 * +failover-state-wait-promotion slave 192.168.56.102:7777 192.168.56.102 7777 @ mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:28.255 # +promoted-slave slave 192.168.56.102:7777 192.168.56.102 7777 @ mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:28.255 # +failover-state-reconf-slaves master mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:28.317 # +failover-end master mymaster 192.168.56.101 8887 4338:X 05 Jun 14:57:28.317 # +switch-master mymaster 192.168.56.101 8887 192.168.56.102 7777 4338:X 05 Jun 14:57:28.318 * +slave slave 192.168.56.101:8887 192.168.56.101 8887 @ mymaster 192.168.56.102 7777
现在我们在查看以前的slave节点:
192.168.56.102:7777> info …… # Replication role:master connected_slaves:0 master_repl_offset:0 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0 ……
这个时候以前的slave变成了master,所以现在没有从节点了,所以 connected_slaves:0 ,下面我们把干掉的192.168.56.101 8887服务给启用,然后在查看现在的master,
192.168.56.102:7777> info …… # Replication role:master connected_slaves:1 slave0:ip=192.168.56.101,port=8887,state=online,offset=1334,lag=0 master_repl_offset:1334 repl_backlog_active:1 repl_backlog_size:1048576 repl_backlog_first_byte_offset:2 repl_backlog_histlen:1333 ……
这个时候可以看到,多出了一个slave,即以前的master变成了从节点,我们再看以前的master节点信息:
192.168.56.101:8887> info …… # Replication role:slave master_host:192.168.56.102 master_port:7777 master_link_status:up master_last_io_seconds_ago:2 master_sync_in_progress:0 slave_repl_offset:7364 slave_priority:100 slave_read_only:1 connected_slaves:0 master_repl_offset:0 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0 ……
上面就是sentinel自动的对redis的主从切换的配置,以及信息的变化,下面来看在Spring中如何配置。
四、Spring中 Sentinel配置
pom.xml文件中添加依赖包
<!--redis 支持java的语言 --> <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version> </dependency> <!-- spring data redis --> <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId> <version>1.8.1.RELEASE</version> </dependency>
spring-redis.xml的配置:
1 <!--redis哨兵 --> 2 <bean id="redisSentinelConfiguration" 3 class="org.springframework.data.redis.connection.RedisSentinelConfiguration"> 4 <property name="master"> 5 <bean class="org.springframework.data.redis.connection.RedisNode"> 6 <property name="name" value="mymaster"/> 7 </bean> 8 </property> 9 <property name="sentinels"> 10 <set> 11 <bean class="org.springframework.data.redis.connection.RedisNode"> 12 <constructor-arg name="host" value="192.168.56.101"/> 13 <constructor-arg name="port" value="9999"/> 14 </bean> 15 </set> 16 </property> 17 </bean> 18 19 <bean id="jedisConnFactory" 20 class="org.springframework.data.redis.connection.jedis.JedisConnectionFactory"> 21 <!--<property name="hostName" value="${redis.host}"/>--> 22 <!--<property name="port" value="${redis.port}"/>--> 23 <!--<property name="password" value="${redis.password}"/>--> 24 <!--<property name="usePool" value="false"/>--> 25 <!--<property name="poolConfig" ref="poolConfig"/>--> 26 <constructor-arg name="sentinelConfig" ref="redisSentinelConfiguration"/> 27 </bean> 28 29 <bean id="stringRedisTemplate" class="org.springframework.data.redis.core.StringRedisTemplate"> 30 <property name="connectionFactory" ref="jedisConnFactory"/> 31 </bean>
tips:
第25行如果我们不配poolConfig的话,也不要把第24行的usePool改成false,如果把usePool改成false,那么上面的哨兵配置好像就无效了。
Sentinel模式下的几个事件
- +reset-master :主服务器已被重置。
- +slave :一个新的从服务器已经被 Sentinel 识别并关联。
- +failover-state-reconf-slaves :故障转移状态切换到了 reconf-slaves 状态。
- +failover-detected :另一个 Sentinel 开始了一次故障转移操作,或者一个从服务器转换成了主服务器。
- +slave-reconf-sent :领头(leader)的 Sentinel 向实例发送了 [SLAVEOF](/commands/slaveof.html) 命令,为实例设置新的主服务器。
- +slave-reconf-inprog :实例正在将自己设置为指定主服务器的从服务器,但相应的同步过程仍未完成。
- +slave-reconf-done :从服务器已经成功完成对新主服务器的同步。
- -dup-sentinel :对给定主服务器进行监视的一个或多个 Sentinel 已经因为重复出现而被移除 —— 当 Sentinel 实例重启的时候,就会出现这种情况。
- +sentinel :一个监视给定主服务器的新 Sentinel 已经被识别并添加。
- +sdown :给定的实例现在处于主观下线状态。
- -sdown :给定的实例已经不再处于主观下线状态。
- +odown :给定的实例现在处于客观下线状态。
- -odown :给定的实例已经不再处于客观下线状态。
- +new-epoch :当前的纪元(epoch)已经被更新。
- +try-failover :一个新的故障迁移操作正在执行中,等待被大多数 Sentinel 选中(waiting to be elected by the majority)。
- +elected-leader :赢得指定纪元的选举,可以进行故障迁移操作了。
- +failover-state-select-slave :故障转移操作现在处于 select-slave 状态 —— Sentinel 正在寻找可以升级为主服务器的从服务器。
- no-good-slave :Sentinel 操作未能找到适合进行升级的从服务器。Sentinel 会在一段时间之后再次尝试寻找合适的从服务器来进行升级,又或者直接放弃执行故障转移操作。
- selected-slave :Sentinel 顺利找到适合进行升级的从服务器。
- failover-state-send-slaveof-noone :Sentinel 正在将指定的从服务器升级为主服务器,等待升级功能完成。
- failover-end-for-timeout :故障转移因为超时而中止,不过最终所有从服务器都会开始复制新的主服务器(slaves will eventually be configured to replicate with the new master anyway)。
- failover-end :故障转移操作顺利完成。所有从服务器都开始复制新的主服务器了。
- +switch-master :配置变更,主服务器的 IP 和地址已经改变。 这是绝大多数外部用户都关心的信息。
- +tilt :进入 tilt 模式。
- -tilt :退出 tilt 模式。
以上就是redis的主从及哨兵的配置,如果有错,谢谢指出。
参考:http://wosyingjun.iteye.com/blog/2289593
http://www.cnblogs.com/yjmyzz/p/redis-sentinel-sample.html
http://blog.csdn.net/yypzye/article/details/52281282
本实项目下载:https://github.com/eoooxy/anhoo