Redis 哨兵 Sentinel
Redis Sentinel:redis集群应用,分布式系统。
- 多个Sentinal进程之间通过 gossip 协议来接收主服务器是否下线的信息,通过 Raft 一致性协议来决定故障转移及转移服务器。
- 监控(monitoring):PING消息检查主从服务器运行状态
- 通知(notification):通知问题服务器信息
- 故障迁移(automatic failover):提升失效主服务器的从服务器为新的主服务器,其它从属服务器从新的主服务器复制信息,集群向客户端返回新的主服务器地址,
1、启动命令:
redis-server /path/to/sentinel.conf --sentinel
配置文件:
sentinel monitor mymaster 127.0.0.1 6379 2 //主服务器名称 ip port 判定失效投票数
sentinel down-after-milliseconds mymaster 60000 //sentinel判定服务器失效所需的毫秒数
sentinel failover-timeout mymaster 180000 //故障转移时限
sentinel parallel-syncs mymaster 1 //故障转移时,最多可以有多少个从服务器对新的主服务器请求同步 同一时间只让一个从服务器置于不可用状态
2、自动发现Sentinel实例及从服务器:
-
sentinel实例发现:监视相同主机的sentinel实例,通过订阅发布功能实现相互发现,频道: _sentinel_:hello
-
从服务器发现:sentinel实例通过询问主服务来获取其下从属服务器信息:
-
发现流程:
3、下线:
-
主观下线(SDOWN):单个sentinel判定服务器下线
-
客观下线(ODOWN):多个sentinel判定服务器SDOWN,并通过SENTINEL is-master-down-by-addr命令相互交互后,得出服务器下线判断。只适用于主服务器
-
判定流程:
-
- sentinel PING消息;服务器回复 +PONG -LOADING -MASTERDOWN
-
- 服务器在master-down-after-milliseconds内连续回复无效信息 认定主观下线
-
- 发现主服务器客观下线的sentinel进行故障迁移操作
-
- sentinel 实例 只提供了订阅功能的redis服务器,订阅相应的频道获取监控服务器的相关信息。
-
- Raft协议领导者选举。
4、故障转移过程:
-
主服务器客观下线
-
sentinel epoch自增,试图当选执行故障转移
-
Raft协议选择一个从属服务器为新的主服务器
-
发送SLAVEOF NO ONE 使其转变为主服务器
-
通过订阅发布向其它sentinel发送最新的主服务器配置信息。
-
向原来的从服务器发送SLAVEOF命令,使他们向心的主服务器请求信息复制同步
-
当所有从服务器想新的主服务器请求数据复制同步事,sentinel终止故障转移
4、附注:
- Redis Sentinel严重依赖系统时间,例配置
- lua脚本执行超时,redis返回-BUSY状态,Sentinel会在故障转移前杀死脚本。
- 哨兵是为了解决单点故障问题