Redis 哨兵 Sentinel

Redis Sentinel:redis集群应用,分布式系统。

  • 多个Sentinal进程之间通过 gossip 协议来接收主服务器是否下线的信息,通过 Raft 一致性协议来决定故障转移及转移服务器。
  • 监控(monitoring):PING消息检查主从服务器运行状态
  • 通知(notification):通知问题服务器信息
  • 故障迁移(automatic failover):提升失效主服务器的从服务器为新的主服务器,其它从属服务器从新的主服务器复制信息,集群向客户端返回新的主服务器地址,

1、启动命令:

redis-server /path/to/sentinel.conf --sentinel

配置文件

sentinel monitor mymaster 127.0.0.1 6379 2 //主服务器名称 ip port 判定失效投票数

sentinel down-after-milliseconds mymaster 60000 //sentinel判定服务器失效所需的毫秒数

sentinel failover-timeout mymaster 180000 //故障转移时限

sentinel parallel-syncs mymaster 1 //故障转移时,最多可以有多少个从服务器对新的主服务器请求同步 同一时间只让一个从服务器置于不可用状态

2、自动发现Sentinel实例及从服务器: 

  • sentinel实例发现:监视相同主机的sentinel实例,通过订阅发布功能实现相互发现,频道: _sentinel_:hello

  • 从服务器发现:sentinel实例通过询问主服务来获取其下从属服务器信息:

  • 发现流程:

sentinel 发送本实例 ip、port、runid 到监视的主从服务器频道 sentinel:hello
|                                                                                                                                     |
sentinel 从订阅的 主从服务器 sentinel:hello 频道 获取监视的sentinel信息                     从订阅的 主从服务器 sentinel:hello 频道获取监视的sentinel主发送的服务器配置信息
|                                                                                                                                     |
自动添加新的sentinel实例到配置列表(所有监视同一主服务器的所有sentinel实例列表) 将主服务器配置信息更新到最新的配置
(相同runid或者相同ip:port的列表条目会被移除,然后添加新的条

3、下线:

  • 主观下线(SDOWN):单个sentinel判定服务器下线

  • 客观下线(ODOWN):多个sentinel判定服务器SDOWN,并通过SENTINEL is-master-down-by-addr命令相互交互后,得出服务器下线判断。只适用于主服务器

  • 判定流程: 

    • sentinel PING消息;服务器回复 +PONG -LOADING -MASTERDOWN 
    • 服务器在master-down-after-milliseconds内连续回复无效信息 认定主观下线
    • 发现主服务器客观下线的sentinel进行故障迁移操作
    • sentinel 实例 只提供了订阅功能的redis服务器,订阅相应的频道获取监控服务器的相关信息。
    • Raft协议领导者选举。

4、故障转移过程:

  • 主服务器客观下线

  • sentinel epoch自增,试图当选执行故障转移

  • Raft协议选择一个从属服务器为新的主服务器

  • 发送SLAVEOF NO ONE 使其转变为主服务器

  • 通过订阅发布向其它sentinel发送最新的主服务器配置信息。

  • 向原来的从服务器发送SLAVEOF命令,使他们向心的主服务器请求信息复制同步

  • 当所有从服务器想新的主服务器请求数据复制同步事,sentinel终止故障转移

4、附注:

  • Redis Sentinel严重依赖系统时间,例配置
  • lua脚本执行超时,redis返回-BUSY状态,Sentinel会在故障转移前杀死脚本。
  • 哨兵是为了解决单点故障问题
 
posted @ 2018-03-27 15:17  WindWant  阅读(335)  评论(0编辑  收藏  举报
文章精选列表