四、针对redis容灾切换导致"脑裂"的情况

网上参考到别人博客说,redis容灾切换的时候,有几率出现脑裂的情况。

什么是脑裂:

  sentinel判断master宕机,切换slave为新master的过程中,业务数据还在持续往原master写入数据,因为此时新master还是slave,没有写入权限,就会出现数丢失的情况。

解决方案:

  看了很多文章,都是说对redis的配置新增两个设置。

  

1 min-slaves-to-write 1
2 min-slaves-max-lag 10

参数解释:

  要求至少有1个slave,数据复制和同步延迟不能超过10秒
  如果说一旦所有的slave,数据复制和同步的延迟都超过了10秒钟,那么master就会拒绝接收任何请求。

作用:
  减少异步复制的数据丢失
  配置min-slaves-max-lag为10s后,根据目前master->slave的复制速度,如果数据同步完成所需要时间超过10s,就会认为master未来宕机后损失的数据会很多,master就拒绝写入新请求。
  这样就能将master和slave数据差控制在10s内,即使master宕机也只是这未复制的10s数据。

减少脑裂的数据丢失:
  如果不能继续给指定数量的slave发送数据,而且slave超过10秒没有给自己ack消息,那么就直接拒绝写入新请求。这样脑裂后的旧master就不会接受client的新数据,也就避免了数据丢失。
  因此在脑裂场景下,最多就丢失10秒的数据

 

但以上配置,还是会有数据丢失的情况,如果业务数据是会重复上送的倒还好,但是一旦数据是状态发生变更才推送一次的情况,就会对业务数据准确性有出入。而且上面的配置,因为我在这边自身业务数据有可能还没达到一定量,目前没复现,所以在这里,也请教下各位看官大大,是否还有其他更好的优化方案?欢迎各位看官大大来指定迷津~~~~

 

 

借鉴的文章参考:https://blog.csdn.net/wdehxiang/article/details/108342501

posted @ 2022-05-12 17:49  铁铁的收集箱  阅读(171)  评论(0编辑  收藏  举报