四、针对redis容灾切换导致"脑裂"的情况
网上参考到别人博客说,redis容灾切换的时候,有几率出现脑裂的情况。
什么是脑裂:
sentinel判断master宕机,切换slave为新master的过程中,业务数据还在持续往原master写入数据,因为此时新master还是slave,没有写入权限,就会出现数丢失的情况。
解决方案:
看了很多文章,都是说对redis的配置新增两个设置。
1 min-slaves-to-write 1 2 min-slaves-max-lag 10
参数解释:
要求至少有1个slave,数据复制和同步延迟不能超过10秒
如果说一旦所有的slave,数据复制和同步的延迟都超过了10秒钟,那么master就会拒绝接收任何请求。
作用:
减少异步复制的数据丢失
配置min-slaves-max-lag为10s后,根据目前master->slave的复制速度,如果数据同步完成所需要时间超过10s,就会认为master未来宕机后损失的数据会很多,master就拒绝写入新请求。
这样就能将master和slave数据差控制在10s内,即使master宕机也只是这未复制的10s数据。
减少脑裂的数据丢失:
如果不能继续给指定数量的slave发送数据,而且slave超过10秒没有给自己ack消息,那么就直接拒绝写入新请求。这样脑裂后的旧master就不会接受client的新数据,也就避免了数据丢失。
因此在脑裂场景下,最多就丢失10秒的数据
但以上配置,还是会有数据丢失的情况,如果业务数据是会重复上送的倒还好,但是一旦数据是状态发生变更才推送一次的情况,就会对业务数据准确性有出入。而且上面的配置,因为我在这边自身业务数据有可能还没达到一定量,目前没复现,所以在这里,也请教下各位看官大大,是否还有其他更好的优化方案?欢迎各位看官大大来指定迷津~~~~
借鉴的文章参考:https://blog.csdn.net/wdehxiang/article/details/108342501