Redis 缓存双写不一致性的问题

参考:https://www.cnblogs.com/renxiuxing/p/14967390.html

缓存双写不一致的问题描述的是数据库和缓存中的数据一样的问题。

我们在调用接口去查询的时候按照下面的流程去做处理的;

 

数据库和缓存的更新的问题

对于更新完数据库,是更新缓存呢,还是删除缓存?又或者是先删除缓存,再更新数据库,其实大家存在很大的争议。

从理论上来说,给缓存设置过期时间,是保证最终一致性的解决方案

对存入缓存的数据设置过期时间,只要到达过期时间,读请求自然会从数据库中读取新值然后回填缓存,保证是数据的最终一致;所有的写请求都以数据库为准,对缓存的操作只是尽最大努力处理到一致即可。

三种更新策略

  • 先更新数据库,再更新缓存;
  • 先删除缓存,再更新数据库;
  • 先更新数据库,再删除缓存;

 

先更新数据库,再更新缓存

该方案会导致不一致的原因是:请求A和请求B同时去更新;

这套方案,大家是普遍反对的。为什么呢?有如下两点原因。

  • 原因一(请求A和B同时去更新

  同时有请求A和请求B进行更新操作,那么会出现:

  (1)请求A更新了数据库;

  (2)请求B更新了数据库;

  (3)请求B更新了缓存;

  (4)请求A更新了缓存;

  按理说请求A更新缓存应该比请求B更新缓存早才对,但是因为网络等原因,B却比A更早更新了缓存,这样就导致了脏数据

  • 原因二(业务场景角度)

  有如下两点:

  (1)如果写入数据库的值,并不是直接写入缓存的,而是要经过一系列复杂的计算再写入缓存。那么,每次的写请求操作都是先写入数据库,经过计算后再写入缓存,无疑是浪费性能的。显然,每次的写请求写入到数据库中之后,删除缓存更为适合,这样就不用去计算了,只有在查询的时候只计算一次就好了。

  (2)如果是一个写数据库场景比较多,而读数据场景比较少的业务需求,采用这种方案就会导致,每次来的写操作都要去更新缓存,实际上好久才会读一次数据,缓存被频繁的更新都做了无用功,浪费了性能。

  所以,针对缓存操作的方案还是采用 删除缓存 的方案较好;

  接下来讨论的就是争议最大的,先删缓存,再更新数据库。还是先更新数据库,再删缓存的问题。

 

先删缓存,再更新数据库

该方案会导致不一致的原因是:同时有一个请求A进行更新操作,请求B进行查询操作。

那么会出现如下情形:

(1)请求A进行先删除缓存;

(2)请求B查询发现缓存不存在,请求B去数据库查询得到旧值,并将旧值写入缓存;

(3)请求A将新值写入数据库;

上述情况就会导致不一致的情形出现。而且,如果不采用给缓存设置过期时间策略,该数据永远都是脏数据。

那么,如何解决呢?

  采用延时双删策略:

  (1)先删除缓存;
  (2)再更新数据库;
  (3)休眠1秒,再次删除缓存;

延时双删的策略还是不太好,因为休眠的这个时间不太好把控,而且影响接口的性能;若将休眠 一会,再去删除缓存的操作给异步处理了,那么可以解决性能的问题,但是若异步处理的时候失败了,还是会出现缓存不一致的问题。

 

先更新数据库,再删缓存

首先,先说一下。老外提出了一个缓存更新套路,名为《Cache-Aside pattern》。其中就指出

  • 失效:应用程序先从cache取数据,没有得到,则从数据库中取数据,成功后,放到缓存中。
  • 命中:应用程序从cache中取数据,取到后返回。
  • 更新:先把数据存到数据库中,成功后,再让缓存失效。

另外,知名社交网站facebook也在论文《Scaling Memcache at Facebook》中提出,他们用的也是先更新数据库,再删缓存的策略

这种情况不存在并发问题么?

不是的。假设这会有两个请求,一个请求A做查询操作,一个请求B做更新操作,那么会有如下情形产生
(1)缓存刚好失效;
(2)请求A查询数据库,得一个旧值;
(3)请求B将新值写入数据库;
(4)请求B删除缓存;
(5)请求A将查到的旧值写入缓存;

如果发生上述情况,确实是会发生脏数据

然而,发生这种情况的概率又有多少呢?

发生上述情况有一个先天性条件,就是步骤(3)的写数据库操作比步骤(2)的读数据库操作耗时更短,才有可能使得步骤(4)先于步骤(5)。可是,大家想想,数据库的读操作的速度远快于写操作的(不然做读写分离干嘛,做读写分离的意义就是因为读操作比较快,耗资源少),因此步骤(3)耗时比步骤(2)更短,这一情形很难出现。

 

posted @ 2022-04-12 23:44  风止雨歇  阅读(514)  评论(0编辑  收藏  举报