缓存更新脏读问题总结
1、问题背景
业务方反馈数据更新存在缓存不一致问题,于是开始排查。
2、日志记录
09:39:56:281 [查询线程T-1]没有缓存,获取缓存锁
09:39:56:286 [查询线程T-1]查询到脏数据
09:39:56:287 [更新线程T-2]数据库事务已提交,缓存移除
09:39:56:287 [查询线程T-1]更新缓存,释放缓存锁
3、现存缓存更新方案
4、问题分析
5、优化方案
这里有两种优化方法:
1、更新DB后获取分布式锁,之后更新缓存
2、更新DB后获取分布式锁,之后移除缓存(以下是缓存移除实现)
6、代码实现
private void handleCacheRemoveFacade(String cacheKey) {
//分布式锁
String cacheLock = CacheUtil.genLockKey(cacheKey);
if (!lock.isLocked(cacheLock)) {
//分布式锁没锁定,说明没被处理,直接移除
doCacheRemove(cacheKey);
} else {
//分布式锁锁定中,说明正在处理,起线程处理
Future future = taskExecutor.submit(() -> {
//这里一直轮询
while (true) {
if (!lock.isLocked(cacheLock)) {
//分布式锁不占用则移除缓存
doCacheRemove(cacheKey);
break;
} else {
//分布式锁锁定中,这里设置间隔进行轮询,避免频繁调用redis,最大轮询次数是future.get超时时间/线程休眠sleep,这里约是20次
try {
Thread.sleep(50);
} catch (InterruptedException e) {
e.printStackTrace();
LOGGER.error("[CacheRemoveAspect] interval wait error.", e);
}
}
}
});
try {
//设置1000毫秒,超时则放弃,这里能覆盖大部分情况,没设计的过于复杂,如果要求很高,可以在这里发mq进行更新,最终一致
future.get(1000, TimeUnit.MILLISECONDS);
} catch (Exception e) {
e.printStackTrace();
LOGGER.error("[CacheRemoveAspect] async cache remove timeout.", e);
}
}
}