MYSQL之缓存
在讲缓存之前先了解一下,什么是MYSQL的主从复制和读写分离。
主从复制
master是主数据库,stave从数据库
(1)DML操作引起主数据库数据变更,产生binlog文件(二进制日志,在事务提交后产生),通过io-thread写入binlog;
(2)从数据库请求读取binlog,开启io-thread线程读取主数据库发送过来的binlog,并写入relaylog(中继日志);
(3)从数据库通过SQL-thread读取relaylog,进行回放(就是在主数据执行的DML操作在从数据库执行一遍),这样就能保持从数据库与主数据库一致。
读写分离
应用层写操作在主数据库,读操作在从数据库,这种读写分离可高效解决读性能,由于主数据库同步到从数据库需要一点的时间,所以从数据库读取到的数据不一定是最新的数据,会有一定的延迟,看具体的业务要求可否满足。最终一致性,写主数据库,读从数据库;而强一致性,写主数据库,对于读,根据业务需求,对数据进行划分,那些数据对一致性要求高的,读主数据库,那些数据对一致性要求不高的,读从数据库。
缓存方案
使用的前提是读多写少,单个节点能支撑项目数据量;MySQL有缓冲层,它的作用是用来缓存热点数据,这些数据包括数据文件、索引文件等;MySQL缓冲层是从自身出发,跟具体的业务无关;MySQL数据主要存储在磁盘当中,适合大量重要数据的存储。
缓存数据库可以使用redis、memcached;它所有的数据都存储在内存当中,当然也可以将内存当中的数据持久化到磁盘中;内存的访问速度是磁盘访问速度的10万倍,所以可以将热点数据在缓存数据库中备份,将热点读操作转移到缓存数据库。
同步问题
没有缓冲层之前,我们对数据库的读写都是基于MySQL,所以不存在同步问题;引入缓冲层后,我们需要分别操作MySQL和缓存数据库,那么这个时候数据可能存在几个状态:
(1)MySQL有,缓存无;
(2)MySQL无,缓存有;
(3)都有,但是数据不一致;
(4)都有,数据一致;
(5)都没有。
4,5显然没有问题,我们获取数据的主要依据是MySQL,所以在保证MySQL数据正确下,只需将MySQL的数据正确同步到缓存数据库就可以了;对于2,缓存有MySQL无,可以认为这是脏数据,MySQL和缓存都有,但不一致,这两个问题,在同步策略中需要避免。
解决数据同步问题
以下分别对强一致性和最终一致性解决同步问题。
(1)强一致性
a. 同步是否成功的依据来源于mysql是否同步到redis,即使没有同步成功,也没有关系;
b. 写流程:先删除缓存,再写mysql,后面同步数据交由go-mysql-transfer;
c. 先删除缓存,为了避免其他服务读取旧的数据,也是告知系统这个数据已经不是最新,建议从mysql获取;
d. 强一致性只试用于单数据中心的模型下;
e. 多数据中心模型,不管先操作redis还操作mysql都会引起分布式异常问题的产生,此时可以使用分布式锁解决,但是得不偿失,可以将多数据中心转为单数据中心;或者强一致性需求读写都走mysql,其他低一致性需求走最终一致性。
为什么要删除?
对于同一个服务器而言,写MySQL前如果不删除redis中对应的key,其他的访问可能会读取到老数据,导致数据不一致。
(2)最终一致性
读写分离,主库将数据同步到从库,是需要一定时间,那么在同步期间,主从之间数据有差异,有两种解决方案:
a. 直接写 mysql,等待 mysql 同步数据到 redis;
b. 先写redis,设置key的过期时间为200ms,等待mysql写回 redis,覆盖key,设置更长的过期时间;200ms默认的是写mysql到mysql同步到redis时长,这个需要根据实际环境进行设置。
异常情况
(1)缓存穿透
假设某个数据redis不存在,mysql也不存在,如果一直尝试读,数据最终压力依然堆积在MySQL,可能造成MySQL不堪负重而崩溃。
解决方法:
a.发现MySQL不存在,将redis中访问的这个key设置为<key,nil>,并设置过期时间,下次访问该key的时候,不再访问MySQL,不过会容易造成redis缓存很多无效数据
b.布隆过滤器(存在限制是不持支删除操作),将MySQL当中已经存在的key,写入布隆过滤器,访问不存在的可直接pass掉。
(2)缓存击穿
某些数据redis没有,但是mysql有;此时大量这类数据的并发请求,同样造成mysql压力过大。
解决:
a. 加锁,请求数据时获取锁,如果获取成功,则操作(先读redis,不存在,读mysql,写redis,释放锁);获取失败,则休眠一段时间(200ms)再去获取,获取成功,待操作完后释放锁;
b. 将很热的key,设置永不过期。
(3)缓存雪崩
表示一段时间内,缓存集中失效(redis无,mysql有),导致请求全部走mysql,可能搞垮数据库,整个服务失效。
解决:
a. 如果因为缓存数据库宕机,造成所有数据涌向mysql;采用高可用的集群方案,如哨兵模式、cluster模式;
b. 如果因为设置了相同的过期时间,造成缓存集中失效;设置随机过期时间或者其他机制错开失效;
c. 如果因为系统重启的时候,造成缓存数据库失效;重启时间短,redis开启持久化(过期时间也会持久化)就行了;如果重启时间长,则提前将热数据导入redis当中。