redis高级
1|0redis高级
- 理解Redis事务机制
- 掌握Redis持久化机制
- 理解Redis高可用 — 主从复制、哨兵模式
- 理解Redis高可扩 — Redis Cluster数据分片
- 掌握Redis过期删除策略
- 掌握Redis内存淘汰策略
- 了解Redis6.X新特性
2|0事务机制
mysql 事务的四大特性:
原子性:要么同时成功 要么同时失败
一致性: 事务执行前后 数据要保持一致性
隔离性: 不同的事务互相之间不影响 A事务执行成功与否不影响B影响
持久性: 事务的执行结果会永久的保存到数据库中
每一条sql都在一个单独的事务了
@Transactional
一个插入
多条删除
一个插入和多条删除在同一个事务中
2|1场景分析
以关注为例,在B站上 张三关注了李四,同时李四也关注了张三,那么两者之间就形成了互相关注,互为粉丝的关系。
如果要通过Redis描述这种关系的话,最好的数据类型就是set, 每个用户定义两个set集合,分别用于描述我的关注和我的粉丝:
2|2事务介绍
Redis是支持事务的, 对于上述问题可以通过事务控制解决。
举一个事务的经典例子:转账
- A给B汇款,那么A账户会扣钱
- B账户会加钱
这两个步骤一定会存在于一个事务中,要么都成功,要么都失败。
Redis事务是基于队列实现的,创建一个事务队列,然后将事务操作都放入队列中,最后依次执行。
2|3事务处理机制
假设这四条指令在事务执行中,某一条命令执行出错, 此时事务会如何处理呢? 现在可能很多人会说,刚才不是已经说了嘛,要么都成功,要么都失败, 有一个出错,那就都失败呗。
这么想不能算错,但是Redis对于命令执行错误处理,有两种解决方式:
- 语法错误(编译) 所有的命令都执行不成功
- 执行错误(运行) 正确的命令执行成功 错误的命令执行失败
语法错误
此时整个事务队列中,存在两条正确指令,1条语法错误指令, 当执行exec后,会直接返回错误,正确的命令也不会执行。
执行错误
通过上面事务执行可以看到,语法本身是没有问题的,所以运行之前redis无法发现错误,但是在执行时出现了错误,因此只会错误的命令不执行, 而正确的命令仍然能够正常执行。
redis的事务 保证在事务的执行过程中,不受其它客户端命令的插队以及打扰,一个事务中的命令要在一个事务中执行完毕。
它不像mysql的事务可以保证所有的命令同时成功或者同时失败。它会分 语法错误或者执行错误来区分。
2|4SpringBoot实现事务操作
由于 enableTransactionSupport 属性的默认值是 false,导致了每一个 RedisConnection 都是重新获取的。所以,我们刚刚执行的 MULTI 和 EXEC 这两个命令不在同一个 Connection 中。
网上很多地方提供的解决方案:
1.在RedisTemplate中开启事务支持 redisTemplate.setEnableTransactionSupport(true); 经过测试 无效
解决方案:
我们要求MULTI 和 EXEC在一个连接中
2.使用@Transactional
1)修改RedisConfig配置类,开启事务控制
2)添加@Transactional注解
3|0持久化机制
3|1场景分析
Redis将数据保存在内存中。一旦服务器宕机重启,内存中的数据就会丢失。当出现这种情况后,为了能够让Redis进行数据恢复,因此Redis提供了持久化机制,将内存中的数据保存到磁盘中,避免数据意外丢失。
Redis提供了两种持久化机制:RDB、AOF。 根据不同的场景,可以选择只使用其中一种或一起使用。
3|2RDB快照
概述
RDB(Redis DataBase)是Redis默认存储方式。其基于快照思想,当符合一定条件(手动或自动触发)时,Redis会将这一刻的内存数据进行快照并保存在磁盘上,产生一个经过压缩的二进制文件,文件后缀名.rdb。
因为RDB文件是保存在磁盘上的,因此即使Redis进程退出,甚至服务器宕机重启。只要RDB文件存在,就可以利用它来还原Redis数据。
RDB触发条件
符合配置文件中的快照规则
<font color="red">
思考:是否会存在数据丢失问题?</font>
手动执行save或bgsave命令
那么这两个命令都会触发快照的话,他们两个又有什么区别呢?
- save:同步处理,阻塞Redis服务进程,服务器不会处理任何命令,直到RDB文件保存完毕。redis服务进程才会接收客户端发来的读或者写请求
- bgsave:会fork一个和主线程一致的子线程负责操作RDB文件,不会阻塞Redis服务进程,操作RDB文件的同时仍然可以处理命令。专门开了一个子线程用来拍照 主线程仍然接收客户端发来的读请求和写请求
<font color="red">
Redis默认使用的是 bgsave 来保存快照数据。</font>
执行过程
1)Redis服务进程判断,当前是否有子线程在执行save或bgsave。
2)如果有,则直接返回,不做任何处理。
3)如果没有,则以阻塞式创建子线程,在创建子线程期间,Redis不处理任何命令。
4)创建完子线程后,取消阻塞,Redis服务继续响应其他命令。
5)同时基于子线程操作RDB文件,将此刻数据保存到磁盘。
优缺点
优点:
- 基于二进制文件完成数据备份,占用空间少,便于文件传输。
- 能够自定义规则,根据Redis繁忙状态进行数据备份。
缺点:
- 无法保证数据完整性,会丢失最后一次快照后的所有数据。
- 执行save阻塞redis用户线程,影响系统吞吐率。
3|3AOF
概述
基础使用
当开启了AOF机制之后,Redis何时会向aof文件中记录内容呢?
对于AOF的触发方式有三种:always、everysec、no。 默认使用everysec。可以通过redis.conf中appendfsync属性进行配置。
那么这三种参数各自都代表什么意思呢? 为什么默认使用everysec呢?这里我们做一个预留,因为涉及到一些其他知识,后面再给大家详细介绍。
开启AOF后,重启Redis,进入Redis客户端并执行多条写命令,这些命令会被保存到appendonly.aof文件中。
此时查看redis安装目录的src目录,会新产生一个appendonly.aof文件。 查看文件内容。
执行原理
1)客户端向Redis发送写命令。
2)Redis将接收到的写命令保存到缓冲文件aof_buf的末尾。 这个过程是命令追加。
3)redis将缓冲区文件内容写入到AOF文件,这个过程是文件写入。
4)redis根据策略将AOF文件保存到磁盘,这个过程是文件同步。
5)何时将AOF文件同步到磁盘的策略依据就是redis.conf文件中appendfsync属性值:always、everysec、no
- always:每次执行写入命令都会将aof_buf缓冲区文件全部内容写入到AOF文件中,并将AOF文件同步到磁盘。该方式效率最低,安全性最高。
- everysec:每次执行写入命令都会将aof_buf缓冲区文件全部内容写入到AOF文件中。 并且每隔一秒会由子线程将AOF文件同步到磁盘。该方式兼备了效率与安全,即使出现宕机重启,也只会丢失不超过两秒的数据。
- no:每次执行写入命令都会将aof_buf缓冲区文件全部内容写入到AOF文件中,但并不对AOF文件进行同步磁盘。 同步操作交由操作系统完成(每30秒一次),该方式最快,但最不安全。
模式 | aof_buf写入到AOF是否阻塞 | AOF文件写入磁盘是否阻塞 | 宕机重启时丢失的数据量 | 效率 | 安全 |
---|---|---|---|---|---|
always | 阻塞 | 阻塞 | 最多只丢失一个命令的数据 | 低 | 高 |
everysec | 阻塞 | 不阻塞 | 不超过两秒的数据 | 中 | 中 |
no | 阻塞 | 阻塞 | 操作系统最后一次对AOF写入磁盘的数据 | 高 | 低 |
AOF重写优化
概述
AOF会将对Redis操作的所有写命令都记录下来,随着服务器的运行,AOF文件内保存的内容会越来越多。这样就会造成两个比较严重的问题:占用大量存储空间、数据还原花费的时间多。
当这些命令执行完,AOF文件中记录5条命令。但是实际生产环境下,写命令会出现非常多,文件的体积也会非常庞大。
为了解决这个问题,Redis新增了重写机制,当AOF文件的大小超过了所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集。
可以使用命令bgrewriteaof来重写。
AOF文件重写并不是对原文件进行重新整理,而是直接读取服务器现有的键值对,然后用一条命令去代替之前记录这个键值对的多条命令,生成一个新的文件去替换原来的AOF文件
触发配置
执行 bgrewriteaof
手动进行aof文件重写。重写后内容如下:
3|4RDB与AOF对比
- RDB默认开启,AOF需手动开启。
- RDB性能优于AOF。
- AOF安全性优于RDB。
- AOF优先级高于RDB。
- RDB存储某个时刻的数据快照,AOF存储写命令。
- RDB在配置触发状态会丢失最后一次快照以后更改的所有数据,AOF默认使用everysec,每秒保存一次,最多丢失两秒以内的数据。
3|5生产环境下持久化实践
- 如当前只追求高性能,不关注数据安全性,则关闭RDB和AOF,如redis宕机重启,直接从数据源恢复数据。
- 如需较高性能且关注数据安全性,则开启RDB,并定制触发规则。当开启RDB后发现,Redis数据量过多,服务线程被频繁阻塞,造成系统性能严重下降,则开启AOF。
- 如更关注数据安全性,则开启AOF。
4|0高可用-主从复制
4|1问题概述
通过持久化机制的学习, 可以发现,不管是RDB还是AOF,都并不能百分百的避免数据丢失。关键是现在只有一台服务器,持久化数据都是保存在这台服务器的磁盘上,假设这台服务器的磁盘损坏,数据仍然会全部丢失。 那这个问题该怎么解决呢?
目前只有一台redis服务器 我们的数据是保存在这台服务器的内存中的 持久化的数据也是保存在这台服务器所在的机器的硬盘上 一旦这台机器出了问题 结果就是redis的数据全部丢失
那我们想一下,现在所有持久化数据只是保存在一台服务器上,能不能让它们同时保存在多台服务器上,这样即使一台服务器出现问题,仍然可以从其他服务器同步数据。
我们应该有多台redis服务器 部署在不同的机器上 以实现我们如果出现某台机器故障 其它机器还可以对外提供服务。 他们的功能是一模一样的,这就是所谓的redis集群。之所以搭建redis集群 是为了应对故障 以实现高可用性。
接下来我们搭建3台redis服务器 装在3台机器上
因为条件有限,所以我今天是在一台机器上 安装3个redis服务器 来实现咱们的伪集群
这样就需要当一台服务器中数据更新后,可以自动的将更新的数据同步到其他服务器上, 这就是所谓的复制。
4|2复制搭建&使用
关键步骤:
1、配置一主两从,创建三个配置文件
在三个配置文件中写入内容
2、复制其他两个从机的配置
打开文件进行第3步的操作修改
3、启动三台服务器
查看redis启动进程
分别连接三台服务器,查看三台主机的运行情况
info replication 打印主从复制的相关信息
刚才搭建的这三台服务器 无法实现数据的同步 所以我们引入主从关系
我们在这三台中 找其中一台做主机 其它两台做从机
只要我们搭建了主从关系,那么
以后客户端发来的写请求 只能给主机,
读请求 主机从机都可以 从机不可以接受写请求
主机接收到写请求后,先写到自己的内存中 然后持久化到xx.rdb文件中,然后再把这个xx.rdb文件发送给所有的从机,所有的从机清空自己的内存,拿主机发送过来的xx.rdb文件进行数据同步,这样的话所有的从机数据就和主机数据一样了。
4、配置从机
配置从机成为指定实例主服务器的从服务器
在6380和6381上执行:slaveof 127.0.0.1 6379
如果一台从机挂掉了,那么启动后它就是一台独立的服务器,需要重新配置为从机,然后就可以正常的共享数据了
如果主机挂掉了,从机还是从机并没有改变主从关系,当主机重启后,不需要重新配置
/5、主从复制的实现原理
1、当从机连接上主机后,从服务器向主服务器发送进行数据同步消息
2、主服务接收到从服务器发送过来同步消息,把主服务器数据先进行持久化,放入到rdb文件中,把rdb文件发送到从服务器,从服务器拿到rdb文件,进行读取
3、每次主服务器进行写操作之后,主动和从服务器进行数据同步
4|3生产环境下主从复制实践
读写分离
在生产环境下,读请求会远远多于写请求,大概10:1的比率。 当单机无法应对大量读请求时,可以通过主从复制机制,实现读写分离。主节点只负责写请求,从节点只负责读请求。
持久化优化
现在如果master和所有的slave都开启持久化的话,性能相对来说比较低。该如何优化提升性能呢?
我们可以在从节点上开启持久化、在主节点关闭持久化。 但是这样的话,数据不会丢失吗?
在主从复制的结构下,无非要么主节点宕机,要么从节点宕机。
- 当从节点宕机重启后,主节点会自动的将数据同步到从节点上。所以不会出现数据丢失。
- 当主节点宕机后,可以将从节点提升为主节点(slaveof no one),继续对外提供服务。 并且当原先的主节点重启后,使用slaveof命令将其设置为新主节点的从节点,即可完成数据同步。
现在可能有人在想,那要是主节点和从节点同时宕机了呢? 数据这不还是会丢吗? 首先服务器宕机的问题本身出现的几率就非常低,并且采用合理的部署方式,如异地部署。 主节点和从节点同时宕机的几率更是微乎其微的。
4|4主从复制总结
具体步骤:
1、Slave服务启动,主动连接Master,并发送SYNC命令,请求初始化同步;
2、Master收到SYNC后,执行BGSAVE命令生成RDB文件,并缓存该时间段内的写命令;
3、Master完成RDB文件后,将其发送给所有Slave服务器;
4、Slave服务器接收到RDB文件后,删除内存中旧的缓存数据,并装载RDB文件;
5、Master在发送完RDB后,即刻向所有Slave服务器发送缓存中的写命令;
主从复制的作用:
- 读写分离:主写从读,提高服务器的读写负载能力
- 负载均衡:基于主从结构,配合读写分离,由slave分担master负载,并根据需求的变化,改变slave的数量,通过多个从节点分担数据读取负载,大大提高Redis服务器并发量与数据吞吐量
- 故障恢复:当master出现问题时,由slave提供服务,实现快速的故障恢复
- 数据冗余:实现数据热备份,是持久化之外的一种数据冗余方式
- 高可用基石:基于主从复制,构建哨兵模式与集群,实现Redis的高可用方案
4|5哨兵模式
问题概述
我们学习了主从库集群模式。在这个模式下,如果从库发生故障了,客户端可以继续向主库或其他从库发送请求,进行相关的操作,但是如果主库发生故障了,那就直接会影响到从库的同步,因为从库没有相应的主库可以进行数据复制操作了。
如果主机发生了故障 1.客户端不能进行写请求了 2.无法完成从库的数据同步
如上图:
-
如果客户端发送的读请求,可以由从库继续提供服务
-
如果客户端发送的写请求,需要主库提供服务,但是主库挂了
无论是写服务中断,还是从库无法进行数据同步,都是不能接受的。所以,如果主库挂
了,我们就需要运行一个新主库,比如说把一个从库切换为主库,把它当成主库。
这就涉及到三个问题:
-
主库真的挂了吗?
-
该选择哪个从库作为主库?
-
怎么把新主库的相关信息通知给从库和客户端呢?
这就要提到哨兵机制了。在 Redis 主从集群中,哨兵机制是实现主从库自动切换的关键机
制,它有效地解决了主从复制模式下故障转移的这三个问题。
哨兵(sentinel) 是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的master并将所有slave连接到新的master。
注意:
-
哨兵也是一台redis服务器,只是不提供数据服务
-
通常哨兵配置数量为单数
-
如果配置启用单节点哨兵,如果有哨兵实例在运行时发生了故障,主从库无法正常
切换啦,所以我们需要搭建 哨兵集群
集群节点哨兵模式
哨兵模式介绍
- Redis提供了哨兵的命令,是一个独立的进程
- 原理 哨兵通过发送命令给多个节点,等待Redis服务器响应,从而监控运行的多个Redis实例的运行情况
- 当哨兵监测到master宕机,会自动将slave切换成master,通过通知其他的从服务器,修改配置文件切换主机
Sentinel三大工作任务
- 监控(Monitoring)
- Sentinel 会不断地检查你的主服务器和从服务器是否运作正常
- 提醒(Notification)
- 当被监控的某个 Redis 服务器出现问题时, Sentinel 可以通过 API 向管理员或者其他应用程序发送通知
- 自动故障迁移(Automatic failover)
- 当一个主服务器不能正常工作时, Sentinel 会开始一次自动故障迁移操作, 它会将失效主服务器的其中一个从服务器升级为新的主服务器, 并让失效主服务器的其他从服务器改为复制新的主服务器
- 当客户端试图连接失效的主服务器时, 集群也会向客户端返回新主服务器的地址, 使得集群可以使用新主服务器代替失效服务器
客观下线和主观下线
-
主观下线(Subjectively Down, 简称 SDOWN)
- 哨兵进程会使用 PING 命令检测它自己和主、从库的网络连接情况,用来判断实例的状态。如果哨兵发现主库或从库对 PING 命令的响应超时了,那么,哨兵就会先把它标记为“主观下线”
-
一个服务器没有在 down-after-milliseconds 选项所指定的时间内, 对向它发送 PING 命令的 Sentinel 返回一个有效回复(valid reply), 那么 Sentinel 就会将这个服务器标记为主观下线
- 如果检测的是从库,那么,哨兵简单地把它标记为“主观下线”就行了,因为从库的下线影响一般不太大,集群的对外服务不会间断。
-
如果检测的是主库,那么,哨兵还不能简单地把它标记为“主观下线”,开启主从
切换。因为很有可能存在这么一个情况:那就是哨兵误判了,其实主库并没有故障。可
是,一旦启动了主从切换,后续的选主和通知操作都会带来额外的计算和通信开销。
我们要知道啥叫误判。很简单,就是主库实际并没有下线,但是哨兵误以为它下线了。误判一般会发生在集群网络压力较大、网络拥塞,或者是主库本身压力较大的情况下。
- 客观下线(Objectively Down, 简称 ODOWN)
- 指的是多个 Sentinel 实例在对同一个服务器做出 SDOWN 判断, 并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后, 得出的服务器下线判断
- 一个 Sentinel 可以通过向另一个 Sentinel 发送 SENTINEL is-master-down-by-addr 命令来询问对方是否认为给定的服务器已下线
- 客观下线条件只适用于主服务器
仲裁 qurum
- Sentinel 在给定的时间范围内, 从其他 Sentinel 那里接收到了【足够数量】的主服务器下线报告, 那么 Sentinel 就会将主服务器的状态从主观下线改变为客观下线
- 这个【足够数量】就是配置文件里面的值,一般是Sentinel个数的一半加1,比如3个Sentinel则就设置为2
- down-after-milliseconds 是一个哨兵在超过规定时间依旧没有得到响应后,会自己认为主机不可用
- 当拥有认为主观下线的哨兵达到sentinel monitor所配置的数量时,就会发起一次投票,进行failover
一主二从三哨兵搭建
主库 6380
从库 6379 6381
关键步骤:
- 基于搭建成功的一主二从Redis集群
- 配置3个哨兵,每个哨兵的配置都是一样的
- 启动顺序 先启动主再启动从,最后启动3个哨兵
- 哨兵端口是 【26379】
(1)配置文件
在 redis/conf/sentinel
目录下创建3个文件 sentinel-1.conf、sentinel-2.conf、sentinel-3.conf
(2)启动哨兵集群
(3)查看日志
查看Sentinel1 日志发现,其它两个Sentinel加入到集群中
哨兵模式测试
(1)关闭Redis master服务 SHUTDOWN
(2)观察哨兵模式日志
哨兵日志:
名称解释:
基于pub/sub的客户端事件通知
-
主库下线事件:
- +sdown:实例进入主观下线状态
- -sdown:实例退出主观下线状态
- +odown:实例进入客观下线状态
- -odown:实例退出客观下线状态
-
从库重新配置事件
- +slave-reconf-sent:哨兵发送SLAVEOF命令重新配置从库
- +slave-reconf-inpprog:从库配置了新主库,但尚未进行同步
- +slave-reconf-done:从库配置了新主库,且和新主库完成同步
-
新主库切换:
- +swith-master:主库地址发送变化
redis 6381 日志:
redis 6380 日志:
redis 6379 重启查看日志:
集群节点哨兵模式工作原理
-
哨兵集群中的多个实例共同判断,可以降低对主库下线的误判率
-
哨兵集群组成: 基于 pub/sub 机制
- 哨兵间发现:
- 主库频道“_sentinel_:hello”,不同哨兵通过它相互发现,实现互相通信
- 哨兵发现从库
- 向主库发送 INFO 命令
- 哨兵间发现:
-
基于 pub/sub 机制的客户端事件通知
- 事件:主库下线事件
- +sdown : 实例进入“主观下线”状态
- -sdown : 实例退出“主观下线”状态
- +odown : 实例进入“客观下线”状态
- -odown : 实例退出“客观下线”状态
- 事件:从库重新配置事件
- +slave-reconf-sent : 哨兵发送 SLAVEOF 命令重新配置从库
- +slave-reconf-inprog : 从库配置了新主库,但尚未进行同步
- +slave-reconf-done : 从库配置了新主库,且完成同步
- 事件:新主库切换
- +switch-master : 主库地址发生变化
- 事件:主库下线事件
-
由哪个哨兵执行主从切换?
- 一个哨兵获得了仲裁所需的赞成票数后,就可以标记主库为“客观下线”
- 所需的赞成票数 <= quorum 配置项
例如,现在有 5 个哨兵,quorum 配置的是 3,那么,一个哨兵需要 3 张赞成票,就可以标记主库为“客观下线”了。这 3 张赞成票包括哨兵自己的一张赞成票和另外两个哨兵的赞成票。
- “Leader 选举”
- 两个条件:
- 拿到半数以上的赞成票
- 拿到的票数>= quorum
- 如果未选出,则集群会等待一段时间(哨兵故障转移超时时间的 2 倍),再重新选举
- 两个条件:
- 一个哨兵获得了仲裁所需的赞成票数后,就可以标记主库为“客观下线”
-
经验:要保证所有哨兵实例的配置是一致的
- 尤其是主观下线的判断值 down-after-milliseconds
-
总结
目前解决了什么问题:
- 主从集群间可以实现自动切换,可用性更高
- 数据更大限度的防止丢失
- 解决哨兵的集群高可用问题,减少误判率
故障迁移:选择新的主库,建立新的主库 建立新的主从关系 通知客户端新的主库
目前还存在什么问题:
- 主节点的写能力和存储能力受限
5|0高可扩-Redis Cluster分片集群
5|1问题概述
提出问题:要用 Redis 保存 5000 万个键值对,每个键值对大约是 512B,为了能快速部署并对外提供服务,我们采用云主机来运行 Redis 实例,那么,该如何选择云主机的内存容量呢?
思路分析:
- 所有的key占用内存预估是:5000 万 *512B = 25GB,所以redis的服务器申请 32G以上可以解决海量数据存储问题
得出结论:如果只是单纯按照内存来申请redis服务器,这个方案是行不通的
那么如果想解决这个问题,就必须需要 Redis Cluster 分片集群,在Redis 3.0 之后开始支持。
为了解决海量数据的问题,我们引入了redis的分片集群,将海量的数据分别存放在多台redis数据库中,每台redis数据库中存储的数据是不一样的。
- 为防止单点故障,必须还需要主从+哨兵实现故障自动转移和恢复数据
- 过程会发现一旦主节点宕机,会出现数据恢复时间会很长(秒级以上)
5|2分片集群原理
Redis原理:
-
数据切片和实例的对应分布关系
-
Redis Cluster 方案:无中心化
-
采用哈希槽(Hash Slot)来处理数据和实例之间的映射关系 哈希槽?25G的数据存放在5台redis数据库上 5台redis数据库就叫redis实例,每个redis数据库中都有哈希槽
-
一个切片集群共有 16384 个哈希槽,只给Master分配
-
具体的映射过程
- 根据键值对的 key,按照CRC16 算法计算一个 16 bit 的值;
- 再用这个 16bit 值对 16384 取模,得到 0~16383 范围内的模数,每个模数代表一个相应编号的哈希槽
-
-
哈希槽映射到具体的 Redis 实例上
-
用 cluster create 命令创建集群,Redis 会自动把这些槽平均分布在集群实例上
-
也可以使用 cluster meet 命令手动建立实例间的连接,形成集群,再使用 cluster addslots 命令,指定每个实例上的哈希槽个数
注意:需要把 16384 个槽都分配完,否则 Redis 集群无法正常工作
-
-
-
客户端如何定位数据
- Redis 实例会把自己的哈希槽信息发给和它相连接的其它实例,来完成哈希槽分配信息的扩散
- 客户端和集群实例建立连接后,实例就会把哈希槽的分配信息发给客户端
- 客户端会把哈希槽信息缓存在本地。当请求键值对时,会先计算键所对应的哈希槽
- 但集群中,实例和哈希槽的对应关系并不是一成不变的
- 实例新增或删除
- 负载均衡
- 实例之间可以通过相互传递消息,获得最新的哈希槽分配信息,但客户端是无法主动感知这些变化
-
重定向机制
- 如果实例上没有该键值对映射的哈希槽,就会返回 MOVED 命令
- 客户端会更新本地缓存
- 在迁移部分完成情况下,返回ASK
- 表明 Slot 数据还在迁移中
- ASK 命令把客户端所请求数据的最新实例地址返回给客户端
- 并不会更新客户端缓存的哈希槽分配信息
- 如果实例上没有该键值对映射的哈希槽,就会返回 MOVED 命令
5|3Redis Cluster分片集群搭建
官方建议:至少需要6个redis搭建,三主三从
注意:一定要把<font color="red">
data和logs文件夹</font>
下的数据删除,否则会搭建失败
端口:7001-7006
参考配置:
(1)创建redis1-6.conf 配置文件,参考资料文件夹
(2)启动6个Redis实例
(3)加入Redis集群(任意一个Redis实例即可)
命令解释:
- --cluster 构建集群全部节点信息
- --cluster-replicas 1 主从节点的比例,1表示1主1从的方式
结果显示:
输入:yes
(4)查看集群状态信息
5|4测试
正常测试
连接集群:
查看集群信息:cluster info
查看集群节点信息:cluster nodes
无中心结构测试:
- 测试集群读写命令set/get
- key哈希运算计算槽位置
- 槽在当前节点的话直接插入/读取,否则自动转向到对应的节点
- 操作都是主节点操作,从节点只是备份
异常测试
- 异常关闭主节点,查看集群节点变化和日志
- 结论:对应的从节点升级为主节点
- 恢复主节点,查看集群节点变化
- 结论:会添加到最新的主机点上,成为从节点
- 异常关闭从节点,查看集群状态
- 结论:不影响集群使用,但是可能会存在单点故障问题
- 同时关闭节点的主和从,本案例中的7001(主) —— 7006(从),get取值,观察
- 结论:导致整个Redis集群不可用
集群动态扩缩容
假设已经存在三主三从的redis集群。我们再安装 7007 、 7008 两个Redis节点,然后将 7007 作为主节点,添加到集群中, 7008 作为从节点添加到集群中。
复制配置文件为 redis7.conf和redis8.conf 修改端口即可启动redis
启动redis
扩容-添加主节点
我们需要给集群节点添加一个主节点,我们需要将 192.168.200.151:7007 节点添加到 192.168.200.151:7001 节点所在的集群中,并且添加后作为主节点,添加命令行如下:
添加节点:
命令说明:
- 将 192.168.200.151:7007节点添加到 192.168.200.151:7001节点所在的集群中
结果:
发现没有给 7001 分配 槽节点
重新分配哈希槽:
我们将 7001,7002,7003 中的 100 个哈希槽挪给 7007。
命令如下:
命令说明:
将节点
596cb9e8da99ea12f4405649f37ea11a27379129
cf0843313dc3bc4b1a9e9fcdcec85eca96f468eb
6e88d115ec1d09da69b6b9cbd46efec23d9d5bff
中的100个哈希槽移动到 443096af2ff8c1e89f1160faed4f6a02235822a7 中
参数说明:
- --cluster-from:表示slot目前所在的节点的node ID,多个ID用逗号分隔
- --cluster-to:表示需要新分配节点的node ID
- --cluster-slots:分配的slot数量
发现master节点已分配槽:
扩容-添加从节点
我们需要往集群中给 7007 节点添加一个从节点 7008 ,添加从节点的主要目的是提高高可用,防止主节点宕机后该节点无法提供服务。
添加从节点命令如下:
命令说明:
- 将192.168.200.151:7008节点添加到192.168.200.151:7007对应的集群中,并且加入的节点为从节点,对应的主节点
- id是c64c1ffab2d8400d54415c7bfd397f85184a2eb6
参数说明:
- add-node: 后面的分别跟着新加入的slave和slave对应的master
- cluster-slave:表示加入的是slave节点
- --cluster-master-id:表示slave对应的master的node ID
结果:
缩容-删除从节点
数据迁移、哈希槽迁移、从节点删除、主节点删除
在真实生产环境中,我们也会跟着我们的业务和环境执行缩容处理,比如双十一过后,流量没有那么大了,我们往往会缩容处理,服务器开销。
Redis实现缩容,需要哈希槽重新分配,将需要移除的节点所分配的所有哈希槽值分配给其他需要运行工作的节点,
还需要移除该节点的从节点,然后再删除该节点。
需求:移除 7007 的从节点 7008
命令如下:
参数说明:
- del-node:删除节点,后面跟着slave节点的 ip:port 和node ID
删除后,我们再来查看集群节点,此时再无7008节点:
缩容-删除主节点
我们需要将 7007 节点的哈希槽迁移到 7001,7002,7003 节点上,仍然用上面用过的 redis-cli --cluster reshard语法。
操作步骤如下:
第1次迁移:
命令说明:
- 将192.168.211.141:7007节点所在集群中c64c1ffab2d8400d54415c7bfd397f85184a2eb6节点的33个哈希槽迁移给 596cb9e8da99ea12f4405649f37ea11a27379129 节点,不回显需要迁移的slot,直接迁移。
效果如下:
我们再次迁移其他哈希槽到其他节点,将剩余的哈希槽迁移到7002和7003去
删除节点命令如下:
查看集群状态发现 7007 已成功从集群中移除。
springboot连接分片集群
application.proterties
分片集群不支持事务
不允许出现multi,exec,discard等字眼
5|5总结
分片解决了什么问题:
- 海量数据存储
- 高可用
- 高可扩
高可用架构总结
- 主从模式:读写分离,负载均衡,一个Master可以有多个Slaves
- 哨兵sentinel:监控,自动转移,哨兵发现主服务器挂了后,就会从slave中重新选举一个主服务器
- 分片集群: 为了解决单机Redis容量有限的问题,将数据按一定的规则分配到多台机器,内存/QPS不受限于单机,提高并发量。
6|0key过期删除策略
如果一个key过期了,那么它实际是在什么时候被删除的呢?
- 定时删除
- 惰性删除
- 定期删除
6|1定时删除
但是有得必有失。 Redis的操作频率是非常高的。绝大多数的键都是携带过期时间的,这样就会造成出现大量定时器执行,严重降低系统性能。
6|2惰性删除
根据惰性删除来说,大家感觉它存在什么问题呢?
6|3定期删除
- 定时删除对内存空间友好,对CPU不友好。
- 惰性删除对CPU友好,对内存空间不友好。
那现在有没有一种策略,能够平衡这两者的优缺点呢? 因此出现了定期删除。
工作机制
- 如果删除操作执行次数过多、执行时间过长,就会导致和定时删除同样的问题:占用大量CPU资源去进行删除操作。
- 如果删除操作执行次数过少、执行时间过短,就会导致和惰性删除同样的问题:内存资源被持续占用,得不到释放。
所以定期删除最关键的就在于执行时长和频率的设置。
- 默认每秒运行10次会对具有过期时间的key进行一次扫描,但是并不会扫描全部的key,因为这样会大大延长扫描时间。
- 每次默认只会随机扫描20个key,同时删除这20个key中已经过期的key。
- 如果这20个key中过期key的比例达超过25%,则继续扫描。
参数配置
对于hz参数,官方建议不要超过100,否则会对CPU造成比较大的压力。
7|0内存淘汰策略
7|1为什么需要内存淘汰策略
学习完过期删除策略后, 大家思考两个问题:
- 通过惰性+定期删除,能不能百分百避免过期key没有被删除的情况?
- 当大量插入插入到Redis,但内存空间不足时,Redis会如何处理呢?
举个例子:
有一些已经过期的key,定期扫描一直都没有扫描到它,而且这些key也一直没有被使用。 那么它们就会一直在内存中存在。同时继续向Redis不断插入新数据,最终造成内存空间不足的问题。
7|2最大内存参数配置
那么现在有的同学可能会想,那我把内存空间设置的很大不就可以了。 ok,你可以把它设置的大一些,但是怎么设置呢?
修改redis.conf中的maxmemory <bytes>
来设置最大内存。
在64位操作系统中,如果未设置或设置0,代表无限制。而在32位系统中,默认内存大小为3GB。但是实际生产环境下,一般会设置物理内存的四分之三左右。
7|3策略详解
在Redis中默认提供了三类八种淘汰策略。
他们的学名叫做:数据驱逐策略。 其实所谓的驱逐就是将数据从内存中删除掉。
- lru:Least Recently Used,它是以时间为基准,删除最近最久未被使用的key。
- lfu:Least Frequently Used,它是以频次为基准,删除最近最少被使用的key。
那理解了lru和lfu之后,我们再回来看这三类八种内存淘汰策略各自的机制。
知识小贴士:
7|4生产环境下的策略设置&选择
刚才已经为大家介绍完了redis中的八种内存淘汰策略,那么此时大家可能在想,这些策略我应该如何设置?何时来选择哪种策略使用?
策略设置
不同策略的使用场景
1、不设置过期时间的key,并且这些key使用了数据库做持久化,使用allkeys。如省市区,经常被访问,但数据库不会修改。
2、经常增删改设置了过期时间的key,使用volatile。如商品详情页。
3、存在冷热数据区分,则选择LRU或LFU。如热点新闻,热搜话题等。
4、每个key被访问概率基本相同,选择使用random。如企业内部系统,访问量不大,删除谁对数据库也造成太大压力。
5、根据超时时间长久淘汰数据,选择选用ttl。如微信过期好友请求。
应用问题解决
设计Web高并发项目,可能要考虑的问题就是:缓存穿透、缓存击穿与缓存雪崩。
缓存穿透
缓存穿透是指缓存和数据库中都没有的数据,而用户不断发起请求。由于缓存是不命中时被动写的,并且出于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到存储层去查询,失去了缓存的意义。
在流量大时,可能数据库就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,这就是漏洞。
如发起为id为“-1”的数据或id为特别大不存在的数据。这时的用户很可能是攻击者,攻击会导致数据库压力过大。
解决方案:
1)最基本的方式就是做好参数校检,接口层增加校验,如用户鉴权校验,id做基础校验,id<=0的直接拦截;
2)缓存无效的key,如果数据库和缓存都找不到某个key的数据,就直接写一个到redis中并设置它的过期时间 set key value EX 10000。这种方式可以解决请求的key变化不频繁的情况,如果遇到专门的黑客攻击就不能解决这个情况。但是如果依然想用这个方法的话,那么在设置过期时间的时候,时间短一点,比如是一分钟。多说一句设置key的格式一般是:表名:列名:主键名:主键。
3)利用布隆过滤器:实现原理较复杂,实际上就是设置一个比较大的IP白名单,设置哪些IP地址可以访问,哪些不可以访问
4)配和网站运维人员联合网警去解决问题
缓存击穿
缓存击穿:现象是数据库访问压力瞬时增加很多, redis中并没有出现大量的key过期,redis还是正常运行的 ,但是数据库已经崩溃了。
原因是:redis中某个key过期了,大量访问使用这个key,一般这个key就是一个热门的key
解决方案:
1、预先设置热点数据永远不过期。
2、接口限流与熔断,降级。重要的接口一定要做好限流策略,防止用户恶意刷接口,同时要降级准备,当接口中的某些服务不可用时候,进行熔断,失败快速返回机制。
缓存雪崩
缓存雪崩现象:数据库压力过大,应用程序反应时间变慢,造成redis里面大量的应用等待,造成数据库崩溃了,应用程序崩溃了,redis也崩溃了。
原因:在极少的时间内,出现了大批量的key的集中过期情况,访问不到redis,就去数据库访问,从而引发雪崩问题。
解决方案:
-
缓存数据的过期时间设置随机,防止同一时间大量数据过期现象发生。
-
如果缓存数据库是分布式部署,将热点数据均匀分布在不同的缓存数据库中。
8|0Redis6.X新特性
新版Redis6特性讲解
-
支持多线程
-
redis6多线程只是用来处理网络数据的读写和协议解析上,底层数据操作还是单线程
-
执行命令仍然是单线程,之所以这么设计是不想因为多线程而变得复杂,需要去控制 key、lua、事务,LPUSH/LPOP 等等的并发问题
-
默认不开启
-
官方建议 ( 线程数小于机器核数 )
- 4 核的机器建议设置为 2 或 3 个线程
- 8 核的建议设置为 4或6个线程,
-
开启多线程后,是否会存在线程并发安全问题?
-
不会有安全问题,Redis 的多线程部分只是用来处理网络数据的读写和协议解析,执行命令仍然是单线程顺序执行。
-
-
引入了 ACL(Access Control List)
-
之前的redis没有用户的概念,redis6引入了acl
-
可以给每个用户分配不同的权限来控制权限
-
通过限制对命令和密钥的访问来提高安全性,以使不受信任的客户端无法访问
-
提高操作安全性,以防止由于软件错误或人为错误而导致进程或人员访问 Redis,从而损坏数据或配置
-
常用命令
- acl list 当前启用的 ACL 规则
- acl cat 支持的权限分类列表
- acl cat hash 返回指定类别中的命令
- acl setuser 创建和修改用户命令
- acl deluser 删除用户命令
-
参 数 | 说明 |
---|---|
user | 用户 |
default | 表示默认用户名,或则自己定义的用户名 |
on | 表示是否启用该用户,默认为off(禁用) |
#... | 表示用户密码,nopass表示不需要密码 |
~* | 表示可以访问的Key(正则匹配) |
+@ | 表示用户的权限,“+”表示授权权限,有权限操作或访问,“-”表示还是没有权限; @为权限分类,可以通过 ACL CAT 查询支持的分类。+@all 表示所有权限,nocommands 表示不给与任何命令的操作权限 |
-
client side caching客户端缓存
-
类似浏览器缓存一样
- 在服务器端更新了静态文件(如css、js、图片),能够在客户端得到及时的更新,但又不想让浏览器每次请求都从服务器端获取静态资源
- 类似前端的-Expires、Last-Modified、Etag缓存控制
-
详细: 分为两种模式
应用收到请求后自行处理有变化的key, 进而实现client cache与redis的一致
这需要客户端实现,目前lettuce对其进行了支持 -
默认模式
- Server 端全局唯一的表(Invalidation Table)记录每个Client访问的Key,当发生变更时,向client推送数据过期消息。
- 优缺点
- 优点:只对Client发送其访问过的被修改的数据
- 缺点:Server端需要额外存储较大的数据量。
-
广播模式
- 客户端订阅key前缀的广播,服务端记录key前缀与client的对应关系。当相匹配的key发生变化时通知client。
- 优缺点
- 优点:服务端记录信息比较少
- 缺点:client会收到自己未访问过的key的失效通知
-
__EOF__
作 者:YXH
出 处:https://www.cnblogs.com/YxinHaaa/p/17573437.html
关于博主:编程路上的小学生,热爱技术,喜欢专研。评论和私信会在第一时间回复。或者直接私信我。
版权声明:署名 - 非商业性使用 - 禁止演绎,协议普通文本 | 协议法律文本。
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库