redis学习之持久化与内存淘汰机制

redis学习

对于redis的5中数据类型以及使用方法这儿先暂时不详细说明,大家可以到菜鸟教程自行查找。本文着重学习redis的持久化方式淘汰策略

 

一、Redis的持久化

  redis持久化的两种方式:

  (1) RDB(Redis DataBase):把数据以快照的形式保存在磁盘上。进一步来说是指在一定的时间间隔,把数据集快照写入磁盘中。这也是默认的持久化方式,这种方式就是把内存中的数据以快照的方式写入到二进制文件中,默认文件名为“dump.rdb

  reids是如何来触发这个RDB 机制的呢?对于RDB来说,redis通过三种机制来触发RDB,分别是:save、bgsave、自动化 三种方式,同时我们也可手动通过 shutdown 命令来触发。那么分别看一下:

    • save触发模式

      save命令会阻塞当前redis服务器,在save命令执行期间,Redis服务器不能执行其他命令,直到RDB过程执行完成为止。具体流程如下:

      

      因为save在执行期间会造成堵塞,当我们的客户端有几万或者几十万甚至更多的时候,让这么多客户端一直在等待,显然是不妥的,所以这种方式是不可取的。

 

    • bgsave触发模式  

      Redis在执行该命令时会在后台异步执行快照操作,快照的同时也可以响应客户端的请求,具体流程如下:

      

      

       Redis  fork一个子进程,子进程负责快照操作(先将数据写到一个临时的文件中,然后用临时文件替换原来的dump.rdb文件),操作完成后会自动结束。整个过程堵塞只会发生在fork阶段,一般时间很短,基本上redis内部所有的RDB操作都是通过bgsave来完成的。

 

    • 自动触发

      自动触发是由配置文件来完成的,在redis.conf配置文件中,里面有如下配置,我们可以去设置:

      ①save:这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘。比如“save m n”。表示m秒内数据集存在n次修改时,自动触发bgsave。默认配置如下:

#表示900 秒内如果至少有 1 个 key 的值变化,则保存

save 900 1

#表示300 秒内如果至少有 10 个 key 的值变化,则保存

save 300 10

#表示60 秒内如果至少有 10000 个 key 的值变化,则保存

save 60 10000

不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。

②stop-writes-on-bgsave-error :默认值为yes。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到灾难(disaster)发生了。如果Redis重启了,那么又可以重新开始接收数据了

③rdbcompression ;默认值是yes。对于存储到磁盘中的快照,可以设置是否进行压缩存储。

④rdbchecksum :默认值是yes。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能。

⑤dbfilename :设置快照的文件名,默认是 dump.rdb

⑥dir:设置快照文件的存放路径,这个配置项一定是个目录,而不能是文件名。

我们可以修改这些配置来实现我们想要的效果。

 

RDB的优势与劣势:

        优势:

           1> RDB文件紧凑,全量备份,非常适合用来做数据备份和灾难恢复

           2> 生成RDB文件的时候,RDB会fork一个子进程来处理所有的保存工作,主进程不需要进行任何的磁盘I/O操作

           3> RDB恢复大数据集的时候要比AOF的回复速度要快

        劣势:

            RDB快照是一次全量备份,存储的是内存数据的二进制序列化形式,存储上非常紧凑。当进行快照持久化时,会开启一个子进程专门负责快照持久化,子进程会拥有父进程的内存数据,父进程修改内存子进程不会反应出来,所以在快照持久化期间修改的数据不会被保存,可能丢失数据。

        

 

 

  (2) AOF(Append Only File)

  全量备份总是耗时的,有时候我们提供一种更加高效的方式AOF,工作机制很简单,redis会将每一个收到的写命令都通过write函数追加到文件中。通俗的理解就是日志记录。

  持久化原理:

    

  每当有一个写命令过来时就会写进我们的aof文件。

  文件重写原理

  AOF的方式也同时带来了另一个问题。持久化文件会变的越来越大。为了压缩aof的持久化文件。redis提供了bgrewriteaof命令。将内存中的数据以命令的方式保存到临时文件中,同时会fork出一条新进程来将文件重写。

  文件重写个人理解:比如 redis 有这样一个命令:incr  num 0;如果这个num表示阅读次数,例如作者的这篇文章很火爆(玩笑玩笑,别当真),一天内有100人阅读了,那么我们的appendonly.aof文件中就会有100条这样的重复命令,这样造成文件大小浪费,重写可能就是会优化我们的命令成:set num 100;这样一条命令直接就代替了我们原来的100条命令了;再例如:set num 99,然后存进了appendoy.aof,然后紧接着有执行力:del num;又写进了appendonly.aof文件,如果不进行文件重写,这两条语句占用磁盘空间,但却没有实际意义,进行bgrewriteaof后,可能就删除了这两个语句,达到文件瘦身吧!!!

  触发bgrewriteaof的条件是什么呢?

auto_aofrewrite_perc: aof文件的大小超过基准百分之多少后触发bgrewriteaof。默认这个值设置为100,意味着当前aof是基准大小的两倍的时候触发bgrewriteaof。把它设置为0可以禁用自动触发的功能。
auto_aofrewrite_min_size: 当前aof文件大于多少字节后才触发。避免在aof较小的时候无谓行为。默认大小为64mb
两个参数都是可以在conf里静态配置,或者通过config set来动态修改的。
  
redis 127.0.0.1:6379> config get auto-aof-rewrite-percentage
1) "auto-aof-rewrite-percentage"
2) "100"
redis 127.0.0.1:6379> config get auto-aof-rewrite-min-size
1) "auto-aof-rewrite-min-size"
2) "1048576"
redis 127.0.0.1:6379> config get auto-aof-rewrite-min-size
1) "auto-aof-rewrite-min-size"
2) "1048576"
redis 127.0.0.1:6379> config set auto-aof-rewrite-percentage 200
OK
redis 127.0.0.1:6379> config set auto-aof-rewrite-min-size 10485760
OK

 

AOF也有三种触发机制

(1)每修改同步always:同步持久化 每次发生数据变更会被立即记录到磁盘 性能较差但数据完整性比较好

(2)每秒同步everysec:异步操作,每秒记录 如果一秒内宕机,有数据丢失

(3)不同no:从不同步

 

AOF优点:

(1)AOF可以更好的保护数据不丢失,一般AOF会每隔1秒,通过一个后台线程执行一次fsync操作,最多丢失1秒钟的数据。(2)AOF日志文件没有任何磁盘寻址的开销,写入性能非常高,文件不容易破损。

(3)AOF日志文件即使过大的时候,出现后台重写操作,也不会影响客户端的读写。

(4)AOF日志文件的命令通过非常可读的方式进行记录,这个特性非常适合做灾难性的误删除的紧急恢复。比如某人不小心用flushall命令清空了所有数据,只要这个时候后台rewrite还没有发生,那么就可以立即拷贝AOF文件,将最后一条flushall命令给删了,然后再将该AOF文件放回去,就可以通过恢复机制,自动恢复所有数据

AOF缺点:

(1)对于同一份数据来说,AOF日志文件通常比RDB数据快照文件更大

(2)AOF开启后,支持的写QPS会比RDB支持的写QPS低,因为AOF一般会配置成每秒fsync一次日志文件,当然,每秒一次fsync,性能也还是很高的

(3)以前AOF发生过bug,就是通过AOF记录的日志,进行数据恢复的时候,没有恢复一模一样的数据出来。

 

内存淘汰机制:

如果redis的内存占用过多的时候,此时会进行内存淘汰,有如下一些策略:

  noeviction:当内存不足以容纳新写入数据时,新写入操作会报错,这个一般没人用吧

  allkeys-lru:当内存不足以容纳新写入数据时,在键空间中,移除最近最少使用的key(这个是最常用的)

  allkeys-random:当内存不足以容纳新写入数据时,在键空间中,随机移除某个key,这个一般没人用吧

  volatile-lru:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,移除最近最少使用的key(这个一般不太合适)

  volatile-random:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,随机移除某个key

  volatile-ttl:当内存不足以容纳新写入数据时,在设置了过期时间的键空间中,有更早过期时间的key优先移除

 

posted @ 2020-04-20 10:10  lqian  阅读(558)  评论(0编辑  收藏  举报