redis持久化

  由于 Redis 是一个内存数据库,所谓内存数据库,就是将数据库中的内容保存在内存中,这与传统的MySQL,Oracle等关系型数据库直接将内容保存到硬盘中相比,内存数据库的读写效率比传统数据库要快的多(内存的读写效率远远大于硬盘的读写效率)。但是保存在内存中也随之带来了一个缺点,一旦断电或者宕机,那么内存数据库中的数据将会全部丢失。
  为了解决这个缺点,Redis提供了将内存数据持久化到硬盘,以及用持久化文件来恢复数据库数据的功能。Redis 支持两种形式的持久化,一种是RDB快照(snapshotting),另外一种是AOF(append-only-file)。
 
rdb
rdb是redis用来进行持久化的一种方式,是把当前内存中的数据快照写入磁盘,也就是Snapshot快照(数据库中所有键值对数据)。恢复时将快照文件直接读到内存里。
1.触发方式
自动触发,手动触发
  • 自动触发
redis.conf配置文件中snapshotting
save:用来配置触发redis的RDB持久化,也就是什么时候将内存中的数据保存到硬盘中。
比如 save m n,表示在m秒内数据集存在n次修改时自动触发bgsave
不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能。可以直接一个空字
符串来实现停用:save " "
默认配置:
save 900 1:表示900 秒内如果至少有 1 个 key 的值变化,则保存
save 300 10:表示300 秒内如果至少有 10 个 key 的值变化,则保存
save 60 10000:表示60 秒内如果至少有 10000 个 key 的值变化,则保存
  • 手动触发
  1. save
该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到
RDB过程完成为止。可能造成长时间阻塞
  1. bgsave
  执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。
具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动
结束。阻塞只发生在fork阶段,一般时间很短。
基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令。
2.恢复数据
将备份文件 (dump.rdb) 移动到 redis 安装目录并启动服务即可,redis就会自动加载文件数据至内存了。Redis 服务器在载入 RDB 文件期间,会一直处于阻塞状态,直到载入工作完成为止。
3.自动保存原理
Redis有个服务器状态结构:
struct redisService{
     //1、记录保存save条件的数组
     struct saveparam *saveparams;
     //2、修改计数器
     long long dirty;
     //3、上一次执行保存的时间
     time_t lastsave;
}

  ①、记录保存save条件的数组 saveparam,里面每个元素都是一个 saveparams 结构:

struct saveparam{
     //秒数
     time_t seconds;
     //修改数
     int changes;
};
redis.conf 配置文件中进行了关于save 的配置:
save 900 1:表示900 秒内如果至少有 1 个 key 的值变化,则保存
save 300 10:表示300 秒内如果至少有 10 个 key 的值变化,则保存
save 60 10000:表示60 秒内如果至少有 10000 个 key 的值变化,则保存
  ②、dirty 计数器和lastsave 属性
  dirty 计数器记录距离上一次成功执行 save 命令或者 bgsave 命令之后,Redis服务器进
行了多少次修改(包括写入、删除、更新等操作)。
  lastsave 属性是一个时间戳,记录上一次成功执行 save 命令或者 bgsave 命令的时
间。
  通过这两个命令,当服务器成功执行一次修改操作,那么dirty 计数器就会加 1,而
lastsave 属性记录上一次执行save或bgsave的时间,Redis 服务器还有一个周期性操作函数
severCron ,默认每隔 100 毫秒就会执行一次,该函数会遍历并检查 saveparams 数组中的
所有保存条件,只要有一个条件被满足,那么就会执行 bgsave 命令。
  执行完成之后,dirty 计数器更新为 0 ,lastsave 也更新为执行命令的完成时间。
 
AOF
AOF 是通过保存Redis服务器所执行的写命令来记录数据库状态。
1.配置
  在 redis.conf 配置文件的 APPEND ONLY MODE 下:
  ①、appendonly:默认值为no,也就是说redis 默认使用的是rdb方式持久化,如果想要开启 AOF 持久化方式,需要将 appendonly 修改为 yes。
  ②、appendfilename :aof文件名,默认是"appendonly.aof"
  ③、appendfsync:aof持久化策略的配置;
      no表示不执行fsync,由操作系统保证数据同步到磁盘,速度最快,但是不太安全;
      always表示每次写入都执行fsync,以保证数据同步到磁盘,效率很低;
      everysec表示每秒执行一次fsync,可能会导致丢失这1s数据。通常选择 everysec ,兼
顾安全性和效率。
2.AOF文件恢复
  重启 Redis 之后就会进行 AOF 文件的载入。
  异常修复命令:redis-check-aof --fix 进行修复
3.AOF重写
  由于AOF持久化是Redis不断将写命令记录到 AOF 文件中,随着Redis不断的进行,AOF 的文件会越来越大,文件越大,占用服务器内存越大以及 AOF 恢复要求时间越长。为了解决这个问题,Redis新增了重写机制,当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集。可以使用命令 bgrewriteaof 来重写。
AOF 文件重写并不是对原文件进行重新整理,而是直接读取服务器现有的键值对,然后用一条命令去代替之前记录这个键值对的多条命令,生成一个新的文件后去替换原来的 AOF 文件。
 AOF 文件重写触发机制:通过 redis.conf 配置文件中的 auto-aof-rewrite-percentage:默认值为100,以及auto-aof-rewrite-min-size:64mb 配置,也就是说默认Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发。
Redis 是单线程工作,如果 重写 AOF 需要比较长的时间,那么在重写 AOF 期间,Redis将长时间无法处理其他的命令,这显然是不能忍受的。Redis为了克服这个问题,解决办法是将 AOF 重写程序放到子程序中进行,这样有两个好处:
  ①、子进程进行 AOF 重写期间,服务器进程(父进程)可以继续处理其他命令。
  ②、子进程带有父进程的数据副本,使用子进程而不是线程,可以在避免使用锁的情况下,保证数据的安全性。
使用子进程解决了上面的问题,但是新问题也产生了:因为子进程在进行 AOF 重写期间,服务器进程依然在处理其它命令,这新的命令有可能也对数据库进行了修改操作,使得当前数据库状态和重写后的 AOF 文件状态不一致。
  为了解决这个数据状态不一致的问题,Redis 服务器设置了一个 AOF 重写缓冲区,这个缓冲区是在创建子进程后开始使用,当Redis服务器执行一个写命令之后,就会将这个写命令也发送到 AOF 重写缓冲区。当子进程完成 AOF 重写之后,就会给父进程发送一个信号,父进程接收此信号后,就会调用函数将 AOF 重写缓冲区的内容都写到新的 AOF 文件中。
 
对比
  • rdb
  ①、优势
  1.RDB是一个非常紧凑(compact)的文件,它保存了redis 在某个时间点上的数据集。这种文件非常适合用于进行备份和灾难恢复。
  2.生成RDB文件的时候,redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作。
  3.RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。
  ②、劣势
  1、RDB方式数据没办法做到实时持久化/秒级持久化。因为bgsave每次运行都要执行fork操作创建子进程,属于重量级操作(内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑),频繁执行成本过高(影响性能)
  2、RDB文件使用特定二进制格式保存,Redis版本演进过程中有多个格式的RDB版本,存在老版本Redis服务无法兼容新版RDB格式的问题(版本不兼容)
  3、在一定间隔时间做一次备份,所以如果redis意外down掉的话,就会丢失最后一次快照后的所有修改(数据有丢失)
  • aof
  优点:
  ①、AOF 持久化的方法提供了多种的同步频率,即使使用默认的同步频率每秒同步一次,Redis 最多也就丢失 1 秒的数据而已。
  ②、AOF 文件使用 Redis 命令追加的形式来构造,因此,即使 Redis 只能向 AOF 文件写入命令的片断,使用 redis-check-aof 工具也很容易修正 AOF 文件。
  ③、AOF 文件的格式可读性较强,这也为使用者提供了更灵活的处理方式。例如,如果我们不小心错用了 FLUSHALL 命令,在重写还没进行时,我们可以手工将最后的 FLUSHALL 命令去掉,然后再使用 AOF 来恢复数据。
  缺点:
  ①、对于具有相同数据的的 Redis,AOF 文件通常会比 RDF 文件体积更大。
  ②、虽然 AOF 提供了多种同步的频率,默认情况下,每秒同步一次的频率也具有较高的性能。但在 Redis 的负载较高时,RDB 比 AOF 具好更好的性能保证。
  ③、RDB 使用快照的形式来持久化整个 Redis 数据,而 AOF 只是将每次执行的命令追加到 AOF 文件中,因此从理论上说,RDB 比 AOF 方式更健壮。官方文档也指出,AOF 的确也存在一些 BUG,这些 BUG 在 RDB 没有存在。
 
选择
1、一般两者一起使用,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
2、RDB 恢复数据集的速度也要比 AOF 恢复的速度要快,如果可以忍受一小段时间内数据的丢失,毫无疑问使用 RDB 是最好的,定时生成 RDB 快照(snapshot)非常便于进行数据库备份。
3、否则就使用 AOF 重写
posted @ 2019-11-24 17:00  king_wq_庆  阅读(213)  评论(0编辑  收藏  举报