Redis持久化——RDB快照
一.是什么?
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件,整个过程中,主进程是不进行任何I/O操作的,这就确保了极高的性能。
如果需要进行大规模数据的恢复且对于数据恢复的完整性不是非常敏感,那RDB要比Redis另一种持久化方式AOF更加高效,RDB的缺点是最后一次持久化的数据可能丢失。
二.Fork?
Fork的作用是复制一个与当前进程一样的进程,新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一样,但是是一个全新的进程,并作为原进程的子进程。
三.触发方式?(默认RDB文件名称:dump.rdb)
1.手动触发
1).执行save命令后(save命令只管保存,会阻塞进程)
2).执行bgsave命令后(异步执行快照操作,对客户端请求无影响,可通过lastsave命令获取最后一次成功执行快照的时间)
3).执行flushall命令后(会产生空的dump.rdb文件,因此无意义)
4).执行shutdown命令后
2.自动触发
配置 redis.conf 文件中 SNAPSHOTTING 下的属性。
四.如何恢复快照中的数据?
将备份文件 (dump.rdb) 移动到 redis 安装目录并启动服务即可,redis就会自动加载文件数据至内存了。Redis 服务器在载入 RDB 文件期间,会一直处于阻塞状态,直到载入工作完成为止。
获取 redis 的安装目录可以使用 config get dir 命令
五.如何停止RDB持久化
有些情况下,我们只想利用Redis的缓存功能,并不像使用 Redis 的持久化功能,那么这时候我们最好停掉 RDB 持久化来最大化Redis性能。
1).在redis.conf配置文件中,注释掉所有的 save 行来停用RDB功能或者直接一个空字符串来实现停用:save ""
2).通过命令config set save "" 停用RDB功能。
六.总结
1.劣势
1).RDB是在一定间隔时间做一次备份,所以如果Redis服务意外停止的话就会丢失最后一次快照的所有修改。
2).数据丢失的风险大,对数据完整性和一致性要求不高。
3).RDB方式数据没办法做到实时持久化/秒级持久化。因为bgsave每次运行都要执行fork操作创建子进程,属于重量级操作(内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑),当数据集比较大的时候,fork的过程是非常耗时的,频繁执行成本过高(影响性能),可能会导致Redis在一些毫秒级不能响应客户端请求。
4).RDB文件使用特定二进制格式保存,Redis版本演进过程中有多个格式的RDB版本,存在老版本Redis服务无法兼容新版RDB格式的问题(版本不兼容)
2.优势
1).RDB是一个非常紧凑(compact)的文件,它保存了Redis在某个时间点上的数据集。这种文件非常适合用于进行备份和灾难恢复。
2).RDB在恢复大数据集时的速度比 AOF 的恢复速度要快。
3).生成RDB文件的时候,Redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作,所以RDB持久化方式可以最大化Redis性能。