Redis持久化

RDB(Redis DataBase)

redis是内存数据库如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失,所以Redis提供了持久化功能。

在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的SnapShot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入一个临时文件中,待持久化过程都结束了,在用这个临时文件替换上次持久化好的文件,整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。
如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。

默认情况下就是RDB,一般情况下不需要修改
rdb保存的文件就是 dump.rdb
触发机制:

  • save命令规则满足 save 900 1(900s内修改了一次)
  • flushall命令
  • 退出redis
    恢复:
    将rdb文件放到启动目录(>>config get dir)下就可以,redis启动时会自动检查dump.rdb文件恢复其中的数据

有时会将这个rdb数据文件进行备份

RDB的优点:

  1. 适合大规模数据恢复 dump.rdb
  2. 对数据完整性要求不高

RDB的缺点:

  1. 需要一定的时间间隔进行操作,如果Redis意外宕机,那么多最后一次修改的数据就没有了
  2. fork进程的时候,会占用一定的内存控件

AOF(Append Only File)

追加文件
将所有命令都记录下来类似于history,恢复的时候就把这个文件全部再执行一遍

以日志的形式记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以写文件,redis启动之初会读取该文件重新构建数据,换言之,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。

Aof保存的是appendonly.aof文件

默认是不开启的,如需使用需要手动开启

appendonly yes :开启aof

触发机制:

  • 重启redis就会生效
  • 退出redis
如果aof文件出现问题,无法启动redis
使用redis-check-aof工具修复文件(丢弃错误数据),重启即可恢复

rewrite重写规则(当文件超过64mb,太大了,就会fork一个新进程来将我们的文件进行重写)

AOF的优点:

  1. 每一次修改都同步(always,everysec,no),消耗性能,但文件完整性更加好
  2. 默认开启每秒同步一次,如果这一秒服务器发生宕机,可能会丢失这一秒的数据
  3. 从不同步,效率是最高的(由操作系统自己同步数据)

AOF的缺点:

  1. 相对于数据文件来说,aof文件大小远远大于rdb,修复的速度也比rdb慢
  2. AOF运行效率也比rdb慢,所以redis默认配置就是rdb持久化

扩展

  1. RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储。

  2. AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始 的数据,AOF命令以Redis 协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重 写,使得AOF文件的体积不至于过大。

  3. 只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化。

  4. 同时开启两种持久化方式

在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF 文件保存的数据集要比RDB文件保存的数据集要完整。
RDB 的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有 AOF可能潜在的Bug,留着作为一个万一的手段。

  1. 性能建议
    因为RDB文件只用作后备用途,建议只在slave上持久化RDB文件,而且只要15分钟备份一次就够 了,只保留 save 900 1 这条规则。

如果开启 AOF ,好处是在恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite的后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite 的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重 写可以改到适当的数值。

如果关闭 AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也 减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时倒掉(断电),会丢失十几分钟的数据, 启动脚本也要比较两个 Master/Slave 中的 RDB文件,载入较新的那个,微博就是这种架构。

posted @ 2021-12-11 21:13  一刹流云散  阅读(37)  评论(0编辑  收藏  举报