AOF持久化 - 《Redis设计与实现》读书笔记

AOF持久化:通过保存Redis服务器执行的写命令来记录数据库状态

AOF持久化的实现

AOF持久化的步骤:

  1. 写命令追加到服务器状态的aof_buf缓冲区
    此步骤由feedAppendOnlyFile函数完成

    当AOF持久化功能处于打开状态时,服务器在执行完一个命令之后,
    会以协议格式将被执行的写命令追加到服务器状态的aof_buf缓冲区的末尾

  2. 将aof_buf中的内容写入到内存缓冲区aof文件

  3. 同步内存缓冲区的aof文件数据到磁盘的aof文件
    步骤2和步骤3由flushAppendOnlyFile函数完成

    服务器配置appendfsync选项的值直接决定aof持久化功能的效率和安全性(flushAppendOnlyFile函数的行为)

appendfsync选项的值 flushAppendOnlyFile函数的行为
always 将aof_buf缓冲区中的所有内容写入并同步到AOF文件

效率最慢,安全性最强(只会丢失一个事件循环中所产生的命令数据)
everysec(默认值) 将aof_buf缓冲区中的所有内容写入到AOF文件,如果上次同步AOF文件的时间距离现在超过一秒钟,那么启动一个线程开始对AOF文件进行同步

效率足够快,安全性较好(只会丢失一秒的命令数据)
no 将aof_buf缓冲区中的所有内容写入到AOF文件,由操作系统决定对AOF文件何时进行同步

写入速度最快,同步时间最长,安全性较差(丢失上次同步AOF文件之后的所有写命令数据)

⚠️注意⚠️:
为了提高文件的写入和效率,在操作系统中,当用户调用write函数,
将一些数据写入到文件的时候,操作系统通常会将写入数据暂时保存在一个内存缓冲区里面
等到缓冲区的空间被填满 或者 超过了指定的时限之后,才真正地将缓冲区中的数据写入到磁盘里面

由此导致数据保存在内存缓冲区的数据有可能丢失,
为此,操作系统提供了fsync和fdatasync两个同步函数,
强制让操作系统立即将缓冲区的数据写入到磁盘里面,从而保证数据的安全性

在Linux操作系统中,Redis用fdatasync作为强制同步函数
其余操作系统中,Redis用fsync作为强制同步函数

AOF文件的载入

服务器只要读入并重新执行一遍AOF文件里面保存的写命令,就可以还原服务器关闭之前的数据库状态

读取AOF文件并还原数据库状态的步骤:

  1. 创建一个不带网络连接的伪客户端
    Redis的命令只能在客户端上下文中执行

  2. 从AOF文件中分析并读取出一条写命令

  3. 使用伪客户端执行被读出的写命令

  4. 一直执行步骤2和步骤3,直到AOF文件中给所有的写命令都被处理完毕为止

AOF重写

AOF文件重写

创建一个新的数据库状态相同的AOF文件替代现有的AOF文件,去掉浪费空间的冗余命令,从而新的AOF文件的体积 <= 旧AOF文件体积

实现原因: 为了解决随着服务器运行时间越长,AOF文件体积膨胀的问题,

实现原理: 从数据库中读取键现在的值,然后用一条命令去记录键值对,代替之前记录这个键值对的多条命令

⚠️注意⚠️:

  1. 为了避免在执行命令时造成客户端输入缓冲区溢出,重写程序在处理列表、哈希表、集合、有序集合这四种可能会带有多个元素的键时,会先检查键所包含的元素数量,如果键所包含的元素数量超过了src/server.h/AOF_REWRITE_ITEMS_PER_CMD常量的值,Redis 6.2版本的值为64,那么重写程序将使用多条命令来记录键的值,而不单单使用一条命令

AOF后台重写

Redis服务器使用单个线程处理命令请求,而AOF文件重写是放在线程中执行,
为了在重写AOF文件期间,服务器可以继续处理命令请求,Redis将AOF重写程序放到子进程里执行

⚠️注意⚠️:
由于Redis将AOF重写程序放到子进程里执行,由此可能导致数据库状态不一致的问题,
所以服务器状态添加了一个server.aof_rewrite_buf_blocks(AOF重写缓冲区)
这个缓冲区保存服务器创建子进程之后对数据库状态修改的写命令

AOF后台重写的步骤:

  1. 服务器父进程创建子进程,执行AOF文件重写
    子进程开始执行AOF文件重写操作
  2. 服务器父进程继续处理客户端发来的命令
    子进程执行AOF文件重写...
  3. 服务器父进程将执行后的写命令追加到AOF缓冲区
    子进程执行AOF文件重写...
  4. 服务器父进程将执行后的写命令追加到AOF重写缓冲区
    子进程执行AOF文件重写...
  5. 子进程完成AOF文件重写,向服务器父进程发送信号
    服务器父进程接到信号,调用信号处理函数
  6. 服务器父进程将AOF重写缓冲区的内容追加到AOF文件中
    这时新AOF文件所保存的数据库状态和服务器当前的数据库状态保持一致
  7. 对新的AOF文件进行改名,原子地覆盖现有的AOF文件,完成新旧两个AOF文件的替换

⚠️注意⚠️:
在整个AOF后台重写过程中过,只有第5~7步会读服务器父进程造成阻塞,这将AOF重写对服务器性能造成的影响降到了最低

源码阅读

  1. AOF持久化-第一个步骤-命令追加:src/aof.c/feedAppendOnlyFile
  2. AOF持久化-第二、三个步骤-aof文件的写入与同步:src/aof.c/flushAppendOnlyFile
  3. AOF文件重写:src/aof.c/rewriteAppendOnlyFile
  4. AOF文件后台重写:src/aof.c/rewriteAppendOnlyFileBackground

posted on 2021-08-11 17:36  果然朝辉  阅读(62)  评论(0编辑  收藏  举报

导航