redis持久化

持久化 redis 有几种方式?

第⼀种是快照,第⼆种是 AOF ⽇志。
快照是⼀次全量备份,AOF ⽇志是连续的增量备份。

答: redis提供两种方式进行持久化,一种是RDB持久化(原理是将Reids在内存中的数据库记录定时 dump到磁盘上的RDB持久化),另外一种是AOF(append only file)持久化(原理是将Reids的操作日志以追加的方式写入文件)。

① 快照持久化 :

RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘,实际操作过程是fork一个子进程,先将数据集写入临时文件,写入成功后,再替换之前的文件,用二进制压缩存储
在 redis 配置文件中已经自动开启了,
格式是:save N M

Redis 使⽤操作系统的多进程 COW(Copy On Write) 机制来实现快照持久化,这个机制很有意思,也很少⼈知道。多进程 COW 也是鉴定程序员知识⼴度的⼀个重要指标。
Redis 在持久化时会调⽤ glibc 的函数fork产⽣⼀个⼦进程,快照 持久化完全交给⼦进程来处理,⽗进程继续处理客户端请求。⼦进程 刚刚产⽣时,它和⽗进程共享内存⾥⾯的代码段和数据段。这时你可 以将⽗⼦进程想像成⼀个连体婴⼉,共享身体。这是 Linux 操作系 统的机制,为了节约内存资源,所以尽可能让它们共享起来。在进程 分离的⼀瞬间,内存的增⻓⼏乎没有明显变化。

主要有以下三种配置:

save 900 1              #在900秒(15分钟)之后,如果至少有1个key发生变化,则dump内存快照。

save 300 10            #在300秒(5分钟)之后,如果至少有10个key发生变化,则dump内存快照。

save 60 10000        #在60秒(1分钟)之后,如果至少有10000个key发生变化,则dump内存快照

表示在 N 秒之内,redis 至少发生 M 次修改则 redis 抓快照到磁盘。
当然我们也可以手动执行 save 或者 bgsave(异步)命令来做快照

②append only file AOF 持久化 :

也就是先执⾏指令才将⽇志存盘

AOF持久化以日志的形式记录服务器所处理的每一个写、删除操作,查询操作不会记录,以文本的方式记录,可以打开文件看到详细的操作记录。
总共有三种模式,如
appendfsync everysec 默认的是每秒强制写入磁盘一次
appendfsync always 每次执行写操作的时候就强制写入磁盘
appendfsync no 完全取决于 os,性能最好但是持久化没法保证
其中第三种模式最好。redis 默认的也是采取第三种模式

Redis 提供了 bgrewriteaof 指令⽤于对 AOF ⽇志进⾏瘦身。其原 理就是开辟⼀个⼦进程对内存进⾏遍历转换成⼀系列 Redis 的操作 指令,序列化到⼀个新的 AOF ⽇志⽂件中。序列化完毕后再将操作 期间发⽣的增量 AOF ⽇志追加到这个新的 AOF ⽇志⽂件中,追加 完毕后就⽴即替代旧的 AOF ⽇志⽂件了,瘦身⼯作就完成了。

二者优缺点

RDB存在哪些优势呢?

1). 一旦采用该方式,那么你的整个Redis数据库将只包含一个文件,这对于文件备份而言是非常完美的。比如,你可能打算每个小时归档一次最近24小时的数 据,同时还要每天归档一次最近30天的数据。通过这样的备份策略,一旦系统出现灾难性故障,我们可以非常容易的进行恢复。

2). 对于灾难恢复而言,RDB是非常不错的选择。因为我们可以非常轻松的将一个单独的文件压缩后再转移到其它存储介质上。

3). 性能最大化。对于Redis的服务进程而言,在开始持久化时,它唯一需要做的只是fork出子进程,之后再由子进程完成这些持久化的工作,这样就可以极大的避免服务进程执行IO操作了。

4). 相比于AOF机制,如果数据集很大,RDB的启动效率会更高。

RDB又存在哪些劣势呢?

1). 如果你想保证数据的高可用性,即最大限度的避免数据丢失,那么RDB将不是一个很好的选择。因为系统一旦在定时持久化之前出现宕机现象,此前没有来得及写入磁盘的数据都将丢失。

2). 由于RDB是通过fork子进程来协助完成数据持久化工作的,因此,如果当数据集较大时,可能会导致整个服务器停止服务几百毫秒,甚至是1秒钟。

AOF的优势有哪些呢?

1). 该机制可以带来更高的数据安全性,即数据持久性。Redis中提供了3中同步策略,即每秒同步、每修改同步和不同步。事实上,每秒同步也是异步完成的,其 效率也是非常高的,所差的是一旦系统出现宕机现象,那么这一秒钟之内修改的数据将会丢失。而每修改同步,我们可以将其视为同步持久化,即每次发生的数据变 化都会被立即记录到磁盘中。可以预见,这种方式在效率上是最低的。至于无同步,无需多言,我想大家都能正确的理解它。

2). 由于该机制对日志文件的写入操作采用的是append模式,因此在写入过程中即使出现宕机现象,也不会破坏日志文件中已经存在的内容。然而如果我们本次操 作只是写入了一半数据就出现了系统崩溃问题,不用担心,在Redis下一次启动之前,我们可以通过redis-check-aof工具来帮助我们解决数据 一致性的问题。

3). 如果日志过大,Redis可以自动启用rewrite机制。即Redis以append模式不断的将修改数据写入到老的磁盘文件中,同时Redis还会创 建一个新的文件用于记录此期间有哪些修改命令被执行。因此在进行rewrite切换时可以更好的保证数据安全性。

4). AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。事实上,我们也可以通过该文件完成数据的重建。

AOF的劣势有哪些呢?

1). 对于相同数量的数据集而言,AOF文件通常要大于RDB文件。RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。

2). 根据同步策略的不同,AOF在运行效率上往往会慢于RDB。总之,每秒同步策略的效率是比较高的,同步禁用策略的效率和RDB一样高效。

二者选择的标准,就是看系统是愿意牺牲一些性能,换取更高的缓存一致性(aof),还是愿意写操作频繁的时候,不启用备份来换取更高的性能,待手动运行save的时候,再做备份(rdb)。rdb这个就更有些 eventually consistent的意思了。

 

posted @ 2019-04-26 19:53  小呆1107  阅读(99)  评论(0编辑  收藏  举报