redis使用基础(五) ——Redis数据持久化

redis使用基础(五)

——Redis数据持久化

 

(转载请附上本文链接——linhxx) 

       

当服务器突然发生问题,或者redis重启,如果希望将数据持久化在硬盘中,下次开启redis还有数据时,redis提供了两种方案,一个叫做RDB(通过内存快照(Snapshotting)实现),另一个叫做AOF(日志追加(Append-only file))。通常结合两种方式来实现redis的持久化。

 

1、RDB

         RDB通过内存快照实现,会将redis当前的全部数据以快照的方式写入二进制文件中。实现快照有以下几种方式:

1)用户配置规则,自动快照

         采用save <seconds> <changes>,每当seconds秒内改动超过changes次,则会触发快照。可以同时设置多个save,每个save是【或】的关系,即满足一个save就会实现快照。

         例如:

         save 100 10

         save 200 20

         save 300 30

         表示100秒内改动超过10次,或200秒内改动超过20次,或300秒内改动超过30次,则redis自动快照。

2)手动执行save或bgsave,实现快照

         save命令手动执行,会立即快照。但是由于redis的单线程特性,则会发生阻塞。且如果redis存储的内容多,保存速度较慢。因此不建议save方式实现快照。

         bgsave实现在后台异步快照,不影响redis的正常使用。

3)flushall命令

         flushall会清空redis的所有数据。当执行此命令之前设置过任意快照条件,只要有设置快照触发条件,flushall命令执行后无论是否满足快照条件,都很执行一次快照。

4)主从复制

         当执行主从复制,即使没有设置快照条件,也会执行快照操作。

 

2、快照原理

         redis默认将快照存储在redis当前进程工作目录中,文件名默认是dump.rdb,可以通过配置dir和dbfilename改变快照的路径和文件名。快照执行过程如下:

         1)redis使用fork函数复制一份当前进程(父进程)的副本(子进程)。fork函数采用写复制方式,当复制过程中如果有数据改动,会被同步改动到复制后的数据。因此复制的数据是执行fork时间的数据。

         2)父进程继续处理客户端的命令,子进程将数据写入硬盘。

         3)子进程写完所有文件后会将新的RDB替换旧的RDB文件,写入完成。

         快照的优势如下:

1)fork可以使得副本复制后,占用的内存不是当前使用量的两倍,但是仍需要临时占用较多内存,因此设计的时候需要考虑好用到多少内存,避免快照失败。

         2)快照生成的rdb文件是新的直接替换旧的,因此任意时刻的rdb文件都是完整的。这也就让用户可以定时备份rdb文件。

         3)rdb文件是压缩后的文件,因此实际占用量小于原来在内存的使用量。

 

3、AOF

         AOF开启后会降低redis异常关闭导致的数据丢失。AOF会将用户执行的每一条写命令追加到硬盘中,保证数据实时,此操作会降低性能。

1)开启AOF

         默认情况下是没开AOF的,可以通过命令appendonly yes来开启。开启后每个写入的命令都会被执行,默认文件名是appendonly.aof,路径和rdb相同。

2)AOF详情

         AOF记录的是redis客户端给redis发送的通信协议原生的内容。

但是,仅记录命令有可能会浪费空间,如连续10个命令对一个键的值进行设置,其实只需要记录最后一次的操作就可以。redis可以通过配置文件对aof进行自动重新,包括aof大小超过一定空间,或者本次的文件内容达到上次重写后的百分之多少。

另外,可以手动通过命令BGREWRITEAOF,实现手动命令重写AOF。

AOF采用行的方法记录,每一行记录一个内容,要么是命令,要么是键,要么是值。因此恢复起来速度比rdb慢。

3)同步硬盘数据

         由于操作系统也存在缓存,因此每次执行aof的写入,只是被写入硬盘的缓存中,每30秒会同步到硬盘。因此30秒内如果系统异常奔溃,这30秒的数据可能会丢失。

         为了避免这个情况,redis允许配置appendfsync,包括always、no、everysec三种参数。默认是everysec,即每秒强制要操作系统完成一次同步;always每次写入的时候同步,最安全但最慢;no是用操作系统的方法进行同步,不安全。

        

通常会同时开启AOF和RDB两种持久化,保证数据的一致性。

 

——written by linhxx

 

更多最新文章,欢迎关注微信公众号“决胜机器学习”,或扫描右边二维码。

posted @ 2018-02-04 12:17  lin_h  阅读(223)  评论(0编辑  收藏  举报