redis使用基础(五) ——Redis数据持久化
redis使用基础(五)
——Redis数据持久化
(转载请附上本文链接——linhxx)
当服务器突然发生问题,或者redis重启,如果希望将数据持久化在硬盘中,下次开启redis还有数据时,redis提供了两种方案,一个叫做RDB(通过内存快照(Snapshotting)实现),另一个叫做AOF(日志追加(Append-only file))。通常结合两种方式来实现redis的持久化。
1、RDB
RDB通过内存快照实现,会将redis当前的全部数据以快照的方式写入二进制文件中。实现快照有以下几种方式:
1)用户配置规则,自动快照
采用save <seconds> <changes>,每当seconds秒内改动超过changes次,则会触发快照。可以同时设置多个save,每个save是【或】的关系,即满足一个save就会实现快照。
例如:
save 100 10
save 200 20
save 300 30
表示100秒内改动超过10次,或200秒内改动超过20次,或300秒内改动超过30次,则redis自动快照。
2)手动执行save或bgsave,实现快照
save命令手动执行,会立即快照。但是由于redis的单线程特性,则会发生阻塞。且如果redis存储的内容多,保存速度较慢。因此不建议save方式实现快照。
bgsave实现在后台异步快照,不影响redis的正常使用。
3)flushall命令
flushall会清空redis的所有数据。当执行此命令之前设置过任意快照条件,只要有设置快照触发条件,flushall命令执行后无论是否满足快照条件,都很执行一次快照。
4)主从复制
当执行主从复制,即使没有设置快照条件,也会执行快照操作。
2、快照原理
redis默认将快照存储在redis当前进程工作目录中,文件名默认是dump.rdb,可以通过配置dir和dbfilename改变快照的路径和文件名。快照执行过程如下:
1)redis使用fork函数复制一份当前进程(父进程)的副本(子进程)。fork函数采用写复制方式,当复制过程中如果有数据改动,会被同步改动到复制后的数据。因此复制的数据是执行fork时间的数据。
2)父进程继续处理客户端的命令,子进程将数据写入硬盘。
3)子进程写完所有文件后会将新的RDB替换旧的RDB文件,写入完成。
快照的优势如下:
1)fork可以使得副本复制后,占用的内存不是当前使用量的两倍,但是仍需要临时占用较多内存,因此设计的时候需要考虑好用到多少内存,避免快照失败。
2)快照生成的rdb文件是新的直接替换旧的,因此任意时刻的rdb文件都是完整的。这也就让用户可以定时备份rdb文件。
3)rdb文件是压缩后的文件,因此实际占用量小于原来在内存的使用量。
3、AOF
AOF开启后会降低redis异常关闭导致的数据丢失。AOF会将用户执行的每一条写命令追加到硬盘中,保证数据实时,此操作会降低性能。
1)开启AOF
默认情况下是没开AOF的,可以通过命令appendonly yes来开启。开启后每个写入的命令都会被执行,默认文件名是appendonly.aof,路径和rdb相同。
2)AOF详情
AOF记录的是redis客户端给redis发送的通信协议原生的内容。
但是,仅记录命令有可能会浪费空间,如连续10个命令对一个键的值进行设置,其实只需要记录最后一次的操作就可以。redis可以通过配置文件对aof进行自动重新,包括aof大小超过一定空间,或者本次的文件内容达到上次重写后的百分之多少。
另外,可以手动通过命令BGREWRITEAOF,实现手动命令重写AOF。
AOF采用行的方法记录,每一行记录一个内容,要么是命令,要么是键,要么是值。因此恢复起来速度比rdb慢。
3)同步硬盘数据
由于操作系统也存在缓存,因此每次执行aof的写入,只是被写入硬盘的缓存中,每30秒会同步到硬盘。因此30秒内如果系统异常奔溃,这30秒的数据可能会丢失。
为了避免这个情况,redis允许配置appendfsync,包括always、no、everysec三种参数。默认是everysec,即每秒强制要操作系统完成一次同步;always每次写入的时候同步,最安全但最慢;no是用操作系统的方法进行同步,不安全。
通常会同时开启AOF和RDB两种持久化,保证数据的一致性。
——written by linhxx
更多最新文章,欢迎关注微信公众号“决胜机器学习”,或扫描右边二维码。