Redis持久化
Redis持久化
Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么一旦服务器进程退出,服务器中的数据库状态也会消失,所以Redis提供了持久化功能
RDB(Redis DataBase)
什么是RDB
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是
Snapshot快照
,它恢复时是将快照文件直接读到内存里。Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个
临时RDB文件
中,等持久化过程都结束了,再用这个临时文件替换上次已经持久化完成的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那
RDB方式
要比AOF方式
更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。一般默认的是RDB
, 不需要修改文件。他一般保存在
dump.rdb
文件中
可以查看 redis.conf
中的 SNAPSHOTTING
:
当你满足制定的规则时,就会生成 dump.rdb
文件,该文件名可以在配置文件中进行修改。
触发机制
1,save的规则
满足的情况下,会自动触发rdb规则
2、执行flushall
命令,也会触发我们的rdb规则
3、退出redis
,也会产生rdb文件
恢复rdb文件
1、只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb
恢复其中的数据
2、查看需要存在的位置
127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/bin" #如果在这个目录下存在dump.rdb文件,启动就会自动恢复其中的数据
优缺点
优点:
- 适合大规模的数据恢复
- 对数据的完整性要不高
缺点:
- 需要一定的时间间隔进程操作
- 如果redis意外宕机了,这个最后一次修改数据就没有的了
- fork进程的时候,会占用一定的内容空间
AOF(Append Only File)
什么是AOF
将我们的所有命令都记录下来,history,恢复的时候就把这个文件全部在执行一遍
以
日志
的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录
),只允许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,也就是说,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作AOF保存的是
appendonly.aof
文件
开启AOF
这里默认是不开启的,需要我们修改为 yes
, 这样就开启了 AOF
开启之后,重启Redis,之后我们查看 /usr/local/bin
路径下
修复AOF
如果这个
.aof
文件 被无意或者人为损坏了,这时候 redis是无法连接的,而这个时候,我们就需要修复这个aof文件。
我们先来测试一下,
- 在redis中保存数据
- 修改aof文件
- 重新启动redis
- 修复AOF
1.redis保存数据
127.0.0.1:6379> set k1 v1 #保存k1:v1
OK
127.0.0.1:6379> set k2 v2 #保存k2:v2
OK
127.0.0.1:6379> shutdown #关闭redis
not connected> exit
2.查看并修改文件
vim appendonly.aof
没修改的:
修改过的:
3.尝试启动redis
很明显,因为aof文件被修改,redis无法启动了
4.修复redis
redis提供了一个修复工具
redis-check-aof
修复语句:
redis-check-aof --fix appendonly.aof
这时候查看aof文件,会发现已经恢复成修改前的样子了。
这时候,再次进行启动redis,就可以成功了
优缺点
appendonly no #默认是不开启aof模式的,默认是使用rdb方式持久化的,在大部分所有的情况下,rdb完全够用
appendfilename "appendonly.aof" #持久化的文件的名字
#appendfsync always #每次修改都会sync。消耗性能
appendfsync everysec #每秒执行一次sync,可能会损失这1s的数据
#appendfsync no #不执行sync,这个时候操作系统自己同步数据,速度最快
#重写机制
auto-aof-rewrite-percentage 100 #两倍大小时重写
auto-aof-rewrite-min-size 64mb #重写文件最小体积,默认为64mb,超过这个数值,会fork一个新线程将我们的文件重写
优点:
- 每一次修改都同步,文件的完整会更加好
- 每秒同步一次,可能会丢失一秒的数据
- 从不同步,效率最高的
缺点:
- 相对于数据文件来说,aof远远大于rdb,修复的速度也比rdb慢
- Aof运行效率也要比rdb慢,所以我们redis默认的配置就是rdb持久化
扩展
1、RDB持久化方式能够在指定的时间间隔内对你的数据进行快照存储
2,AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大。
3、只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化
4、同时开启两种持久化方式
-
在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
-
RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有AOF可能潜在的Bug,留着作为一个万一的手段。
5、性能建议
-
因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则。
-
如果Enable AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的10,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
-
如果不Enable AOF,仅靠Master-Slave Repllcation实现高可用性也可以,能省掉一大笔10,也减少了rewrite时带来的系统波动。代价是如果Master/Slave同时出问题( 例如:突然断电 ),会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave中的RDB文件,载入较新的那个。