POSTGRESQL数据库备份与还原 - ldsweely

公告

数据库备份还原是运维中的常见工作。按备份的文件类型分为物理备份（文件系统级别的备份）和逻辑备份（sql文件或特定格式的导出文件）；按备份过程中是否停止数据服务可分为冷备份（停止数据库服务）和热备份（备份过程中数据库服务正常运行）；按备份是否完整可分为全量备份和增量备份（备份是上一次全量备份后数据库改变的内容）。

Postgresql的常见备份方式有以下三种：

1. 文件系统级别的冷备份。

此方式需关闭数据库，然后拷贝数据文件的完整目录。恢复数据库时，将数据目录复制到原来的位置。

2. SQL转储。

用到的工具是pg_dump和pg_dumpall。

此方式可以在数据库正在使用的时候进行完整一致的备份，并不阻塞其它用户对数据库的访问。它会产生一个脚本文件，里面包含备份开始时，已创建的各种数据库对象的SQL语句和每个表中的数据。可以使用数据库提供的工具pg_dumpall和pg_dump来进行备份。pg_dump只备份数据库集群中的某个数据库的数据，它不会导出角色和表空间相关的信息，因为这些信息是整个数据库集群共用的，不属于某个单独的数据库。pg_dumpall，对集簇中的每个数据库调用pg_dump来完成该工作,还会还转储对所有数据库公用的全局对象（pg_dump不保存这些对象）。目前这包括适数据库用户和组、表空间以及适合所有数据库的访问权限等属性。

样例，对dbname数据库进行备份：

pg_dump –h 127.0.0.1 -p 5432 -U postgres -c -C –f dbname.sql dbname

对全部pg数据库进行备份：

pg_dumpall –h 127.0.0.1 –p 5432 -U postgres –c -C –f db_bak.sql

恢复数据库：

psql –h 127.0.0.1 -p 5432 -U postgres –f db_bak.sql

3. 连续归档

这种方式的策略是把一个文件系统级别的全量备份和WAL(预写式日志)级别的增量备份结合起来。当需要恢复时，先恢复文件系统级别的备份，然后重放备份的WAL文件，把系统恢复到之前的某个状态。这种备份有显著的优点：

不需要一个完美的一致的文件系统备份作为开始点。备份中的任何内部不一致性将通过日志重放来修正。

可以结合一个无穷长的WAL文件序列用于重放，可以通过简单地归档WAL文件来达到连续备份。

不需要重放WAL项一直到最后。可以在任何点停止重放，并使数据库恢复到当时的一致状态。

可以连续地将一系列WAL文件输送给另一台已经载入了相同基础备份文件的机器，得到一个实时的热备份系统。

如何进行连续归档呢？

下面的实例中，操作系统为windows 10，Postgresql的版本为9.6。

首先，需要修改postgresql.conf文件的几个参数修改如下：

wal_level = ‘replica’

archive_mode = ‘on’

archive_command = 'copy /y "%p" "D:\\archive\\%f"'

archive_command执行时，%p会被要被归档的文件路径所替代，而%f只会被文件名所替代。如果你需要在命令中嵌入一个真正的%字符，可以使用%%。 “D:\\archive\\”替换为归档日志的存放路径，要确保归档的目录是存在的。

之后需要重启数据库使配置生效。

接下来需制作一个非排他的基础备份。Postgresql提供了排他备份和非排他备份两种备份方式，推荐使用非排他备份。

1. 作为一个具有运行 pg_start_backup 权利的用户连接到服务器（不在乎是哪个数据库）并且发出命令：

Select pg_start_backup('backup_label', false, false);

2. 对数据库进行一次文件系统级别的备份。即将postgresql的安装目录下的data目录及其内容复制到其他位置。

3. 在同一个连接中，发出命令：

select * from pg_stop_backup(false);

这个命令代表结束一次非排他的备份。

现在来看基于时间点的恢复。

假如你的数据库出现了故障，需要恢复到之前的某个时刻的一致的状态，就需要进行基于时间点的恢复。

其过程是：

1. 如果服务器仍在运行，停止它。

2. 如果你具有足够的空间，将整个集簇数据目录和表空间复制到一个临时位置。注意最好是拷贝而不是移动。如果你没有足够的空间，你至少要保存集簇的pg_xlog子目录的内容，因为它可能包含在系统垮掉之前还未被归档的日志。

3. 移除data 目录及其所有子文件和子目录。

4. 从文件系统备份中恢复数据库文件。注意它们要使用正确的用户恢复并且使用正确的权限。如果你在使用表空间，你应该验证pg_tblspc/中的符号链接被正确地恢复。

5.现在已经从备份中恢复了整个数据目录，接下来，你需要部分或全部删除数据目录中的下列文件，如果它们存在：

(1) postmaster.pid；（必须）

(2) pg_xlog中的文件；（必须）

(3) pgsql_tmp开头的临时文件；（可选）

(4) postgresql.auto.conf.tmp；（可选）

(5) pg_replslot目录中的文件；（可选）

(6) pg_stat_tmp目录中的文件。（可选）

6. 如果你有在第2步中保存的未归档WAL段文件，把它们拷贝到pg_xlog/中或WAL日志的归档目录中。

在集簇数据目录中创建一个恢复命令文件recovery.conf。如果你想恢复到最近的一致状态，在recovery.conf写入如下两行：

restore_command = 'copy /y D:\\archive \\%f\\%p'

recovery_target_timeline = 'latest'

其中，restore_command的内容表示将归档日志文件夹中的内容拷贝到pg_xlog，其参数的含义与上文archive_command的参数含义完全相同；recovery_target_timeline = 'latest' 表示恢复到最近的时间点。

7. 如果要阻止普通用户在成功恢复之前连接，请修改pg_hba.conf。

8. 启动服务器。服务器将会进入到恢复模式并且进而根据需要读取归档WAL文件。恢复可能因为一个外部错误而被终止，可以简单地重新启动服务器，这样它将继续恢复。恢复过程结束后，服务器将把recovery.conf重命名为recovery.done（为了阻止以后意外地重新进入恢复模式），并且开始正常数据库操作。

9. 检查数据库的内容来确保你已经恢复到了期望的状态。如果没有，返回到第1步。如果一切正常，通过恢复pg_hba.conf为正常来允许用户连接。

这样就完成了一次文件系统级别的全量备份，并实现了WAL文件级别的增量备份。

附：pg_start_backup() 和 pg_stop_backup()做了什么？

1. pg_start_backup()

pg_start_backup() 的函数原型如下：

pg_start_backup(label text [, fast boolean [, exclusive boolean ]])

其中label是用来唯一标识这次备份操作的任意字符串，fast 表示是否立即执行强制的检查点，exclusive 表示该备份是否是一个排他备份。

使用该函数时，推荐将exclusive设置为false，即非排他方式备份。

执行下面的命令：

Select pg_start_backup('backup_label', false, false);

这条命令会产生三个动作：

1. 在缓冲区中创建两个变量：label_file和tblspc_map_file。前者包含WAL的起始位置、检查点的起始位置、备份方法、备份模式、备份开始时间和备份标签的名称（本例中，名称为“backup_label”）等信息；后者包含 “pg_tblspc/”中表空间符号链接的信息，如果它们存在。

2. 强制发生一次检查点。将检查点开始前提交的事务对数据库的修改刷新到磁盘。

3. 置写日志标志为：XLogCtl->Insert.forcePageWrites = true。把这个标志设置为true后，如果在备份期间时有其他事务修改数据库，那么系统会把被修改的数据页在修改前的完整页面都记录到WAL中，而不仅仅是记录页面中的变化的部分。

为什么要将完整的页面记录到WAL中呢？

原因是在备份过程中，其他事务修改数据库，可能会造成备份后的数据存在新旧数据混合的情况，甚至同一数据页面也会出现这种情况。假如WAL日志中仅仅记录变化的那部分的内容，就无法将数据库恢复到上次备份结束时刻的状态。所以要将修改后的完整页面写入WAL中，以保证数据库恢复后的一致性。

2. pg_stop_backup()

pg_stop_backup()的函数原型如下：

pg_stop_backup([, exclusive boolean ]);

exclusive 表示该备份是否是一个排他备份。

如果采用非排他方式备份，执行：

Select pg_stop_backup(false);

此命令会产生如下动作：

1. label_file和tblspc_map_file的内容会包含在该函数返回的结果中，并且应该被写入到该备份的一些文件中（这些内容不在数据目录中）。

2. 在事务日志归档区里创建一个备份历史文件（.hostory）。这个历史文件包含 pg_start_backup的标签、备份的起始与终止事务日志位置以及备份的起始和终止时间。返回值是备份的终止事务日志位置（同样也可以被忽略）。在记录结束位置之后，当前事务日志插入点被自动地推进到下一个事务日志文件，这样结束的事务日志文件可以立即被归档来结束备份。

posted on 2022-09-19 21:22 ldsweely 阅读(4469) 评论(0) 收藏举报

刷新页面返回顶部