KingbaseES V8R6运维案例之---sys_waldump解析wal日志

案例说明:
wal日志文件记录了,事务操作的redo日志信息,由于wal日志文件是二进制文件,无法直接读取其文件内容。sys_waldump 可以解决这个问题,通过sys_waldump来解析wal 日志来分析和解决一些问题。例如在用户误操作时,可以通过解析wal日志,获取到事务操作的具体时间、xid等,用于建立基于PITR的恢复操作的基线。
Wal日志被划分为多个类型的资源管理器(RMGR),每个资源管理器只需要负责与自己相关的日志处理(抽象出操作函数,不同的日志应用使用不同的操作函数)。
如下图所示:RMGR结构

适用版本:
KingbaseES V8R3/R6

一、查看wal日志RMGR信息
=如下所示:不同的RMGR对应不同对象的操作日志。=

[kingbase@node101 bin]$ ./sys_waldump --rmgr=list

XLOG                 :和xlog相关的事务日志,包括checkpoint、日志切换等。
Transaction           :和事务相关的事务日志,比如事务提交、回滚、两阶段提交等。
Storage               : 存储文件的操作的操作,比如create table、truncate table等。
CLOG                  : 和事务提交相关的事务日志,事务提交会在clog中记录事务的状态。
Database              :和数据库相关的操作,比如create database等。
Tablespace            :和表空间操作相关产生的事务日志,比如create tablespace等。
TablespaceEnc         :和表空间操作相关产生的事务日志
MultiXact            :在同一元组上加多个锁产生了MultiXact的事务日志。
RelMap                :和表空间操作相关产生的事务日志
Standby              :和standby相关的事务日志,比如记录锁信息,事务运行信息等,wal_level >= WAL_LEVEL_REPLICA时,会写Standby。
Heap2                : 对heap进行操作的事务日志,例如vacuum对页面的清理操作。
Heap                 :对heap进行操作的事务日志,比如DML操作,insert、update、delete等。
Btree                :对索引进行操作的事务日志,比如对索引的更新。
Hash                  :对索引进行操作的事务日志,比如对索引的更新。
Gin                  :对索引进行操作的事务日志,比如对索引的更新。
Gist                 :对索引进行操作的事务日志,比如对索引的更新。
Sequence              :对序列(sequence)进行操作的事务日志,比如sequence的创建。
SPGist               :对索引进行操作的事务日志,比如对索引的更新。
BRIN                 :对索引进行操作的事务日志,比如对索引的更新。
CommitTs             : 和事务提交相关的事务日志
ReplicationOrigin    :和复制、热备相关的操作。
Generic               :和复制、热备相关的操作。
LogicalMessage       :和复制、热备相关的操作。

=如下所示:RMGR:XLOG对应了checkpoint类型的wal日志。=

二、测试案例
如下所示,在数据库执行DDL、DML事务操作,事务commit时,将对应的wal日志条目从wal_buffer写入wal日志文件,可通过sys_waldump解析wal日志文件,获取到对应操作的日志条目的内容。

# 查看当前数据库的lsn
test=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C003C70
(1 row)

# 创建数据库
test=# create database prod1;
CREATE DATABASE
test=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C004280
(1 row)

#创建数据库对象
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C004700
(1 row)

prod1=# create table tb1 (id int,name varchar2(10));
CREATE TABLE
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C024788
(1 row)

# 对象执行DML操作
prod1=# insert into tb1 values (10,'tom');
INSERT 0 1
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C024820
(1 row)

prod1=# insert into tb1 values (20,'jerry');
INSERT 0 1
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C024890
(1 row)

prod1=# update tb1 set name='rose' where id=20;
UPDATE 1
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C024968
(1 row)

prod1=# delete from tb1 where id=20;
DELETE 1
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C0249F8
(1 row)

# 对象执行DDL操作(truncate)
prod1=# truncate table tb1;
TRUNCATE TABLE
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C024C50
(1 row)

#  对象执行DDL操作(drop)
prod1=# drop table tb1;
DROP TABLE
prod1=# select pg_current_wal_lsn();
 pg_current_wal_lsn
--------------------
 4/5C0251D8
(1 row)

# 查看当前online的wal日志文件
prod1=# select pg_current_wal_lsn(),pg_walfile_name(pg_current_wal_lsn()),pg_walfile_name_offset(pg_current_wal_lsn());
 pg_current_wal_lsn |     pg_walfile_name      |      pg_walfile_name_offset
--------------------+--------------------------+-----------------------------------
 4/5C0251D8         | 0000001D000000040000005C | (0000001D000000040000005C,152024)
(1 row)

##如上所示,当前事务操作的wal日志flush到“0000001D000000040000005C”对应的日志文件。

三、sys_waldump解析wal日志

1、sys_waldump帮助

2、执行sys_waldump解析日志

[kingbase@node101 bin]$ ./sys_waldump /data/kingbase/r6ha/data/sys_wal/0000001D000000040000005C -s 4/5C003C70

......
rmgr: XLOG        len (rec/tot):     30/    30, tx:          0, lsn: 4/5C003C70, prev 4/5C003C40, desc: NEXTOID 197378
rmgr: Standby     len (rec/tot):     46/    46, tx:          0, lsn: 4/5C003C90, prev 4/5C003C70, desc: RUNNING_XACTS nextXid 2883 latestCompletedXid 1543519344 oldestRunningXid 2882
rmgr: Heap        len (rec/tot):    291/   291, tx:       2882, lsn: 4/5C003CC0, prev 4/5C003C90, desc: INSERT off 22 flags 0x00, blkref #0: rel 1664/0/1262 blk 0
rmgr: Btree       len (rec/tot):     55/   349, tx:       2882, lsn: 4/5C003DE8, prev 4/5C003CC0, desc: INSERT_LEAF off 9, blkref #0: rel 1664/0/2671 blk 1 FPW
rmgr: Btree       len (rec/tot):     55/   340, tx:       2882, lsn: 4/5C003F48, prev 4/5C003DE8, desc: INSERT_LEAF off 20, blkref #0: rel 1664/0/2672 blk 1 FPW
rmgr: Standby     len (rec/tot):     46/    46, tx:          0, lsn: 4/5C0040B8, prev 4/5C003F48, desc: RUNNING_XACTS nextXid 2883 latestCompletedXid 1543520440 oldestRunningXid 2882
rmgr: XLOG        len (rec/tot):    114/   114, tx:          0, lsn: 4/5C0040E8, prev 4/5C0040B8, desc: CHECKPOINT_ONLINE redo 4/5C0040B8; tli 29; prev tli 29; fpw true; xid 0:2883; oid 197378; multi 1; offset 0; oldest xid 867 in DB 1; oldest multi 1 in DB 1; oldest/newest commit timestamp xid: 0/0; oldest running xid 2882; online
......

=如下所示,wal日志中记录的日志条目的lsn信息。=

三、sys_waldump应用案例

1、直接进行两个日志及其之间的信息的打印

[kingbase@node101 sys_wal]$ /home/kingbase/cluster/R6HA/kha/kingbase/bin/sys_waldump 0000001F000000040000006A 0000001F000000040000006B

rmgr: XLOG        len (rec/tot):    114/   114, tx:          0, lsn: 4/6A000028, prev 4/69001580, desc: CHECKPOINT_SHUTDOWN redo 4/6A000028; tli 31; prev tli 31; fpw true; xid 0:2968; oid 189209; multi 1; offset 0; oldest xid 867 in DB 1; oldest multi 1 in DB 1; oldest/newest commit timestamp xid: 0/0; oldest running xid 0; shutdown
rmgr: Standby     len (rec/tot):     42/    42, tx:          0, lsn: 4/6A0000A0, prev 4/6A000028, desc: RUNNING_XACTS nextXid 2968 latestCompletedXid 0 oldestRunningXid 2968
rmgr: Heap        len (rec/tot):     56/  4850, tx:       2968, lsn: 4/6A0000D0, prev 4/6A0000A0, desc: INSERT off 171 flags 0x00, blkref #0: rel 1663/32786/32886 blk 3 FPW
......

2、指定资源类型和起始lsn

[kingbase@node101 sys_wal]$ /home/kingbase/cluster/R6HA/kha/kingbase/bin/sys_waldump 0000001F000000040000006A -s 4/6A000028 -b -f -r transaction

rmgr: Transaction len (rec/tot):     34/    34, tx:       2968, lsn: 4/6A0013C8, prev 4/6A0000D0, desc: COMMIT 2022-09-23 14:57:25.783575 CST
rmgr: Transaction len (rec/tot):     34/    34, tx:       2969, lsn: 4/6A001480, prev 4/6A0013F0, desc: COMMIT 2022-09-23 14:57:28.560264 CST
rmgr: Transaction len (rec/tot):     34/    34, tx:       2970, lsn: 4/6A001548, prev 4/6A0014D8, desc: COMMIT 2022-09-23 15:10:40.205866 CST
rmgr: Transaction len (rec/tot):     34/    34, tx:       2971, lsn: 4/6A001628, prev 4/6A0015A0, desc: COMMIT 2022-09-23 15:10:42.318860 CST
......

3、指定事务xid

[kingbase@node101 sys_wal]$ /home/kingbase/cluster/R6HA/kha/kingbase/bin/sys_waldump 0000001F000000040000006A -x '2971'


rmgr: Heap        len (rec/tot):    132/   132, tx:       2971, lsn: 4/6A0015A0, prev 4/6A001570, desc: INSERT off 174 flags 0x00, blkref #0: rel 1663/32786/32886 blk 3
rmgr: Transaction len (rec/tot):     34/    34, tx:       2971, lsn: 4/6A001628, prev 4/6A0015A0, desc: COMMIT 2022-09-23 15:10:42.318860 CST

4、对当前的日志进行一个分析和汇总,这里面就包含每种数据类型所占的比例以及统计分析

[kingbase@node101 sys_wal]$ /home/kingbase/cluster/R6HA/kha/kingbase/bin/sys_waldump 0000001F000000040000006A 0000001F000000040000006B -z


Type                                           N      (%)          Record size      (%)             FPI size      (%)        Combined size      (%)
----                                           -      ---          -----------      ---             --------      ---        -------------      ---
XLOG                                          16 (  7.34)                 1270 (  7.29)                29040 (  6.35)                30310 (  6.38)
Transaction                                   14 (  6.42)                 2021 ( 11.60)                    0 (  0.00)                 2021 (  0.43)
Storage                                        3 (  1.38)                  126 (  0.72)                    0 (  0.00)                  126 (  0.03)
CLOG                                           0 (  0.00)                    0 (  0.00)                    0 (  0.00)                    0 (  0.00)
Database                                       0 (  0.00)                    0 (  0.00)                    0 (  0.00)                    0 (  0.00)
Tablespace                                     0 (  0.00)                    0 (  0.00)                    0 (  0.00)                    0 (  0.00)
TablespaceEnc                                  0 (  0.00)                    0 (  0.00)                    0 (  0.00)                    0 (  0.00)
......

四、总结
wal日志通过资源管理器RMGR对不同操作类型的日志进行管理,对于wal日志可以通过sys_waldump解析其内容,获取到事务处理的具体信息:如日志条目的lsn、事务操作执行语句、事务操作对象、xid、事务commit的时间等。
下面的篇章将对具体的事务(Transaction)操作进行分析。

posted @ 2022-10-08 09:12  KINGBASE研究院  阅读(251)  评论(0编辑  收藏  举报