openGauss源码解析(39)

openGauss源码解析:存储引擎源码解析(7)

2. 中量级堆页面和索引页面清理

openGauss提供VACUUM语句来让用户主动执行对某个astore表(或某个库中所有的astore表)及其上的索引进行中量级清理。中量级清理过程中,不阻塞相关表的查询和DML操作。由于在astore表中,新、老版本元组是混合存储的,因此,与顺带执行的轻量级清理相比,astore表的中量级清理需要进行全表顺序(或索引)扫描,才能识别出所有待清理的老版本元组。对于扫描出来的确认要清理的元组,会首先清理索引中的元组,然后再清理堆表中的元组,从而可以避免出现索引空指针的问题。

中量级清理的对外接口是lazy_vacuum_rel函数,内部逐层调用lazy_scan_rel、lazy_scan_heap和heap_page_prune(同轻量级清理)来扫描和暂存几类待清理的元组。当待清理的元组积攒到一定数量之后(受maintenance_work_mem内存上限控制),先后调用lazy_vacuum_index接口和lazy_vacuum_heap接口来分别清理索引文件和堆表文件。其中,与堆表页面将元组指针置为UNUSED不同,索引页面直接删除被清理的元组指针,并进行页面重整。

中量级清理的关键数据结构是LVRelStats结构体,定义代码如下:

typedef struct LVRelStats {

bool hasindex; /* 表上是否有索引 */

/* 统计信息 */

BlockNumber old_rel_pages; /* 之前的页面个数统计 */

BlockNumber rel_pages; /* 当前的页面个数统计 */

BlockNumber scanned_pages; /* 已经扫描的页面个数 */

double scanned_tuples; /* 已经扫描的元组个数 */

double old_rel_tuples; /* 之前的元组个数统计 */

double new_rel_tuples; /* 当前的元组个数统计 */

BlockNumber pages_removed;

double tuples_deleted;

BlockNumber nonempty_pages; /* 最后一个非空页面的页面号加1 */

/* 待清理的元组的行号信息(已排序) */

int num_dead_tuples; /* 当前待清理的元组个数 */

int max_dead_tuples; /* 单次最多可记录的待清理元组个数 */

ItemPointer dead_tuples; /* 待清理元组行号数组 */

int num_index_scans;

TransactionId latestRemovedXid;

bool lock_waiter_detected;

BlockNumber* new_idx_pages;

double* new_idx_tuples;

bool* idx_estimated;

Oid currVacuumPartOid;

} LVRelStats;

其中hasindex表示该表是否有索引表,num_dead_tuples表示目前已经积攒的要清理的元组,dead_tuples是保存这些元组位置的TID数组,max_dead_tuples是根据maintenance_work_mem计算出来的单次允许积攒的最大待清理元组个数。

需要指出的是,如果在元组更新时就把老版本元组集中存储,那么清理时就无须全表扫描,只需要清理集中存储的老版本元组页面即可,这样可以有效降低清理过程带来的I/O开销,使得整体存储引擎的I/O开销和性能更平稳,这也是后续openGauss版本将支持的ustore行存储格式的设计出发点。

3. 重量级堆页面和索引页面清理

无论是轻量级清理,或是中量级清理,都只能局部清理astore页面中的死亡元组,无法真正实现对这些空闲空间的释放(被清理出的空间,仍然只能被该表使用)。因此,openGauss还提供了VACUUM FULL语句来让用户主动执行对某个astore表(或某个库中所有astore表)及其上的索引进行重量级清理。重量级清理将一个表中所有仍未死亡(但是可能已经被删除)的元组重新紧密插入到新的堆表文件中并在此基础上重新创建所有索引,从而实现对空闲空间的彻底回收。在重量级清理的主体流程中只允许用户执行只读查询操作,在重量级清理的提交流程中只读查询操作也会被阻塞。

为了尽可能提高重新创建的索引性能,如果用户堆表上有索引,那么上述全表扫描会采用索引扫描。

重量级清理的对外接口是cluster_rel函数,内部逐层调用rebuild_relation、copy_heap_data、tableam_relation_copy_for_cluster、heapam_relation_copy_for_cluster、copy_heap_data_internal、reform_and_rewrite_tuple、rewrite_heap_tuple。其中,“rewrite_heap_tuple”接口将每一条扫描的未死亡元组进行重构(去除被删除的字段)之后,插入到新的紧密排列的堆表中。在这个过程中,对原来多个元组之间的更新链关系采用两个哈希表来进行暂存。当一对更新元组的双方都扫描到之后,就进行新表的填充,并将更新后元组的新的TID(transaction ID,事务ID)保存到更新前的元组中。上述机制保证重量级清理过程中并发更新事务的执行机制不会受到破坏。

重量级清理的关键数据结构是RewriteStateData结构体,其定义代码如下:

typedef struct RewriteStateData {

Relation rs_old_rel; /* 源表 */

Relation rs_new_rel; /* 整理后的目标表 */

Page rs_buffer; /* 当前整理的源表页面 */

BlockNumber rs_blockno; /* 当前写入的目标表页面号 */

bool rs_buffer_valid; /* 当前缓冲区是否有效 */

bool rs_use_wal; /* 整理操作是否产生日志 */

TransactionId rs_oldest_xmin; /* 用于可见性判断的最老活跃事务号 */

TransactionId rs_freeze_xid; /* 用于元组冻结判断的事务号 */

MemoryContext rs_cxt; /* 哈希表内存上下文 */

HTAB *rs_unresolved_tups; /* 未匹配的更新前元组版本 */

HTAB *rs_old_new_tid_map; /* 未匹配的更新后元组版本 */

/* 元组压缩相关信息 */

PageCompress *rs_compressor;

Page rs_cmprBuffer;

HeapTuple *rs_tupBuf;

Size rs_size;

int rs_nTups;

bool rs_doCmprFlag;

/* 异步-同步读写相关 */

char *rs_buffers_queue; /* adio write queue */

char *rs_buffers_queue_ptr; /* adio write queue ptr */

BufferDesc *rs_buffers_handler; /* adio write buffer handler */

BufferDesc *rs_buffers_handler_ptr; /* adio write buffer handler ptr */

int rs_block_start; /* adio write start block id */

int rs_block_count; /* adio write block count */

} RewriteStateData;

其中,rs_old_rel是被清理的表,rs_new_rel是清理之后的表,rs_oldest_xmin是判断元组是否死亡的xid阈值,rs_freeze_xid是判断是否进行freeze操作的xid阈值。rs_unresolved_tups是保存一对更新元组中老元组的哈希表,rs_old_new_tid_map是保存一对更新元组中新元组的哈希表,这两个成员共同保证更新链信息不被丢失(在原表中更新后的元组的物理位置可能比更新前的元组的物理位置还要小)。

最后,重量级操作实际上是一种数据重聚簇操作,对于其他行存储子格式和cstore列存储格式同样适用,只是具体实现机制略有不同。

posted @ 2024-04-29 15:54  openGauss-bot  阅读(7)  评论(0编辑  收藏  举报