数据库·日志系统原理(恢复系统)

ref：https://blog.csdn.net/whyangwanfu/article/details/1926367

Q：db-pointer(指向数据库的当前副本) 写入磁盘的时候，如果只写入部分字节后发生断电，则db-pointer不可恢复，怎么办？
A：磁盘系统提供了对块更新的原子性，或至少是支持磁盘扇区更新的原子性。换句话说，只要保证db-pointer存储于一个扇区，磁盘系统将保证db-pointer更新的原子性，我们可以将db-pointer存储于磁盘头来实现。

——《Database System Concepts》

事务的原语操作

在事务系统的运行当中，有三个地址空间供元素存储：

磁盘空间
缓冲区
事务的局部地址空间。

一个简单的读、修改X元素操作的流程如：事务到缓冲中读取元素X，如果命中，则读取事务局部地址空间并返回，如果未命中，则先将相关页从磁盘读入缓冲区。事务在它的局部地址空间中修改元素X，然后写入缓冲区，再从缓冲区写入磁盘。当然缓冲区的数据也可能不是立即拷贝入磁盘的，这取决于具体的缓冲区管理策略。
为了便于描述，我们描述了4个操作原语：

INPUT（X）：将包含数据库元素X的磁盘块拷贝到内存缓冲区
READ（X,t）：将数据库元素X拷贝到事务的局部变量t。更准确地说，如果包含数据库元素X的块不在内存缓冲区中，则首先执行INPUT（X）。接着将X的值赋给局部变量t。
WRITE（X,t）：将局部变量t的值拷贝到内存缓冲区中的数据库元素X。更准确地说，如果包含数据库元素X的块不在内存缓冲区中，则首先执行INPUT（X）。将着将t的值拷贝到缓冲区中的X。
OUTPUT（X）：将包含X的缓冲区拷贝到回磁盘。

日志记录

<Ti start>
<Ti, Xj, V1, V2>
<Ti commit>
<Ti abort>

日志必须放在稳定存储器上(99.999%不会丢失)

延迟的数据库修改redo

日志仅需记录数据项的新值
所有日志(包含commit)写到稳定缓存器后，再执行真正的更新write操作，缩短日志记录的时间
恢复时redo同时包含 <Ti start> 与 <Ti commit> 的事务

立即的数据库修改undo + redo

允许在事务仍处于活跃时，就输出到数据库
日志需记录数据项的原始值与新值
Ti执行任何write操作前，先写日志
与数据项B相关的日志写到稳定缓存器后，才执行output(B)操作
恢复时同时采用redo与undo机制
1.redo同时包含 <Ti start> 与 <Ti commit> 的事务（可能已提交事务尚未执行output操作）
2.undo只包含 <Ti start> 的事务

缓冲区管理

日志缓冲

遵循先写日志规则。
日志只允许以附加的方式写入数据。日志块最初在主存中创建，像数据块一样也由缓冲区管理，在确当的时刻，日志块会从缓冲区写入到磁盘。

数据库缓冲

虚拟内存换页的时候，会(由操作系统)输出块B1，在B1输出前，应当先输出与块B1相关的日志记录到稳定存储器

操作系统在缓冲区管理的作用

方法一：数据库保留部分主存为缓冲区，对其管理，而不是让操作系统管理（然而几乎所有操作系统都完全控制主存区）
方法二：在操作系统的虚拟内存中实现缓冲区，会导致输出两次，一是在操作系统换页时，一是在数据库系统进行

检查点

静态检查点

停止接受新的事务
等待所有当前的活动事务提交或终止，并且在日志文件中写COMMIT或ABORT记录。
将日志刷新到磁盘
写入日志记录<CKRT>，并再次刷新记录。
重新开始接受新事务。
当恢复时，扫描到<CKRT>日志时，就不需要继续扫描日志记录了。

动态检查点

静态检查点的缺点在与，可能需要很长时间等待活跃事务的完成，在用户系统看来似乎是静止了。非静态检查克服了该缺点，在做检查点时允许新事务进入。步骤如下：
1）写入日志记录<START CKPT(T1,……,Tk)>.其中T1,……,Tk为活跃事务。
2）等待T1,……,Tk每一个事务提交或终止，但允许其它事务开始。
3）当T1,……,Tk都已完成时，写入日志记录<END CKPT>并刷新日志。

当系统发生故障时，从日志尾部开始扫描日志。根据扫描过程中先遇到<END CKPT>记录还是<START CKPT(T1,……,Tk)>记录，有两种情况。

1）如果先遇到<END CKPT>记录。所有未完成的事务在<START CKPT(T1,……,Tk)>记录后开始，只要扫描到<START CKPT(T1,……,Tk)>就不需要继续扫描了。<START CKPT(T1,……,Tk)>前的记录是可以截断的。

2）如果先遇到<START CKPT(T1,……,Tk)>，那么崩溃发生在检查点过程中。未完成事务只可能是到达<START CKPT(T1,……,Tk)>前遇到的那些，以及T1,……,Tk在崩溃前未完成的那些。因此只要继续扫描到未完成事务中最早的那个事务的开始就行了。
一个通常的规律是，一旦<END CKPT>记录到了磁盘，我们就可以将上一个<START CKPT>记录前的日志删除了。

对比

都是先output日志再output数据库元素
undo：每write一条日志，write一次数据项更新，日志记录旧值，
redo：write完所有日志，再延迟更新write数据项，日志记录新值

posted @ 2019-11-07 00:52 我在地狱阅读(940) 评论(0) 编辑收藏举报

刷新页面返回顶部

Dirge

诸神对凡人心生艳羡厌倦天堂

数据库·日志系统原理(恢复系统)

事务的原语操作

延迟的数据库修改redo

立即的数据库修改undo + redo

缓冲区管理

日志缓冲

数据库缓冲

操作系统在缓冲区管理的作用

检查点

静态检查点

动态检查点

对比

公告

Dirge

诸神对凡人心生艳羡 厌倦天堂

数据库·日志系统原理(恢复系统)

事务的原语操作

延迟的数据库修改redo

立即的数据库修改undo + redo

缓冲区管理

日志缓冲

数据库缓冲

操作系统在缓冲区管理的作用

检查点

静态检查点

动态检查点

对比

公告

诸神对凡人心生艳羡厌倦天堂