文件系统特性 - COW事务

        理解 COW 事务,必须首先理解 COW 和事务这两个术语。

一、事务与COW

什么事务?

        事务(Transaction)是访问并可能更新数据库中各种数据项的一个程序执行单元(unit)。事务通常由高级数据库操纵语言或编程语言(如SQL,C++或Java)书写的用户程序的执行所引起,并用形如begin transaction和end transaction语句(或函数调用)来界定。事务由事务开始(begin transaction)和事务结束(end transaction)之间执行的全体操作组成。 

        事务作为恢复和并发控制的基本单位。事务具有一下四个特性: 原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。

   原子性(atomicity):一个事务是一个不可分割的工作单位,事务中包括的诸操作要么都做,要么都不做。

   一致性(consistency):事务必须是使数据库从一个一致性状态变到另一个一致性状态。一致性与原子性是密切相关的。

   隔离性(isolation):一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。

   持久性(durability):持续性也称永久性(permanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其有任何影响。

        这里所说的事务是通常提到的事务。

什么是 COW?

        所谓 COW,即每次写磁盘数据时,先将更新数据写入一个新的 block,当新数据写入成功之后,再更新相关的数据结构指向新 block 。


       COW 只能保证单一数据更新的原子性。但文件系统中很多操作需要更新多个不同的元数据,比如创建文件需要修改以下这些元数据:

  1. 修改 extent tree,分配一段磁盘空间
  2. 创建一个新的 inode,并插入 FS Tree 中
  3. 增加一个目录项,插入到 FS Tree 中

       任何一个步骤出错,文件便不能创建成功,因此可以定义为一个事务。

二、实例

        下面将演示一个 COW 事务。以btrfs为例:

        A 是 FS Tree 的根节点,新的 inode 的信息将被插入节点 C 。

        首先,btrfs 将 inode 插入一个新分配的 block C ’中,并修改上层节点 B,使其指向新的 block C ’;修改 B 也将引发 COW,以此类推,引发一个连锁反应,直到最顶层的 Root A 。当整个过程结束后,新节点 A ’变成了 FS Tree 的根。但此时事务并未结束,superblock 依然指向 A 。


图1. COW transaction 1 
COW transaction 1

       接下来,修改目录项(E 节点),同样引发这一过程,从而生成新的根节点 A ’’。


图 2. COW transaction 2 
COW transaction 2

此时,inode 和目录项都已经写入磁盘,可以认为事务已经结束。 btrfs 修改 superblock,使其指向 A ’’,如下图所示:


图 3. COW transaction 3 
COW transaction 3

       COW 事务能够保证文件系统的一致性,并且系统 Reboot 之后不需要执行 fsck 。因为 superblock 要么指向新的 A ’’,要么指向 A,无论哪个都是一致的数据。

三、参考文献

       IBM DeveloperWork: http://www.ibm.com/developerworks/cn/linux/l-cn-btrfs/index.html#ibm-pcon

posted on 2012-01-15 20:37  YoungerChina  阅读(1011)  评论(0编辑  收藏  举报

导航