新进化论

道生一,一生二,二生三,三生万物。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

VSS卷影拷贝服务其实不是一项新技术了,在2003年前后发布的Windows 2003和Windows XP SP1都提供了对VSS的支持。最近几年微软的一线产品对VSS支持的越来越多,包括Exchange,SQL,AD,DPM等等。在Windows 2008中甚至系统的自带的备份工具也换成了VSS版本的。查一查VSS的资料,发现名词不少,snapshot、writer、requestor等等。这几天翻阅了一些资料,仔细阅读了几遍,终于拨云见日,理清了头绪。

VSS解决的问题

任何一个新东西和新技术的出现总是为了解决现有的问题。在IT领域,很多的资源被放在对各个系统的备份和恢复上。为了99.9XXX%中那n个9,每多一个9都要付出巨大的代价。

在备份领域,传统的备份方案一般有全备份,增量备份和差量备份等。我觉得主要的问题有:

  • 增量和差量需要备份软件支持,备份程序需要对被备份的数据有足够了解,备份程序和应用程序协作保证数据的恢复完整一致性,工作量比较大。比如Exchange的数据库,Exchange自己要暴露出API接口,供NTBackup之类的应用程序调用。
  • 备份和恢复的时间漫长。每次做全备都需要若干小时。恢复差量和增量的数据的时候,要先恢复全备份再恢复增量、差量的数据。步骤冗长,容易出错。
  • 缺乏与硬件的紧密结合。很多存储的硬件都有snapshot的方案,但是这些硬件是做卷级别的镜像,和应用无关,做出来的东西也不能保证在应用级别是完整的。

VSS的出现,就是为了解决这些问题。

卷影的方法分类

  1. Clone (Full Copy/Split Mirror)全拷贝、镜像拷贝。可以通过软件或者硬件的方式做源卷和目标卷的同步。在同步连接切断之前2边的数据是一致的,在同步连接中断之后目标卷的数据和源数据保持独立,并且是只读的。
  2. Copy-on-Write (Differential Copy)差量拷贝。这种方法也可以用软件或者硬件的方法实现。当有写操作发生在需要被复制的卷时,被写的那个block会先被复制到另一个存放差量数据地方,同时这个操作会被索引和记录下来。使用源卷里数据和差量数据,这样在逻辑上我们就有一个在之前某个时间点的源卷。这种方法的好处是额外需要的存储空间小,缺点是
    • 对源卷有额外的读写操作。
    • 在做数据恢复的时候源卷的数据必须还在。

基于以上这2种最底层的卷影的方法,可以实现多种基于软件和硬件的备份应用和方案。微软的应用方案有:

  • Data Protection Manager(DPM)
  • Windows Backup Service(in Windows 2008)

VSS服务架构

vss

组件
描述

Volume Shadow Copy Service

核心服务,和各个其他组件交互。

Requestor

提出开始做卷影复制的程序,一般是备份程序。

Writer

首先他是应用程序的一部分,用以确保在做卷影复制的时候应用层面的数据是完整一致的。数据库级别的应用一般会有自己的Writer,比如Exchange,SQL,AD等。

Provider

创建和维护卷影复制的组件。可以是操作系统、硬件或者软件自己实现。

Source volume

含有需要被备份的数据卷。

Storage volume

为provider提供存放copy-on-write文件的数据卷

卷影复制的组件

Requestors: 发起卷影复制的程序,一般是备份程序。

Writers: 防止数据不一致,不完整。

  • 当备份的应用发起备份请求的时候,系统的VSS服务把这个消息通知给各个writer。Writer在收到这个消息之后,开始为备份做准备,以确保硬盘上的数据的一致性。比如Exchange的writer,会把内存的buff写回到硬盘里,确保硬盘上的数据库和log是完整的。
  • Writer也提供其他一些信息,比如应用的名字、图标、包含和排除的文件、恢复策略等等。
  • Writer和一个或者多个组件相关联。一个组件是一群文件的集合。比如,Exchange的文件集合包括数据库文件和日志文件等等。这些文件集合是一个整体,必须被同时备份和同时恢复。Writer也提供有关如何按组件恢复数据的信息。
  • 如果一个应用没有提供writer,那么只有硬盘上的数据被备份,而内存里面的cache等数据会丢失。这样恢复出来的数据类似于机器突然断电的状态,数据有可能会不一致。相对于非VSS的备份方法,VSS的好处是即使文件正在被打开也可以备份。传统的备份方法被打开的文件是无法再次被备份程序读打开的。
  • 在这种设计下,维护数据一致性的工作被从备份程序转移到了应用程序,而应用程序的开发人员对应用程序的数据更加了解,他们知道如何编写Writer来优化卷影复制。

Providers:用以创建和维护卷影复制。主要有三类实现:

  • 硬件实现
  • 软件实现
  • 操作系统实现。Windows 2003自带了一个基于软件的Provider。

卷影复制创建流程

vssflow

  1. Requestor,一般是备份程序,要求VSS枚举writers和他们的metadata,为卷影复制做准备工作。
  2. Writer创建一个XML的备份组件的描述,并定义他们如何被恢复。VSS通知应用程序的Writer为卷影复制做准备。
  3. Writer开始做准备,比如把内存中的内容写到数据库,把日志中的内容写到数据库等等。做完之后通知VSS。
  4. VSS发起commit。
  5. VSS把writer和requestor暂停写操作几秒种,以用来创建一个卷影复制。这个时间不能超过60秒。在此期间,VSS把文件系统在内存中的buff写到硬盘以确保硬盘中文件的一致性。
  6. VSS告诉requestor花最多10秒的时间来创建卷影复制。
  7. VSS解冻文件系统。当卷影复制创建好之后,VSS释放处于未激活状态的writer,所有在队列中的读写IO操作被完成。
  8. VSS确认在卷影复制被创建过程中的IO是成功的,如果失败的话意味着卷影复制是不一致的,VSS通知requestor并且删除卷影复制。Requestor可以选择重试或者通知管理员等操作。
  9. VSS开始复制卷影复制的数据,在复制完成之后把位置信息返回给Requestor。这一步才是耗时最长的备份数据的过程。

参考资料

How Volume Shadow Copy Service Works

Wikipedia:Shadow Copy

posted on 2013-07-12 16:33  岌岌可危  阅读(851)  评论(0编辑  收藏  举报