数据安全与数据备份存储技术
随着国内各行业信息系统的快速发展,特别是银行、证券、保险等行业大集中速度的加快,企业的技术风险也相对集中。一旦发生灾难,则将导致企业所有分支机构、营业网点和全部的业务处理停顿,或造成企业客户数据的丢失。如何防范技术风险,确保数据安全和业务连续性,已成为企业急需面对的课题。 2003年9月,中共中央办公厅、国务院办公厅转发了《国家信息化领导小组关于加强信息安全保障工作的意见》,明确提出要重点保障重要信息系统的安全,强调重要信息系统的建设要充分考虑灾难发生后的抗毁性与灾难恢复能力。
从以上可以看出,信息系统安全和数据灾难备份已经引起了国家、社会、企业的高度重视,数据灾难备份业务的发展是客户保持业务连续运作的需要,同时也是社会的需要和政策法规的要求,是市场发展的必然。一位银行人说,如果银行出现火灾,大家都不会去抱钱柜,而是抱着硬盘往外跑。因为几千万元的人民币烧了,可以重新印,但数据一旦丢失后果非常严重。此话并非调侃,没有人怀疑数据的价值,数据的安全之重要性也就顺理成章了。
数据的安全有两层意思,一个就逻辑上的安全,比如防止病毒的破坏、黑客入侵等等,另一个就是物理上的安全,比如人为的错误或不可抗拒的灾难。前者需要系统的安全防护,后者需要数据存储备份/容灾的保护。下面我们针对目前在数据存储备份/容灾方面采用的存储方式和技术进行介绍.
一:磁带存储
目前使用磁带存储设备解决企业数据备份保存问题依然是行之有效的方法。磁带设备既是存储备份设备的元老,又是存储备份设备最有生气的主力军,磁带这种最基本的存储单元,依然会在存储技术突飞猛进的今天,发挥着它巨大的作用。
通常在下列情况中,可以考虑采用磁带介质:
1、有充足的备份时间 磁带的一大缺点就是速度慢。如果你对备份时间不敏感,那就无所谓了。通过磁盘到磁带的备份方式十分稳定,充分发挥了磁带的优势。
2、不需要进行快速的文件/目录恢复工作,或者,可以通过别的手段来实现这一目标。 任何基于块存储的系统(通常磁带都采用这种存储方式)都不适合进行快速文件恢复。在有些情况下,的确不需要进行快速恢复。在其他情况下,可以采用实时快照或者镜像备份方式来实现快速恢复的目的。
3、需要进行离线的大块数据恢复工作 新一代的SDLT(超级线性数据磁带)可以在单个磁带上存储600G的压缩数据,同时,昆腾公司声称,他们研发的可以实现1.6TB存储容量的DLT-S4标准磁带马上就可以面向市场发布。这些因素都使得磁带的容量远远领先于其余的移动存储介质。
4、需要长时期、高质量的文档存储 越来越多的企业已经意识到,文档存储和备份存储是不一样的。尽管在备份存储领域,磁带的地位已经受到了强有力的挑战,但是,磁带存储仍然是最好的文档存储方案之一。通过正确的存储方式,磁带存储的文档至少可以保留20年。
5、需要进行高质量、可移动的文档存储 磁带具有高容量,易移动的特点。如果你打算采用可移动的数据存储进行灾难性数据恢复,那么自然要首选磁带介质。
6、需要低成本的解决方案
磁带是目前能够解决备份与灾难性数据恢复的最经济的解决方案之一。
目前磁带存储主要应用的技术有三种:LTO(Linear Tape-Open,开放线性磁带)、DLT(Digital Linear Tape,数码线性磁带)和AIT(Advanced Intelligent Tape,先进智能磁带)。这三种技术共同存于市场上已经一段时间了,它们的市场占有率有很大差别,推崇它们的厂商也都有自己完善的解决方案。对于用户的不同需求,这三种技术都有各自的优缺点,了解它们各自的性能特点,将会帮助用户选择到底自己适合使用哪种技术。
LTO:
LTO由IBM、惠普和希捷公司联合建立。LTO有两种格式——Ultrium和Accelis。前者的特点是高容量,后者的特长在于存取速度快。惠普主要研制Ultrium格式的产品,并相信它是未来产品的发展方向。Ultrium采用单轴1/2英寸磁带,非压缩存储容量100GB、传输速率最大20MB/s、压缩后容量可达200GB,而且具有增长的空间(关于IBM和希捷的LTO产品与昆腾SDLT产品的性能对比见后表)。Ultrium结合了线性多通道双向磁带格式的优点,基于服务系统、硬件数据压缩、优化的磁道面和高效率纠错技术,以提高磁带的能力和性能,广泛应用于高端服务器、大型数据库等领域。
LTO自称是开放磁带系统,LTO技术就其本质而言属于线性螺旋技术,它在各个方面均证明自己是当前该种类技术最好的一种应用方式。首先,它能够保证更多数量的并行信道。第一代的开放线性磁带技术可同时支持8条信道,而以后的版本将提供16条信道。与此相比较,多数的线性螺旋应用技术最多只能提供4条信道。
LTO技术的开发还利用了当今最为先进的伺服以及磁头技术,这些技术保证了高密磁轨的精确度。磁带的轨道数越多,覆盖相邻轨道数据的危险性就越大。LTO技术将磁轨通过伺服监视器进行编排,并对磁带上的磁头进行控制,从而能够确保精确度并避免发生覆盖现象。另外,LTO技术还可提供超过当前任何线性磁带技术性能的实密度(100MB/平方英寸)高能录制。这一高线性密度通过增强的逻辑格式予以支持,它包括对用户数据的多条数据轨道进行紧密跟踪录制,而这些用户数据又通过多轨道运行的纠错编码来加以保护,这一保护措施还可应付偶发性错误率突然上升的情况。
DLT:
DLT采用线性记录技术,其特点是大容量、高速度。DLT的发展是要解决较早的QIC(1/4英寸盒带)的问题。DLT也用来替换旧式的4mm和新的8mm磁带格式。在接受这些不同的磁带备份技术时,数据容量、速率和可靠性是关键的考虑因素。DLT把4mm或者8mm的速率提升了3到4倍,存储容量方面也增加了4倍。它的对手——螺旋扫描虽然能提供更高的密度,但又带来媒体老化时传动机构调整和数据完整性的问题。当系统频繁使用时,磁带媒体的性能和传动可靠性是至关重要的因素。任何对磁带系统结构的简化都可降低故障率。DLT利用直线盘形的记录原理,比较不容易出现磁头故障和磁带路径的调整偏差,因而得到推广。
DLT技术采用单轴1/2英寸磁带仓,以纵向曲线型记录法为基础。DLT产品主要应用于中、高端服务器市场与磁带库应用系统,市场占有率增长很快。DLT以纵向曲线型记录法在磁带上进行记录,具有大容量、高速度的特点。它也是少数使用单轴1/2英寸磁带仓的磁带机产品,主要应用于中、高端数据库存储和磁带库中。目前DLT磁带机的容量从10GB到80GB不等,非压缩存储数据传送速度为1.25MB/s至10MB/s(压缩后可使容量和存储速度提升约一倍)。未来DLT存储容量会达到160GB/320GB,在高速存储速率和容量方面,DLT占有优势。
AIT:
AIT是指先进智能磁带。AIT虽然属于存储技术的新军,但是由于具有螺旋扫描、金属蒸发带等先进技术,前景显得更加美好。AIT不仅在结构设计上相当突出,其磁带本身也相当特殊。在存储介质上,AIT的数据保护性能比较突出。不像其它平常金属物质的磁带, AIT所使用的AME(Advanced Metal Evaporated)磁带不含有非磁性粘着物质,可避免磁头阻塞或造成机器的污染。AIT 磁带机因为能提供档案较长的保存期限及读写头的使用周期,所以能让企业用户对他们存储的数据放心。
AIT的特点之一是MIC(Merry-In-Cassette)卡匣设计及磁带纪录方式。MIC是将 64Kb的快闪记忆芯片设计在磁带匣上,其可储存tape log,search map及用户自订的数据,所以不需读完全部的磁带即可找到档案。同时AIT纪录数据的方式是使用螺旋式的扫描方法,数据磁道是以一个角度写在8mm宽的磁带边缘。
AIT已经发展到目前的AIT-3,与DLT和LTO不同的是,后二者属于线性记录介质,而AIT是螺旋记录介质。线性记录格式发展时间长,进入中国市场也较早,市场占有率较高,不过采用螺旋记录格式的磁带机由于具有体积小巧、可靠性高、数据传输速度快、磁头和磁带寿命长等特点,近年来异军突起,迅速抢占了大量市场份额,逐步得到了用户的认可。在采用螺旋扫描技术的磁带机中,只有磁鼓是高速旋转的,其他部件(如磁带、伺服机构等)都是低速运转的。螺旋扫描系统控制磁带以一个较低的速度经过高速旋转的大尺寸磁鼓,磁鼓上的超金属磁头(HyperMetal)在磁带上形成密度很高的记录轨道。磁鼓的高速旋转会在磁带与磁鼓之间产生十分细小稳定的气流,可以保护磁带不受损伤。磁鼓相对于底座轻微的倾斜缩小了磁迹间距,使得高速的数据传输和高密度的记录成为简单的技术动作。这样的结构紧凑合理、易于设计和维护,在相同材料下,较低的磁带走速减少了由于张力过大带来的磁带寿命的减少,所以采用螺旋扫描的方式能使材料寿命延长。
虽然目前了解AIT的用户数量没有了解DLT和LTO的多,但是具有优势的技术总会得到更多的市场青睐。目前开发AIT技术的索尼公司和专注在AIT技术上开发产品的Spectra Logic公司都在大力的推广采用AIT的产品。越来越多的厂商参与到AIT这个阵营中,AIT领军磁带存储市场的明天指日可待。
根据上面介绍,我们建议,如果企业需要很高的扩展性,需要多家不同的厂商产品很好的兼容,LTO是首选;如果企业存储数据读写频繁,DLT由于利用直线盘形的记录原理,不容易出现磁头故障和磁带路径的调整偏差,所以是很好的选择;如果企业数据需要保存很长时间,并且需要快速搜索数据,AIT是不二之选。
二:网络存储技术
网络存储技术是基于数据存储的一种通用网络术语。网络存储结构大致分为三种:直连式存储(DAS:Direct Attached Storage)、网络存储设备(NAS:Network Attached Storage)和存储网络(SAN:Storage Area Network)。
直连式存储(DAS):
这是一种直接与主机系统相连接的存储设备,如作为服务器的计算机内部硬件驱动。到目前为止,DAS 仍是计算机系统中最常用的数据存储方法。DAS已经有近四十年的使用历史,随着用户数据的不断增长,尤其是数百GB以上时,其在备份、恢复、扩展、灾备等方面的问题变得日益困扰系统管理员。
直连式存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。 直连式存储与服务器主机之间的连接通道通常采用SCSI连接,带宽为10MB/s、20MB/s、40MB/s、80MB/s等,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。 无论直连式存储还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的群集(Cluster),或存储阵列容量的扩展,都会造成业务系统的停机,从而给企业带来经济损失,对于银行、电信、传媒等行业7×24小时服务的关键业务系统,这是不可接受的。并且直连式存储或服务器主机的升级扩展,只能由原设备厂商提供,往往受原设备厂商限制。
网络存储设备(NAS):
NAS 是一种采用直接与网络介质相连的特殊设备实现数据存储的机制。由于这些设备都分配有 IP 地址,所以客户机通过充当数据网关的服务器可以对其进行存取访问,甚至在某些情况下,不需要任何中间介质客户机也可以直接访问这些设备。
NAS采用网络(TCP/IP、ATM、FDDI)技术,通过网络交换机连接存储系统和服务器主机,建立专用于数据存储的存储私网。随着IP网络技术的发展,网络接入存储(NAS)技术发生质的飞跃。早期80年代末到90年代初的10Mbps带宽,网络接入存储作为文件服务器存储,性能受带宽影响;后来快速以太网(100Mbps)、VLAN虚网、Trunk(Ethernet Channel) 以太网通道的出现,网络接入存储的读写性能得到改善;1998年千兆以太网(1000Mbps)的出现和投入商用,为网络接入存储(NAS)带来质的变化和市场广泛认可。由于网络接入存储采用TCP/IP网络进行数据交换,TCP/IP是IT业界的标准协议,不同厂商的产品(服务器、交换机、NAS存储)只要满足协议标准就能够实现互连互通,无兼容性的要求;并且2002年万兆以太网(10000Mbps)的出现和投入商用,存储网络带宽将大大提高NAS存储的性能。NAS需求旺盛已经成为事实。首先NAS几乎继承了磁盘列阵的所有优点,可以将设备通过标准的网络拓扑结构连接,摆脱了服务器和异构化构架的桎梏。
在企业数据量飞速膨胀中,SAN、大型磁带库、磁盘柜等产品虽然都是很好的存储解决方案,但他们那高贵的身份和复杂的操作是资金和技术实力有限的中小企业无论如何也不能接受的。NAS正是满足这种需求的产品,在解决足够的存储和扩展空间的同时,还提供极高的性价比。因此,无论是从适用性还是TCO的角度来说,NAS自然成为多数企业,尤其是大中小企业的最佳选择。
存储网络(SAN):
SAN 是指存储设备相互连接且与一台服务器或一个服务器群相连的网络。其中的服务器用作 SAN 的接入点。在有些配置中,SAN 也与网络相连。SAN 中将特殊交换机当作连接设备。它们看起来很像常规的以太网络交换机,是 SAN 中的连通点。SAN 使得在各自网络上实现相互通信成为可能,同时并带来了很多有利条件。
SAN采用光纤通道(Fibre Channel)技术,通过光纤通道交换机连接存储阵列和服务器主机,建立专用于数据存储的区域网络。SAN经过十多年历史的发展,已经相当成熟,成为业界的事实标准(但各个厂商的光纤交换技术不完全相同,其服务器和SAN存储有兼容性的要求)。SAN存储采用的带宽从100MB/s、200MB/s,发展到目前的1Gbps、2Gbps。面对迅速增长的数据存储需求,大型企业和服务提供商开始选择SAN作为网络基础设施。
SAN网络具有出色的可扩展性,理论上最多可以连接1600万个设备。事实上,SAN比传统的存储架构具有更多优势。传统的服务器连接存储通常难于更新或集中管理。每台服务器必须关闭才能增加和配置新的存储。相比较而言,SAN不必宕机或中断与服务器的连接即可增加存储。SAN 还可以集中管理数据,从而降低总体拥有成本。利用光纤通道技术,SAN可以有效地传输数据块。通过支持在存储和服务器之间传输海量数据块,SAN提供了数据备份的有效方式。因此,传统上用于数据备份的网络带宽可以节约下来,用于其他应用。 开放的、标准化的光纤通道技术使得SAN非常灵活。SAN克服了传统上与SCSI相连的线缆限制,极大地拓展了服务器和存储之间的距离,从而增加了更多连接的可能性。改进的扩展性还简化了服务器的部署和升级,保护了原有硬件设备的投资。
SAN与NAS的不同:
1,NAS和SAN最本质的不同就是文件管理系统的位置。如图:
由图可以看出,SAN结构中,文件管理系统(FS)还是分别在每一个应用服务器上;而NAS则是每个应用服务器通过网络共享协议(如:NFS、CIFS)使用同一个文件管理系统。换句话说:NAS和SAN存储系统的区别是NAS有自己的文件系统管理。
2,NAS用户通过TCP/IP协议访问数据,采用业界标准文件共享协议如:NFS、HTTP、CIFS实现共享; SAN用户通过专用光纤通道交换机访问数据,采用SCSI、FC-AL接口。
3,SAN对于那些需要为广泛分布的用户提供快速数据存取,并且在自己的存储基础设施中得到长期投资的公司,则更具吸引力。NAS通常在一个LAN(一般为Ethernet网络)上占有自己的节点。在这种配置中,一台服务器处理网络上的所有数据,将负载由应用或企业服务器上卸载下来。通过将存储与不同服务器相分离,它使数据可供网络上所有用户使用。NAS 基本上是一种使用经过考验的Ethernet和SCSI技术的即插即用的存储技术。相反,SAN是一种将存储硬盘或磁带与相关服务器连接起来的高速专用子网。尽管这些部件可以通过其他包括SCSI或IBM的Escon光纤在内的协议连接在一起,但它们与刚刚出现的高速(133M到4.25Gb/s)、远程光纤通道协议密不可分。 SAN技术在设计上支持磁盘镜像、备份与恢复、存档与检索、 存储设备之间的数据转移以及服务器中的存储数据的共享。SAN还可以被配置为包括子网,如包括NAS系统。
4,SAN功能强大,但难于部署且费用高昂。NAS费用相对低廉且易于部署,但功能有限。
5,NAS技术尤其在跨平台应用中的使用性和可靠性上“领先”于SAN技术。不过,SAN可以向一个存储网络的任意空闲空间上分配数据。
综合比较可以看出,NAS是将目光集中在应用、用户和文件以及它们共享的数据上。SAN是将目光集中在磁盘、磁带以及联接它们的可靠的基础结构。将来从桌面系统到数据集中管理到存储设备的全面解决方案将是NAS加SAN。三:第三方数据灾难备份
我们上面所说的这些准备工作都是针对自己实施数据容灾而言的,我们还可以通过第三方的服务来完成数据灾备工作。特别是针对数据灾备而言,选择第三方服务已经成为数据容灾领域的一个非常重要的发展趋势。
出现这样的发展趋势和市场需求有很大的关系。在类似我国这样信息化应用不太发达的国家,数据容灾是否具有必要性一直是数据存储行业争论的焦点。有很多人认为除了一些顶端的行业有数据灾备的需要之外,其它行业的企业还没有足够的推动力来实施数据容灾。
以我国的金融行业为例,数据灾备的建设在若干年前就已经开始了,因为一旦金融数据发生问题,整个国民经济都会遭受打击。其实放眼全球也是如此,即使在发达国家超过半数的数据灾备业务也是集中于金融领域。问题仍旧集中于一些次级行业以及规模较小的企业,这些企业是否需要数据容灾?他们对于数据容灾的认识和行动力是我国数据容灾行业与信息发达国家的主要差距。
外包数据灾备业务为国内企业广泛实施提供了一条切实可行的道路。目前CA、EMC、IBM、惠普、赛门铁克等知名IT厂商已经开始在国内提供数据灾备服务,这些厂商所拥有的技术能力和服务经验可以极大的降低实施数据灾备的技术风险和成本投入。 一些银行也能够为企业提供存储数据的服务,相对于自己实施数据灾备来说,第三方的数据灾备服务可以以更少的投入获得更高的效率,这对很多确实有数据容灾需求甚至正在观望的用户都是极具吸引力的。
不可否认,在我国实施外包数据灾备也有很多障碍,主要问题来自于意识和制度。大量用户对于将信息服务外包都表示担忧,担心自己的数据发生外泄以及影响服务商的经营延续性。这其中最重要的问题还在于用户意识的转变。
在制度方面,由于国内的信息产业起步较晚,很多必要的法规还没有形成,所以对于信息事务外包的保障还没有达到足够的程度。现状既已如此,不会在朝夕之间得到改变,但是我们已经看到了很多相关的努力,国家相关部门也在加紧制订和出台这方面的法规。
尽管目前数据灾备外包还面临着一些问题,但这类服务的发展却是大势所趋,在国外大部分的数据灾备都是由第三方服务商完成的。
最后值得一提的是,无论是自己实施数据灾备还是委托第三方进行数据灾备服务,数据灾备计划的执行和后续工作都是非常重要的,就像进行灾备之前都要进行准备工作一样。即使将数据灾备业务外包出去也不代表企业人员就摆脱了所有的责任,其实在外包方式下企业需要进行的沟通协调工作并不少于自己建设数据容灾设施。