读数据保护:工作负载的可恢复性11传统数据源中的数据
1. 传统数据源中的数据
1.1. 需要备份的数据分散在各种地方
-
1.1.1. 有些数据源是大家都能意识到的
- 1.1.1.1. 即便在大家都能想到的这些数据源里,仍然会有一些容易忽视的问题
-
1.1.2. 有一些不那么明显
2. 实体服务器
2.1. 以前,我们把实体服务器直接叫作服务器,不会专门强调“实体”(physical)二字,因为这是默认的
2.2. 现在要是再说起这种服务器,那就必须特意指出,这个服务器是用一台真实的计算机打造的
2.3. 实体服务器也有可能由大型机(mainframe)或小型机(minicomputer)来充当
- 2.3.1. 大型机与小型机都没有消亡
2.4. 标准备份
-
2.4.1. 把这个服务器提供服务所需的数据备份下来,以便在必要时恢复
-
2.4.2. 开源的备份工具
-
2.4.2.1. BackupPC
-
2.4.2.2. Bacula
-
2.4.2.3. Amanda
-
2.5. 裸机备份
-
2.5.1. 重点在于以后如何恢复实体服务器本身
-
2.5.2. 如果服务器本身出现了故障,那你必须先更换硬件、重装操作系统并重新配置该系统,然后才能恢复数据,这要比仅恢复数据复杂得多
-
2.5.3. 最大的难点在于,如何从服务器的启动盘里收集并存储启动计算机所需的信息
-
2.5.4. 有效的裸机恢复流程
-
2.5.4.1. 首先要更换硬件
-
2.5.4.2. 然后进入相关环节,以恢复底层的操作系统
-
2.5.4.3. 接着可能还会单独安排另一个恢复流程,以恢复应用程序及其数据
-
2.5.4.4. 最后重启服务器
-
-
2.5.5. 虚拟机技术出现之后,我们就很少在实体服务器上做裸机恢复了,而且裸机恢复也有了它自己的地位,并不需要像以前那样跟裸机备份合起来讨论
2.6. 备份NAS
-
2.6.1. NAS filer是一种特制的实体服务器,很多数据中心里都有这种服务器,你在备份并恢复这些服务器时,通常需要专门做一些处理
-
2.6.2. 使用proxy
-
2.6.2.1. NAS服务器分享文件时所用的协议主要有两种,也就是NFS与SMB
2.6.2.1.1. 前者适用于UNIX/Linux操作系统
2.6.2.1.2. 后者适用于Windows操作系统
-
2.6.2.2. 优点在于,这些文件对备份系统来说跟其他文件差不多,因此无论它们位于何处,备份系统都能予以恢复
-
2.6.2.3. 缺点在于,filer无法区分备份流量与用户流量,由于它不知道访问者究竟是备份程序,还是普通的用户,因此无法调整这两种请求之间的次序,让普通用户优先得到服务
-
-
2.6.3. 通过NDMP(Network Data Management Protocol,网络数据管理协议)备份
-
2.6.3.1. 由NAS行业提出的一种专门用来备份NAS filer的协议
-
2.6.3.2. 最大缺点在于,每个filer厂商都有可能按它们自己的格式来备份,那些格式互不相同
-
-
2.6.4. 做快照并将其复制到其他的NAS filer上
-
2.6.4.1. 使用设备厂商所提供的快照系统建立快照,并将其复制到另一个filer上
-
2.6.4.2. filer厂商都很喜欢你采用这种方式来备份,这意味着你要再买一台这个品牌的filer
-
2.6.4.3. 对原始数据的快照做复制,并采用这个复制出来的快照做恢复,其速度几乎总是要比其他方式更快
-
-
2.6.5. NAS filer也可以作为块设备连接到其他服务器
3. 虚拟服务器
3.1. 虚拟服务器是以虚拟机(Virtual Machine, VM)的形式出现的服务器
3.2. 虚拟机是一种专门模拟实体机(physical machine,也就是物理机或真机)的东西
3.3. 必须给实体机的操作系统安装一种叫作虚拟机管理器(hypervisor)的软件
-
3.3.1. 虚拟机管理器软件是运行在宿主机(host machine,也就是承载这些虚拟机的那台实体机)的操作系统上的一个软件,它能够将宿主机当成许多个虚拟的机器使用,让每个虚拟机都能安装各自的操作系统
-
3.3.2. 实体机叫作宿主计算机(host computer)、宿主节点(host node)、虚拟机管理器节点(hypervisor node)等
-
3.3.3. vSphere
-
3.3.4. Hyper-V
-
3.3.5. KVM
-
3.3.6. Xen
-
3.3.7. AHV(Acropolis HyperVisor)
3.4. 备份服务器或虚拟机需要花费一定的时间,虚拟机越大,花的时间就越长
3.5. 把虚拟机当成实体机来备份
-
3.5.1. 虚拟机技术刚诞生的时候,还没有出现后面要讲的那种虚拟机管理器层面的备份手法,因此我们当时只能将它当作实体机来备份
-
3.5.2. 把虚拟机当成实体机来备份,最严重的问题就在于备份过程中需要执行大量的I/O操作
3.6. Windows操作系统的VSS
-
3.6.1. 是Windows系统的一种特殊快照机制,让备份软件能够以application-consistent方式备份文件系统或运行在Windows中的应用程序
-
3.6.2. crash-consistent(“崩溃一致的”)方式
- 3.6.2.1. 把这些正在发生变化的东西在某一个时间点(例如系统即将崩溃的那一刻)所处的状态备份下来,这就相当于你把服务器的电源关了,并且设法对该服务器在关机的那一刻所处的状态予以备份
-
3.6.3. application-consistent(“应用程序一致的”)方式
-
3.6.3.1. 它总是能够保证应用程序可以从这样的备份里恢复
-
3.6.3.2. 对于应用程序来说,采用这种方式备份会更好一些
-
-
3.6.4. 在执行备份之前先给需要备份的这个应用程序制作快照
-
3.6.5. 等到所有的VSS Writer都把各自的快照做好之后,备份软件就开始使用这些快照制作备份
-
3.6.6. 做完备份就把日志截断,这是相当常见的操作,备份软件可以先向VSS提出备份请求,然后根据获取到的快照执行备份,最后再给VSS提一个请求,让它把事务日志截断
3.7. 采用专门的手法来备份虚拟机
-
3.7.1. VADP
-
3.7.1.1. vSphere Storage API for Data Protection(VADP),所有版本的VMware都支持这套API,这包括企业内部的vSphere以及云端的VMware Cloud,后者能够运行在许多云平台中
-
3.7.1.2. vSphere可以说是一款能够运行在Linux之类的操作系统里的特殊应用程序
3.7.1.2.1. 特殊之处在于,这种应用程序的用途是把宿主机当成多个虚拟机来使用,并管理这些虚拟机
-
-
3.7.2. Linux系统没有跟VSS相似的机制
- 3.7.2.1. 如果你要备份的VMware虚拟机运行的是Linux系统,那么备份软件依然可以先跟VADP对接,但是接下来,VADP无法与一个类似于VSS的机制对接
-
3.7.3. Hyper-V与VSS
-
3.7.3.1. Hyper-V则可以说是一款能够运行在Windows操作系统里的特殊应用程序
-
3.7.3.2. 它是运行在Windows系统里的,因此这意味着它可以使用该系统的VSS机制,具体来说,它有一个专为使用该机制而设的VSS Writer
-
-
3.7.4. 基于快照的备份
-
3.7.5. HCI
-
3.7.5.1. 在HCI(Hyper-Converged Infrastructure,超融合基础架构)系统里运行的,这是一种专门为运行虚拟机管理器而设计的特殊硬件,它能够与存储设备相集成
-
3.7.5.2. 各种HCI系统所提供的备份工具在制作备份的办法上可能有所区别,但最为常见的一种办法依然是通过快照制作备份
-
3.7.5.3. HCI系统把运算、网络与存储等单元都封装到了一起,而且通常还会把基于快照的数据保护机制也包含进来
-
3.7.5.4. 采用支持这种虚拟机管理器的备份软件来制作备份
-
3.7.5.5. 采用HCI产品所内置的数据保护功能来制作备份
-
-
3.7.6. 融合基础架构(Converged Infrastructure, CI)也是专门为运行虚拟机管理器而设计的系统,然而这种系统通常比较大,它所融合的产品是分别由多家厂商生产的,而不像超融合基础架构(HCI)那样,只采用来自同一个厂商的产品
- 3.7.6.1. 使用的通常都是标准的虚拟机管理器,而且搭配的也是标准的数据保护工具,因此没有什么特殊的备份方式需要专门讲解
4. 台式机与笔记本计算机
4.1. 只用来充当缓存的笔记本计算机
-
4.1.1. Chromebook就是典型的例子,这只是一个用来访问Google Workspace的工具而已
-
4.1.2. 如果你的笔记本计算机也像这样,根本不保存任何数据(注意,是“根本不保存任何数据”),不会建议你去备份它
4.2. 普通台式机与笔记本计算机
-
4.2.1. 备份笔记本计算机,还可以让计算机的升级过程更加顺畅
- 4.2.1.1. 如果给计算机做了备份,那么这些操作就不用重新执行一遍了,所以这一优势尤其明显
4.3. 备份方式
-
4.3.1. 用移动硬盘备份
-
4.3.1.1. 除了那种根本不做备份的办法之外,这是最差的一种办法
-
4.3.1.2. 违背了3-2-1原则,因为存放备份的这个移动硬盘,通常就在你要备份的那个计算机旁边,而该原则要求你至少将其中一个备份放在别处
-
4.3.1.3. 大多数故障其实都发生在移动硬盘上
-
4.3.1.4. 这种设备动不动就会坏掉,所以用它们备份是很不可靠的
-
4.3.1.5. 会将成千上万条企业数据的副本,都以未加密的形式保存在这块移动硬盘里
-
4.3.1.6. 绝对不要用移动硬盘备份企业数据
-
-
4.3.2. 做文件级的增量备份
- 4.3.2.1. 传统的备份软件是在文件层面备份数据的,这对于局域网中的台式机或许可行,但并不适用于笔记本计算机
-
4.3.3. 通过文件同步与分享工具备份
-
4.3.3.1. 用文件同步与分享工具做备份,还有一个坏处在于IT人员无法集中控制备份操作,也没有办法监控备份进度,因而无法确保备份机制是否还在正常运作
-
4.3.3.2. 同步与分享工具唯一的可取之处在于,它们是某个你已经使用了的产品所提供的附加功能
-
-
4.3.4. 采用结合了源端去重技术的备份系统或服务来做备份
-
4.3.4.1. 只有这个办法,才能够真正给台式机与笔记本计算机做备份
-
4.3.4.2. 源端去重能够尽量缩减备份时需要传输的数据量,因此对终端设备的性能几乎没有太大的影响
-
4.3.4.3. 备份时只会对终端用户造成很小的影响,甚至根本不会影响终端用户
-
4.3.4.4. 可以利用源端去重技术缩减传输备份所需的带宽
-
4.3.4.5. 能够做端到端的加密
-
4.3.4.6. 能够保护设备免受勒索攻击
-
5. 移动设备
5.1. 如果该设备只充当云平台的缓存,那就无须备份
5.2. 如果你要在这种设备上创建并存储对公司有用的数据,那就应该备份
5.3. 把数据同步到云平台
- 5.3.1. 确保用户只使用那种能够将数据同步到云平台的应用程序(这个云平台由设备厂商提供)
5.4. 把数据同步到实体机再备份
5.5. 在移动设备上备份
5.6. 移动设备管理
-
5.6.1. 移动设备管理(Mobile Device Management, MDM)
-
5.6.2. 把一款特制的应用程序安装在这种设备上,让这个应用程序持有与本组织相关的所有数据,并要求员工必须把他们为本组织创建的数据放在这个应用程序里面
-
5.6.3. 这款特制的应用程序可以决定自己应该如何处理这些数据
-
5.6.3.1. 可以先把数据加密,然后再保存到手机上
-
5.6.3.2. 可以把数据复制到某个集中存放公司数据的地方,以便用其他手段予以保护
-
-
5.6.4. 基于MDM的系统还能够远程删除某个设备上的数据
-
5.6.5. 从备份的角度来看,这种方案确实能够保护数据,而且不用担心设备丢失之后其中的数据会让其他人看到,因为这些数据能够远程删除