[Linux]经典面试题 - 系统管理 - RAID
参考:
- 软 RAID 和硬 RAID 各有什么优劣? - 知乎 (zhihu.com)
- 磁盘阵列_百度百科 (baidu.com)
- RAID磁盘阵列是什么意思?RAID 0、1、5都有什么不同?_哔哩哔哩_bilibili
- RAID - 维基百科,自由的百科全书 (wikipedia.org)
- [云计算]HCIE-Cloud 存储虚拟化 - SkyBiuBiu - 博客园 (cnblogs.com)
一、RAID 简介
1.1 什么是RAID?
磁盘冗余阵列(Redundant Arrays of Independent Disks,RAID),通俗点可以叫具有容错功能的不贵的磁盘阵列,RAID是一种技术,可以通过软件或者硬件来实现,将多个较小的磁盘整合成一个具有容错功能的较大的磁盘,具体RAID等级根据使用需求来选择,有以下几种:
-
标准RAID:RAID 0、RAID 1、RAID 2、RAID 3、RAID 4、RAID 5、RAID 6
-
混合RAID:JBOD、RAID 7、RAID 10、RAID 01
1.2 磁盘阵列比较表
1.3 RAID的数据组织方式
- 条带:磁盘中单个或者多个连续的扇区构成一个条带。它是组成分条的元素。
- 分条:同一磁盘阵列中的多个磁盘驱动器上的相同“位置”(或者说是相同编号)的条带
- 分条宽度:指在一个分条中数据成员盘的个数(上图分条宽度为3)
- 分条深度:指一个条带的容量大小(根据硬盘大小而定)
二、JBOD(一堆盘)
JBOD,Just a Bunch Of Disk,一堆硬盘。
在分类上,JBOD不是标准的RAID等级,只是将多个硬盘空间合并成一个大的逻辑硬盘,没有错误冗余机制。
三、RAID 0(分割)
RAID 0:等量模式,stripe,效率最高。
-
RAID 0又叫带区集,指将两个以上的硬盘并联起来,形成一个大容量的磁盘。
-
RAID 0的容量为硬盘容量的总和。
-
数据在写入时,分段后分散存储在这些磁盘上,因为读写上具有并行性,所以RAID 0 是所有级别中最快的。
-
缺点是RAID 0既没有冗余功能,也不具备容错的能力,其中一块坏了就莫得了。
应用场景:不追求安全,只要速度,大规模并发的读取场景。如数据库(备)、存储库(备)。
四、RAID 1(镜像)
RAID 1:镜像模式,mirror,完整备份。
- RAID 1由两组以上的N个磁盘互相作镜像。
- RAID 1容量为硬盘容量总和的一半。
- 数据写入的时候,分别写入工作盘和镜像盘中,在多线程IO的场景中会有比较好的表现。
应用场景:只追求安全性,不追求速度。比如系统盘和监控服务器。
五、RAID 5(奇偶校验)
RAID 5:奇偶校验,效率与数据备份兼顾,Disk Striping 硬盘分割技术。
- RAID 5至少需要三块硬盘。
- RAID 5的容量 = (硬盘个数-1)* 单块硬盘容量。
- RAID 5不是对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID 5的各个硬盘上,并且将奇偶校验信息分别存储于不同的磁盘上。
- 当RAID 5的一个硬盘发生损坏,可用剩下的数据和奇偶校验信息来恢复被破坏的数据。
- RAID 5可以看作RAID 1 和 RAID 0的折中方案,既有近似RAID 0的读写速度,又有校验机制来保证数据的可靠性。
应用场景:对安全性和速度有基本的需求。比如普通数据库、存储库。
六、RAID 6(双重奇偶校验)
RAID 6:两套奇偶校验,可以看作RAID 5的升级版,加入第二个独立的奇偶校验快。
- RAID 6至少需要四块硬盘。
- RAID 6的容量 = (硬盘个数-2)* 单块硬盘容量。
- RAID 6的两个独立的奇偶校验系统采用不同的算法,数据的可靠性非常高,任意两块磁盘同时失效也不会影响数据的完整性。
- 相比RAID 5,RAID 6有着更大的IO吞吐和计算能力。
- RAID 6建议使用硬件的方式实现。
应用场景:对安全性和速度有基本的需求。比如普通数据库、存储库。
七、RAID 10/01(分割+镜像)
RAID 10:先分割,再镜像。(常用,可靠性高)
RAID 01:先镜像,再分割。(可靠性低)
- 当RAID 10有一个硬盘损坏,其余的硬盘仍然可以正常运作;而RAID 01其中一个硬盘坏了,其他的就没法正常运作了。
应用场景:对安全和性能都有较高要求的场景,比如数据库(主)、存储库(主)
八、RAID 实现
8.1 软RAID
(图片来自百度)
软RAID:由操作系统模拟的RAID,由cpu来代替硬件RAID卡进行调度任务,一旦硬盘损坏,操作系统就会损坏,模拟的RAID就会失效。
- 优点:
- 便宜,不需要专门买RAID卡。
- 简单,点就完事了。
- 缺点:
- 需要占用CPU资源来进行RAID的模拟。
- 由操作系统模拟,系统坏了,就无法实现RAID的磁盘容错功能了。
这里引用知乎木头龙大大对软RAID的解释:
假设要写入的数据是{A1,A2,A3,……,A8},那么:
- 对于RAID1来说,需要做这样的转换:
+--+--+--+--+--+--+--+--+ +-->|A1|A2|A3|A4|A5|A6|A7|A8| +--+--+--+--+--+--+--+--+ | +--+--+--+--+--+--+--+--+ |A1|A2|A3|A4|A5|A6|A7|A8|-->| Disk0 +--+--+--+--+--+--+--+--+ | +--+--+--+--+--+--+--+--+ RAID 1 +-->|A1|A2|A3|A4|A5|A6|A7|A8| +--+--+--+--+--+--+--+--+ Disk1
- 对于四盘RAID0来说,需要做这样的转换:
+--+--+ +-->|A1|A5| | +--+--+ | Disk0 | +--+--+ +-->|A2|A6| +--+--+--+--+--+--+--+--+ | +--+--+ |A1|A2|A3|A4|A5|A6|A7|A8|-->| Disk1 +--+--+--+--+--+--+--+--+ | +--+--+ RAID 0 +-->|A3|A7| | +--+--+ | Disk2 | +--+--+ +-->|A4|A8| +--+--+ Disk3
- 对于四盘RAID10来说,需要做这样的转换:
+--+--+--+--+ +-->|A1|A3|A5|A7| | +--+--+--+--+ | Disk0 | +--+--+--+--+ +-->|A1|A3|A5|A7| +--+--+--+--+--+--+--+--+ | +--+--+--+--+ |A1|A2|A3|A4|A5|A6|A7|A8|-->| Disk1| +--+--+--+--+--+--+--+--+ | +--+--+--+--+ RAID 10 +-->|A2|A4|A6|A8| | +--+--+--+--+ | Disk2 | +--+--+--+--+ +-->|A2|A4|A6|A8| +--+--+--+--+ Disk3
- 对于四盘RAID5来说,需要做这样的转换(其中B7、B8、Q3需要先从硬盘读出,P1、P2、P3需要进行计算):
+--+--+------+ +-->|A1|A4|B7->A7| | +--+--+------+ | Disk0 | +--+--+------+ +-->|A2|A5|Q3->P3| +--+--+--+--+--+--+--+--+ | +--+--+------+ |A1|A2|A3|A4|A5|A6|A7|A8|-- | Disk1(P3=B7 XOR A7 XOR B8 XOR A8 XOR Q3) +--+--+--+--+--+--+--+--+ | +--+--+------+ RAID 5 +-->|A3|P2|B8->A8| | +--+--+------+ | Disk2(P2=A4 XOR A5 XOR A6) | +--+--+ +-->|P1|A6| +--+--+ Disk3(P1=A1 XOR A2 XOR A3)
类似的,读取数据需要进行反向转换。
上述提到的这些转换、计算过程,如果由CPU执行硬盘控制器的驱动程序代码完成,就是软RAID。
8.2 硬RAID
(RAID卡就长这个样)
硬RAID:n块独立硬盘+硬件RAID卡组成的,就算硬盘发生故障,RAID卡也不会发生故障,可以起到磁盘容错的作用。