[Linux]经典面试题 - 系统管理 - RAID

参考:

一、RAID 简介

1.1 什么是RAID?

磁盘冗余阵列(Redundant Arrays of Independent Disks,RAID),通俗点可以叫具有容错功能的不贵的磁盘阵列,RAID是一种技术,可以通过软件或者硬件来实现,将多个较小的磁盘整合成一个具有容错功能的较大的磁盘,具体RAID等级根据使用需求来选择,有以下几种:

  • 标准RAID:RAID 0、RAID 1、RAID 2、RAID 3、RAID 4、RAID 5、RAID 6

  • 混合RAID:JBOD、RAID 7、RAID 10、RAID 01

1.2 磁盘阵列比较表

image-20210624193805261

1.3 RAID的数据组织方式

img

  • 条带:磁盘中单个或者多个连续的扇区构成一个条带。它是组成分条的元素。
  • 分条:同一磁盘阵列中的多个磁盘驱动器上的相同“位置”(或者说是相同编号)的条带
    • 分条宽度:指在一个分条中数据成员盘的个数(上图分条宽度为3)
    • 分条深度:指一个条带的容量大小(根据硬盘大小而定)

二、JBOD(一堆盘)

img

JBOD,Just a Bunch Of Disk,一堆硬盘。

在分类上,JBOD不是标准的RAID等级,只是将多个硬盘空间合并成一个大的逻辑硬盘,没有错误冗余机制。

三、RAID 0(分割)

img

RAID 0:等量模式,stripe,效率最高。

  • RAID 0又叫带区集,指将两个以上的硬盘并联起来,形成一个大容量的磁盘。

  • RAID 0的容量为硬盘容量的总和。

  • 数据在写入时,分段后分散存储在这些磁盘上,因为读写上具有并行性,所以RAID 0 是所有级别中最快的。

  • 缺点是RAID 0既没有冗余功能,也不具备容错的能力,其中一块坏了就莫得了。

应用场景:不追求安全,只要速度,大规模并发的读取场景。如数据库(备)、存储库(备)。

四、RAID 1(镜像)

img

RAID 1:镜像模式,mirror,完整备份。

  • RAID 1由两组以上的N个磁盘互相作镜像。
  • RAID 1容量为硬盘容量总和的一半。
  • 数据写入的时候,分别写入工作盘和镜像盘中,在多线程IO的场景中会有比较好的表现。

应用场景:只追求安全性,不追求速度。比如系统盘和监控服务器。

五、RAID 5(奇偶校验)

img

RAID 5:奇偶校验,效率与数据备份兼顾,Disk Striping 硬盘分割技术。

  • RAID 5至少需要三块硬盘。
  • RAID 5的容量 = (硬盘个数-1)* 单块硬盘容量
  • RAID 5不是对存储的数据进行备份,而是把数据和相对应的奇偶校验信息存储到组成RAID 5的各个硬盘上,并且将奇偶校验信息分别存储于不同的磁盘上。
  • 当RAID 5的一个硬盘发生损坏,可用剩下的数据和奇偶校验信息来恢复被破坏的数据。
  • RAID 5可以看作RAID 1 和 RAID 0的折中方案,既有近似RAID 0的读写速度,又有校验机制来保证数据的可靠性。

应用场景:对安全性和速度有基本的需求。比如普通数据库、存储库。

六、RAID 6(双重奇偶校验)

img

RAID 6:两套奇偶校验,可以看作RAID 5的升级版,加入第二个独立的奇偶校验快。

  • RAID 6至少需要四块硬盘。
  • RAID 6的容量 = (硬盘个数-2)* 单块硬盘容量
  • RAID 6的两个独立的奇偶校验系统采用不同的算法,数据的可靠性非常高,任意两块磁盘同时失效也不会影响数据的完整性。
  • 相比RAID 5,RAID 6有着更大的IO吞吐和计算能力。
  • RAID 6建议使用硬件的方式实现。

应用场景:对安全性和速度有基本的需求。比如普通数据库、存储库。

七、RAID 10/01(分割+镜像)

image-20210624202849072

RAID 10:先分割,再镜像。(常用,可靠性高)

RAID 01:先镜像,再分割。(可靠性低)

  • 当RAID 10有一个硬盘损坏,其余的硬盘仍然可以正常运作;而RAID 01其中一个硬盘坏了,其他的就没法正常运作了。

应用场景:对安全和性能都有较高要求的场景,比如数据库(主)、存储库(主)

八、RAID 实现

8.1 软RAID

image-20210624175058223

(图片来自百度)

软RAID:由操作系统模拟的RAID,由cpu来代替硬件RAID卡进行调度任务,一旦硬盘损坏,操作系统就会损坏,模拟的RAID就会失效。

  • 优点:
    • 便宜,不需要专门买RAID卡。
    • 简单,点就完事了。
  • 缺点:
    • 需要占用CPU资源来进行RAID的模拟。
    • 由操作系统模拟,系统坏了,就无法实现RAID的磁盘容错功能了。

这里引用知乎木头龙大大对软RAID的解释:

假设要写入的数据是{A1,A2,A3,……,A8},那么:

  • 对于RAID1来说,需要做这样的转换:
                                +--+--+--+--+--+--+--+--+
                            +-->|A1|A2|A3|A4|A5|A6|A7|A8|
+--+--+--+--+--+--+--+--+   |   +--+--+--+--+--+--+--+--+
|A1|A2|A3|A4|A5|A6|A7|A8|-->|             Disk0
+--+--+--+--+--+--+--+--+   |   +--+--+--+--+--+--+--+--+
          RAID 1            +-->|A1|A2|A3|A4|A5|A6|A7|A8|
                                +--+--+--+--+--+--+--+--+
                                          Disk1
  • 对于四盘RAID0来说,需要做这样的转换:
                                +--+--+  
                            +-->|A1|A5| 
                            |   +--+--+
                            |    Disk0
                            |   +--+--+
                            +-->|A2|A6|
+--+--+--+--+--+--+--+--+   |   +--+--+
|A1|A2|A3|A4|A5|A6|A7|A8|-->|    Disk1
+--+--+--+--+--+--+--+--+   |   +--+--+
          RAID 0            +-->|A3|A7|
                            |   +--+--+
                            |    Disk2
                            |   +--+--+
                            +-->|A4|A8|
                                +--+--+
                                 Disk3
  • 对于四盘RAID10来说,需要做这样的转换:
                                +--+--+--+--+
                            +-->|A1|A3|A5|A7|
                            |   +--+--+--+--+
                            |       Disk0
                            |   +--+--+--+--+
                            +-->|A1|A3|A5|A7|
+--+--+--+--+--+--+--+--+   |   +--+--+--+--+
|A1|A2|A3|A4|A5|A6|A7|A8|-->|       Disk1|      
+--+--+--+--+--+--+--+--+   |   +--+--+--+--+
          RAID 10           +-->|A2|A4|A6|A8|
                            |   +--+--+--+--+
                            |       Disk2
                            |   +--+--+--+--+
                            +-->|A2|A4|A6|A8|
                                +--+--+--+--+
                                    Disk3
  • 对于四盘RAID5来说,需要做这样的转换(其中B7、B8、Q3需要先从硬盘读出,P1、P2、P3需要进行计算):
                                +--+--+------+
                            +-->|A1|A4|B7->A7|
                            |   +--+--+------+
                            |       Disk0
                            |   +--+--+------+
                            +-->|A2|A5|Q3->P3|
+--+--+--+--+--+--+--+--+   |   +--+--+------+
|A1|A2|A3|A4|A5|A6|A7|A8|-- |       Disk1(P3=B7 XOR A7 XOR B8 XOR A8 XOR Q3)
+--+--+--+--+--+--+--+--+   |   +--+--+------+
          RAID 5            +-->|A3|P2|B8->A8|
                            |   +--+--+------+
                            |       Disk2(P2=A4 XOR A5 XOR A6)
                            |   +--+--+
                            +-->|P1|A6|
                                +--+--+
                                    Disk3(P1=A1 XOR A2 XOR A3)

类似的,读取数据需要进行反向转换。

上述提到的这些转换、计算过程,如果由CPU执行硬盘控制器的驱动程序代码完成,就是软RAID

8.2 硬RAID

image-20210624175555673

(RAID卡就长这个样)

硬RAID:n块独立硬盘+硬件RAID卡组成的,就算硬盘发生故障,RAID卡也不会发生故障,可以起到磁盘容错的作用。

posted @ 2021-06-24 19:22  SkyBiuBiu  阅读(744)  评论(0编辑  收藏  举报