Linux进阶之RAID磁盘阵列、系统启动及dd命令

本节内容

1. 磁盘阵列

RAID0：条带卷 2+ 100% 读写速度快，不容错

RAID1：镜像卷 2 50% 读写速度慢，容错

RAID5: 奇偶校验条带卷 3 读写速度快，容错，只允许错一块

RAID10： RAID0+RAID1 4 50% 读写速度快，容错

2. 创建阵列方式

硬件：磁盘阵列盒

软件： mdadm

3. mdadm命令

-C: 创建

-v: 显示创建过程

-a: 添加磁盘、自动检测设备

-l: 阵列级别

-n: 磁盘数量

-x: 备份盘数量

-f: 模拟损坏

-D：查看阵列详细信息

-S：停止阵列

-r: 移除磁盘

4. 创建RAID10

mdadm -Cv /dev/md10 -n 4 -l 10 /dev/sd{b,c,d,e}

5. 模拟损坏

mdadm /dev/md10 -f /dev/sdd

6. 磁盘损坏后的操作

poweroff

移除坏磁盘

新硬盘添加

虚拟机操作： mdadm /dev/md10 -a /dev/sdd

7. 搭建RAID5+热备盘

mdadm -Cv /dev/md5 -n 3 -l 5 -x 1 /dev/sd{b,c,d,e}

8. 自动挂载

echo "/dev/md5 /ken xfs defaults 0 0" >> /etc/fstab

9. 系统启动

1. BISO初始化，post开机自检

2. 加载MBR到内存

3. grub阶段

4. 加载内核和initramfs模块

5. 内核初始化，使用centos7系统使用的是systemd替换了centos6当中的init

10. dd if=/dev/zero of=/dev/swap bs=XM count=2048

磁盘阵列

一、概念

1、什么是RAID

RAID全称Redundant Array of Inexpensive Disks，廉价冗余磁盘阵列，通过多块磁盘组成一种模式，来提高吞吐量和可靠性。磁盘阵列是由很多价格较便宜的磁盘，以硬件（RAID卡）或软件（MDADM）形式组合成一个容量巨大的磁盘组，利用多个磁盘组合在一起，提升整个磁盘系统效能。

RAID可以把硬盘整合成一个大磁盘，还可以在大磁盘上再分区，放数据；还有一个大功能，多块盘放在一起可以有冗余（备份）。

RAID的创建有两种方式：软RAID（通过操作系统软件来实现）和硬RAID（使用硬件阵列卡）

RAID基本思想：把好几块硬盘通过一定组合方式把它组合起来，成为一个新的硬盘阵列组，从而使它能够达到高性能硬盘的要求。

2、磁盘阵列功能

A 整合闲置磁盘空间

B 提高磁盘读取效率

C 提供容错功能

3、磁盘阵列等级

RAID-0：要求磁盘的容量相同，总容量为所有磁盘容量的和
RAID-1：要求磁盘容量相同，总容量为一块硬盘容量
RAID-1+0：请参考RAID-0/1
RAID-5：要求容量相同，总容量为磁盘容量减一
备用磁盘：闲着没用，用于顶替坏盘

RAID类型		最低磁盘个数	空间利用率	各自的优缺点
级别	说明	最低磁盘个数	空间利用率	各自的优缺点
RAID0	条带卷	2+	100%	读写速度快，不容错
RAID1	镜像卷	2	50%（1/n）	读写速度一般，容错
RAID5	带奇偶校验的条带卷	3+	（n-1）/n	读写速度快，容错，允许坏一块盘
RAID10	RAID1的安全+RAID0的高速	4	50%	读写速度快，容错

4、RAID三个关键技术

镜像：提供了数据的安全性；

条带（块大小也可以说是条带的粒度），它的存在就是提供了数据并发性

数据的校验：提供了数据的安全

5、RAID等级详解

（1）RAID-0的工作原理

条带（strping），也是我们最早出现的RAID模式，需磁盘数量2块以上(大小最好相同)，是组建磁盘阵列中最简单的一种形式，只需要2块以上的硬盘即可。

特点：成本低，可以提高整个磁盘的性能。RAID 0没有提供冗余或错误修复能力，速度快。

任何一个磁盘的损坏将损坏全部数据；磁盘利用率为100%。

（2）RAID-1的工作原理

RAID 1 mirroring（镜像卷），至少需要两块硬盘。

原理：是把一个磁盘的数据镜像到另一个磁盘上，也就是说数据在写入一块磁盘的同时，会在另一块闲置的磁盘上生成镜像文件，(同步)

磁盘利用率为50%，即2块100G的磁盘构成RAID1只能提供100G的可用空间。

缺点：浪费资源，成本高

（3）RAID-5的工作原理

需要三块或以上硬盘，可以提供热备盘实现故障的恢复；只损坏一块，没有问题。但如果同时损坏两块磁盘，则数据将都会损坏。空间利用率： (n-1)/n

特点：读写性能一般，读还好一点，写不好

奇偶检验：raid5的数据恢复原理就是用公式算出来的

最左边的是原始数据，右边分别是三块硬盘，假设第二块硬盘出了故障，通过第一块硬盘上的 1 和第三块硬盘上的 1 xor 2，就能够还原出 2。同理可以还原出 3 和 8。至于 5 xor 6 则更简单了，直接用 5 和 6 运算出来即可。

RAID硬盘失效处理：热备和热插拔

a、热备：HotSpare

定义：当冗余的RAID组中某个硬盘失效时，在不干扰当前RAID系统的正常使用的情况下，用RAID系统中另外一个正常的备用硬盘自动顶替失效硬盘，及时保证RAID系统的冗余性

全局式：备用硬盘为系统中所有的冗余RAID组共享

专用式：备用硬盘为系统中某一组冗余RAID组专用

b、热插拔：HotSwap

定义：在不影响系统正常运转的情况下，用正常的物理硬盘替换RAID系统中失效硬盘。

（4）RAID-10镜像+条带（嵌套RAID级别）

RAID 10是将镜像和条带进行两级组合的RAID级别，第一级是RAID1镜像对，第二级为RAID 0。比如我们有8块盘，它是先两两做镜像，形成了新的4块盘，然后对这4块盘做RAID0；当RAID10有一个硬盘受损其余硬盘会继续工作，这个时候受影响的硬盘只有2块。

6、三种RAID的排序

冗余从好到坏：RAID1 RAID10 RAID5 RAID0

性能从好到坏：RAID0 RAID10 RAID5 RAID1

成本从低到高：RAID0 RAID5 RAID1 RAID10

二、硬件磁盘阵列介绍

不需要CPU处理的磁盘阵列就叫硬件磁盘阵列

面试题：我们做硬件RAID，是在装系统前还是之后？

答：先做阵列才装系统，一般服务器启动时，有显示进入配置Riad的提示。

硬RAID：需要RAID卡，我们的磁盘是接在RAID卡的，由它统一管理和控制。数据也由它来进行分配和维护；它有自己的cpu，处理速度快

软RAID：通过操作系统实现

三、软件磁盘阵列

1、mdadm命令详解

Linux内核中有一个md(multiple devices)模块在底层管理RAID设备，它会在应用层给我们提供一个应用程序的工具mdadm ，mdadm是linux下用于创建和管理软件RAID的命令。

Mdadm命令常见参数：

参数	全写	作用
-a	--add --auto{=yes，md，mdp，part，p}	添加磁盘检测设备名称；
-n	--raid-devices=N	指定设备数量
-x	--spare-devices=N	指定冗余设备数量
-l	--level=[0 1 5]	指定RAID级别
-C	--create	创建
-v	--verbose	显示过程
-f	--fail	模拟设备损坏
-r	--remove	移除设备
-Q	--query	查看摘要信息
-D	--detail	查看详细信息
-S	--stop	停止RAID磁盘阵列

2、实战搭建raid10阵列

第一步：新添加4块硬盘，查看磁盘

[root@renyz08 ~]# ls /dev/sd*

/dev/sda /dev/sda1 /dev/sda2 /dev/sdb /dev/sdc /dev/sdd /dev/sde

第二步：下载mdadm

[root@renyz08 ~]# yum install mdadm -y

第三步：创建raid10阵列

[root@renyz08 ~]# mdadm --create --verbose /dev/md10 --auto=yes --raid-devices=4 --level=10 /dev/sd{b,c,d,e}

mdadm: layout defaults to n2

mdadm: chunk size defaults to 512K

mdadm: size set to 20954112K

mdadm: Defaulting to version 1.2 metadata

mdadm: array /dev/md10 started.

第四步：格式化磁盘阵列为ext4

[root@renyz08 ~]# mkfs.ext4 /dev/md10

mke2fs 1.42.9 (28-Dec-2013)

文件系统标签=

OS type: Linux

块大小=4096 (log=2)

分块大小=4096 (log=2)

Stride=128 blocks, Stripe width=256 blocks

2621440 inodes, 10477056 blocks

523852 blocks (5.00%) reserved for the super user

第一个数据块=0

Maximum filesystem blocks=2157969408

320 block groups

32768 blocks per group, 32768 fragments per group

8192 inodes per group

Superblock backups stored on blocks:

32768, 98304, 163840, 229376, 294912, 819200, 884736, 1605632, 2654208,

4096000, 7962624

Allocating group tables: 完成

正在写入inode表: 完成

Creating journal (32768 blocks): 完成

Writing superblocks and filesystem accounting information: 完成

第五步：挂载

[root@renyz08 ~]# mkdir /raid10

[root@renyz08 ~]# mount /dev/md10 /raid10

[root@renyz08 ~]# df -h

文件系统容量已用可用已用% 挂载点

/dev/mapper/centos-root 17G 1.2G 16G 7% /

devtmpfs 475M 0 475M 0% /dev

tmpfs 487M 0 487M 0% /dev/shm

tmpfs 487M 7.6M 479M 2% /run

tmpfs 487M 0 487M 0% /sys/fs/cgroup

/dev/sda1 1014M 133M 882M 14% /boot

tmpfs 98M 0 98M 0% /run/user/0

/dev/md10 40G 49M 38G 1% /raid10

第六步：查看/dev/md0的详细信息

[root@renyz08 ~]# mdadm --detail /dev/md10

/dev/md10:

Version : 1.2

Creation Time : Thu Jul 18 10:44:59 2019

Raid Level : raid10

Array Size : 41908224 (39.97 GiB 42.91 GB)

Used Dev Size : 20954112 (19.98 GiB 21.46 GB)

Raid Devices : 4

Total Devices : 4

Persistence : Superblock is persistent

Update Time : Thu Jul 18 10:49:20 2019

State : clean

Active Devices : 4

Working Devices : 4

Failed Devices : 0

Spare Devices : 0

Layout : near=2

Chunk Size : 512K

Consistency Policy : resync

Name : renyz08:10 (local to host renyz08)

UUID : 8c2449e5:889b6950:3c8643c7:5a7cb07d

Events : 19

Number Major Minor RaidDevice State

0 8 16 0 active sync set-A /dev/sdb

1 8 32 1 active sync set-B /dev/sdc

2 8 48 2 active sync set-A /dev/sdd

3 8 64 3 active sync set-B /dev/sde

第七步：写入配置文件

[root@renyz08 ~]# echo "/dev/md10 /raid10 ext4 defaults 0 0" >> /etc/fstab

3、损坏磁盘阵列及修复

之所以在生产环境中部署RAID 10磁盘阵列，是为了提高硬盘存储设备的读写速度及数据的安全性，但由于我们的硬盘设备是在虚拟机中模拟出来的，因此对读写速度的改善可能并不直观。

在确认有一块物理硬盘设备出现损坏而不能继续正常使用后，应该使用mdadm命令将其移除，然后查看RAID磁盘阵列的状态，可以发现状态已经改变。

第一步：模拟设备损坏

[root@renyz08 ~]# cat /proc/mdstat #查看设备运行状态

Personalities : [raid10]

md10 : active raid10 sde[3] sdd[2] sdc[1] sdb[0]

41908224 blocks super 1.2 512K chunks 2 near-copies [4/4] [UUUU]

unused devices: <none>

[root@renyz08 ~]# mdadm /dev/md10 --fail /dev/sdb #损坏磁盘sdb

mdadm: set /dev/sdb faulty in /dev/md10

[root@renyz08 ~]# cat /proc/mdstat

Personalities : [raid10]

md10 : active raid10 sde[3] sdd[2] sdc[1] sdb[0](F)

41908224 blocks super 1.2 512K chunks 2 near-copies [4/3] [_UUU]

unused devices: <none>

第二步：添加新的磁盘

在RAID 10级别的磁盘阵列中，当RAID 1磁盘阵列中存在一个故障盘时并不影响RAID 10磁盘阵列的使用。当购买了新的硬盘设备后再使用mdadm命令来予以替换即可，在此期间我们可以在/RAID目录中正常地创建或删除文件。由于我们是在虚拟机中模拟硬盘，所以先重启系统，然后再把新的硬盘添加到RAID磁盘阵列中。

[root@renyz08 ~]# reboot

[root@renyz08 ~]# umount /raid10

[root@renyz08 ~]# mdadm /dev/md10 -a /dev/sdb

mdadm: added /dev/sdb

[root@renyz08 ~]# cat /proc/mdstat

Personalities : [raid10]

md10 : active raid10 sdb[4] sde[3] sdd[2] sdc[1]

41908224 blocks super 1.2 512K chunks 2 near-copies [4/3] [_UUU]

[==============>......] recovery = 71.4% (14966144/20954112) finish=0.1min speed=650701K/sec

unused devices: <none>

第三步：再次查看，已经构建完成

[root@renyz08 ~]# mdadm -D /dev/md10

4、实战搭建raid5阵列+备份盘

第一步：创建raid5磁盘阵列

[root@renyz08 ~]# ls /dev/sdb*

/dev/sdb /dev/sdb1 /dev/sdb2 /dev/sdb3 /dev/sdb4 /dev/sdb5

[root@renyz08 ~]# mdadm -C -a yes /dev/md5 -l 5 -n 3 -x 1 /dev/sdb{1,2,3,5}

mdadm: Defaulting to version 1.2 metadata

mdadm: array /dev/md5 started.

第二步：格式化

[root@renyz08 ~]# mkfs.xfs /dev/md5

第三步：挂载

[root@renyz08 ~]# mkdir /raid5

[root@renyz08 ~]# mount /dev/md5 /raid5

[root@renyz08 ~]# df -h

文件系统容量已用可用已用% 挂载点

/dev/md5 8.0G 33M 8.0G 1% /raid5

第四步：查看

[root@renyz08 ~]# cat /proc/mdstat #查询运行状态

Personalities : [raid6] [raid5] [raid4]

md5 : active raid5 sdb3[4] sdb5[3](S) sdb2[1] sdb1[0]

8376320 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]

unused devices: <none>

[root@renyz08 ~]# mdadm -D /dev/md5 #查询磁盘阵列信息

第五步：模拟错误

[root@renyz08 ~]# cat /proc/mdstat

md5 : active raid5 sdb1[5](S) sdb5[3] sdb2[1] sdb3[4]

[root@renyz08 ~]# mdadm /dev/md5 -f /dev/sdb2

mdadm: set /dev/sdb2 faulty in /dev/md5

[root@renyz08 ~]# cat /proc/mdstat

Personalities : [raid6] [raid5] [raid4]

md5 : active raid5 sdb1[5] sdb5[3] sdb2[1](F) sdb3[4]

第六步：移除磁盘

[root@renyz08 ~]# mdadm --manage /dev/md5 -r /dev/sdb2

mdadm: hot removed /dev/sdb2 from /dev/md5

[root@renyz08 ~]# cat /proc/mdstat

Personalities : [raid6] [raid5] [raid4]

md5 : active raid5 sdb1[5] sdb5[3] sdb3[4]

第七步：增加磁盘

[root@renyz08 ~]# mdadm --manage /dev/md5 -a /dev/sdb2

mdadm: added /dev/sdb2

[root@renyz08 ~]# cat /proc/mdstat

Personalities : [raid6] [raid5] [raid4]

md5 : active raid5 sdb2[6](S) sdb1[5] sdb5[3] sdb3[4]

第八步：停用磁盘阵列

[root@renyz08 ~]# mdadm -S /dev/md5 #未取消挂载，停用操作无用

mdadm: Cannot get exclusive access to /dev/md5:Perhaps a running process, mounted filesystem or active volume group?

[root@renyz08 ~]# umount /dev/md5 /raid5 #先取消挂载

umount: /raid5：未挂载

[root@renyz08 ~]# mdadm -S /dev/md5 #停用磁盘阵列

mdadm: stopped /dev/md5

四、centos7系统启动过程及相关配置文件

1. uefi或BIOS初始化，开始post(power on self test)开机自检；这个过程是开机后，BIOS或UEFI进行硬件检查的阶段。

2. 加载MBR到内存

自检硬件没有问题时候，这里以BIOS为例，BIOS将会直接找硬盘的第一个扇区，找到前446字节，将MBR加载到内存中，MBR将告诉程序下一阶段去哪里找系统的grub引导。此阶段属于grub第一阶段。grub还有1.5阶段和2阶段。

3. GRUB阶段

grub第1.5和第2阶段，信息默认存放在扇区中，如果使用grub-install生成的第2阶段的文件是存放在/boot分区中的。

为了加载内核系统，不得不加载/boot分区，而加载/boot分区，要有/boot分区的驱动，/boot分区驱动是放在/boot分区中的啊，我们好像进入死循环了，Linux是怎么解决的呢？就是靠放在1.5阶段中的数据，放在第一个扇区后的后续扇区中，第1.5阶段和2阶段总共27个扇区。

第1.5阶段：mbr之后的扇区，识别stage2所在的分区上的文件系统。

第2阶段：开机启动的时候看到Grub选项、信息，还有修改GRUB背景等功能都是stage2提供的，stage2会去读入/boot/grub/grub.conf或者menu.lst等配置文件。

4. 加载内核和initramfs模块

加载内核，核心开始解压，启动一些最核心的程序。

为了让内核足够的轻小，硬件驱动并没放在内核文件里面。

5. 内核开始初始化，使用systemd来代替centos6以前的init程序

(1)执行initrd.target

包括挂载/etc/fstab文件中的系统,此时挂载后，就可以切换到根目录了

(2)从initramfs根文件系统切换到磁盘根目录

(3)systemd执行默认target配置

centos7表面是有“运行级别”这个概念，实际上是为了兼容以前的系统，每个所谓的“运行级别”都有对应的软连接指向，默认的启动级别时/etc/systemd/system/default.target,根据它的指向可以找到系统要进入哪个模式

模式：

0 ==> runlevel0.target, poweroff.target

1 ==> runlevel1.target, rescue.target

2 ==> runlevel2.target, multi-user.target

3 ==> runlevel3.target, multi-user.target

4 ==> runlevel4.target, multi-user.target

5 ==> runlevel5.target, graphical.target

6 ==> runlevel6.target, reboot.target

(4)systemd执行sysinit.target

有没有很眼熟？是的，在CentOS6上是被叫做rc.sysint程序，初始化系统及basic.target准备操作系统

(5)systemd启动multi-user.target下的本机与服务器服务

(6)systemd执行multi-user.target下的/etc/rc.d/rc.local

6. Systemd执行multi-user.target下的getty.target及登录服务

getty.target我们也眼熟，它是启动终端的systemd对象。如果到此步骤，系统没有被指定启动图形桌面，到此就可以结束了，如果要启动图形界面，需要在此基础上启动桌面程序

7. systemd执行graphical需要的服务

CentOS6，7启动区别

系统启动和服务器守护进程管理器，它不同于centos5的Sysv init，centos6的Upstart（Ubuntu制作出来），systemd是由Redhat的一个员工首先提出来的，它在内核启动后，服务什么的全都被systemd接管，kernel只是用来管理硬件资源，相当于内核被架空了，因此linus很不满意Redhat这种做法。

五、如何不用新分区添加swap（dd）

在之前的教程中我们提到过如何去添加一个swap分区，以及如何给你的swap进行扩容。在教程中我们使用的是新分区的方式，也就是新添加一块硬盘，或在原有硬盘空余空间的基础上新建一个分区，然后将其格式化为交换分区，最后进行挂载。

现在很多朋友使用的都是云主机，云主机一般不会设置swap（如某里云）购买之后一般使用的都是赠送的磁盘空间，且因为数据量小的原因并不会购买数据盘，导致没有可用分区转换为swap，有没有什么办法可以不用分区即可添加或扩容swap呢？今天就来教大家个方法！

首先使用dd命令生成一个固定大小的文件，文件的大小就是添加或扩容swap的大小：

dd if=/dev/zero of=/opt/swap bs=1M count=2048

然后使用mkswap命令将其格式化：

mkswap /opt/swap

使用swapon命令挂载：

swapon /opt/swap

看下一下，交换分区是不是变大了？

[root@renyz08 ~]# free -h

total used free shared buff/cache available

Mem: 972M 85M 766M 7.6M 119M 741M

Swap: 2.0G 0B 2.0G

[root@renyz08 ~]# dd if=/dev/zero of=/opt/swap bs=1M count=2048

记录了2048+0 的读入

记录了2048+0 的写出

2147483648字节(2.1 GB)已复制，20.2102 秒，106 MB/秒

[root@renyz08 ~]# mkswap /opt/swap

正在设置交换空间版本 1，大小 = 2097148 KiB

无标签，UUID=88cbe933-fdc6-495c-9155-deea9b0b8948

[root@renyz08 ~]# swapon /opt/swap

swapon: /opt/swap：不安全的权限 0644，建议使用 0600。

[root@renyz08 ~]# chmod 600 /opt/swap

[root@renyz08 ~]# free -h

total used free shared buff/cache available

Mem: 972M 84M 60M 7.6M 826M 712M

Swap: 4.0G 0B 4.0G

原理：Linux中皆是文件，swap对于linux系统来说也是一个文件，/opt/swap对于linux系统来说也是一个文件，这样概念就对等了。实际上这些文件就像一个笔记本，它是一个实体也是一个载体，我们是可以在笔记本中记录内容，如同可以在/opt/swap中写入数据的。

/dev/null 黑洞文件（不保存）

/dev/zero 白洞文件源源不断的向外输出文件

转换和拷贝文件

if=file

从 file 中读而不是标准输入。

of=file

写到 file 里去而不是标准输出

bs=bytes

一次读和写 bytes 字节

count=blocks

只拷贝输入文件的前 blocks 块

posted @ 2019-07-18 10:06 Wolf_Coder 阅读(3534) 评论(0) 收藏举报

刷新页面返回顶部

Wolf_Coder

All growth is a leap in the dark !

Linux进阶之RAID磁盘阵列、系统启动及dd命令

公告