记一次排除单点故障的经历
在生产环境中,为了保障业务的连续性,一般会对系统进行高可用性建设,避免单点故障。前段时间排除系统风险的时候发现了一个单点故障的风向,记录下来,希望可以在以后工作中举一反三。
一个系统XSystem有两台主备机器A,B,两台机器做的冷备份,其中A为主机,B为备机。
主机A有四块硬盘,做了两组raid1,分别对应系统的C盘(系统盘),D盘(数据盘),还通过HBA连接一块儿柜式存储,对应系统的E盘(数据盘)。
发现系统X,使用的数据库文件存放位置竟然为C盘,这样的方案,系统的高可用性建设作用极低。
首先C盘是由两块硬盘做的raid1,避免了硬盘的单点故障。
但是一旦主机发生宕机,启动备机后,备机可以启动数据库系统,但是不能加载原来的数据库,
只能把原来主机A的raid盘查到备机B上,而且机器宕机会有较低的可能性造成硬盘损坏。
正确的方式是应该把数据库文件存放到E盘上即柜式存储上,好处是:一旦主机宕机,可以将光纤线连接到B机上,可以快速的加载数据库。