线上有一批机器经常crash,cpu load只升不降,原因是这批机器都是ubuntu 14.04.5的操作系统,原因是bios中有个功能没关。hadoop上概率发生很高。不跑hadoop的机器概率低一些。
解决方法:关闭bios中numa的一个功能,不停机修改bios功能,详见Megacli命令。