Linux系统下常见死机故障三大类速查
1.节能类
处理器调频cpufreq或处理器空闲idle存在问题 关闭调频或空闲状态复测
显卡调频dpm类存在问题 关闭dpm复测
固态硬盘nvme节能存在问题 关闭aspt复测
pcie下设备节能存在问题 关闭aspm复测
usb下设备节能存在问题 关闭usb autosuspend复测
2.驱动类
安装kdump-tools获取死机内核转储查看死机状态
如果是不支持kdump的处理器架构可以打开pstore进行崩溃日志转储
或者使用串口或者jtag进行崩溃日志获取
3.硬件类
硬件类故障容易导致内核级调试手段也失效
内存故障 可以用memtest压测排查
处理器故障可以用处理器压测和处理器功能测试排查
显卡和外设故障可以通过屏蔽对应硬件排除