系统问题排查思路

 

一、确定CPU是否有问题

 

首先看cpu 有没有问题要先看负载,如果负载高,用vmstat看r和b,队列排队的情况
 
再结合CPU使用率,看用户还是系统cpu 高
 
1、用户高,看具体哪个用户的应用进程导致的高,再找出那个线程导致的高,然后是线程栈,找到具体的方法
 
2、系统高,看中断和io ,如果是io导致的看读和写,读大概是内存问题,如果是写,大概是写日志,写数据库,文件之间的同步,如果是中断导致的,vmstat查看上下文切换

 

二、确定是否是IO问题

 

确定是不是IO问题,可以通过nmon 看io繁忙程度是不是高于20%或者30% ,然后iostat -x 看磁盘队列及操作磁盘的时间 ,再查看读还是写
 
1、读高:读磁盘多,大多数会导致内存不足等,那么去看一下内存的情况
2、写高:如果写磁盘多,大多数是写日志和数据库操作及文件同步操作导致的,那么去排查应用写操作相关的操作
posted @ 2019-06-10 11:12  小戳同学  阅读(542)  评论(0编辑  收藏  举报