运维遇到问题的解决思路

发生问题的现象,例(登录不了,页面错误……)
什么时候发生的问题 例(3点15)
为什么会发生 例(今天举行比赛,昨天更新)
那个地方发生的问题 例(APP,web端,某个城市,某个网络)
怎么解决 (根据问题情况具体分析原因)
解决情况如何 (和之前对比,响应时间,CPU等资源占用)

uptime 平均负载
vmstat 包括系统范围的CPU平均负载
top 监控每个进程/线程CPU用量
pidstat 每个进程/线程CPU用量分解
ps 进程状态
perf CPU剖析和跟踪,性能计数器分析

free 缓存容量统计信息
vmstat 虚拟内存统计信息
top 监视每个进程的内存使用情况
ps 进程状态
Dtrace 分配跟踪

posted @ 2019-06-05 14:55  大小狮子  阅读(649)  评论(0编辑  收藏  举报