总结:常用的Linux系统监控命令(2)

判断I/O瓶颈

mpstat命令

命令:mpstat -P ALL 1 1000

结果显示:

 

 

注意一下这里面的%iowait列,CPU等待I/O操作所花费的时间。这个值持续很高通常可能是I/O瓶颈所导致的。

通过这个参数可以比较直观的看出当前的I/O操作是否存在瓶颈

iostat命令

命令:

iostat -m -x 1 1000

 

 

同样你可以观察对应的CPU中的%iowait数据,除此之外iostat还提供了一些更详细的I/O状态数据,比如比较重要的有:

avgqu-sz : The average queue length of the requests that were issued to the device. (磁盘队列的请求长度,正常的话2,3比较好。可以和cpu的load一样的理解)
await : The average time (in milliseconds) for I/O requests issued to the device to be served. (代表一个I/O操作从wait到完成的总时间)

svctm和%util都是代表处理该I/O请求花费的时间和CPU的时间比例。 判断是否瓶颈时,这两个参数不是主要的

r/s w/s 和 rMB/s wMB/s 都是代表当前系统处理的I/O的一些状态,前者是我们常说的tps,后者就是吞吐量。这也是评价一个系统的性能指标

pid命令

命令:

pidstat -p pid -u -d -t -w -h 1 1000

结果显示:

 

 

相当实用的一个命令,可以基于当个进程分析对应的性能数据,包括CPU,I/O,IR , CS等,可以方便开发者更加精细化的观察系统的运行状态。不过pidstat貌似是在2.6内核的一些较新的版本才有,需要安装sysstat包。

ubuntu下,可以通过sudo apt-get install sysstat进行安装。

sar命令

命令:

sar -x pid 1 1000

 

 

sar也可以指定对应的pid,关注固定的几个参数,没有pidstat那么强大。 看不到对应的I/O, IR等信息。

sar的功能可以覆盖mpstat , iostat的相关功能。

dstat命令

命令:

dstat -y --tcp 1 1000

 

 

通过dstat --tcp可以比较方便的看到当前的tcp的各种状态,不需要每次netstat -nat去看

其他命令

  • netstat -natp : 查看对应的网络链接,关注下Recv-Q , Send-Q , State。
  • lsof -p pid : 查找对应pid的文件句柄
  • lsof -i : 80 : 查找对应端口被哪个进程占用
  • lsof /tmp/1.txt :查找对应文件被哪个进程占用
  • tcpdump / wireshark :抓包分析工具
  • jstat / jmap / jstack / jps 等一系列的java监控命令

最后

如果你想做一些性能调优的工作,一定要善于利用一些工具进行关注相应的状态。通过linux命令你可以比较方便的观测到CPU , I/O , network等一些比较外围的状态, 很多时候就已经可以解决大部分的问题。jvm内部的一些运行状态监控,得需要借助一些特有的工具进行细粒度的观测。

 

http://www.bitscn.com/os/linux/201108/193475_2.html

posted @ 2013-08-12 20:37  seasonzone  阅读(320)  评论(0编辑  收藏  举报