常用的linux系统监控命令

转自：http://agapple.iteye.com/blog/1156719

记录一下自己常用的linux系统命令，方便以后查阅，发觉记忆越来越不行了

找到最耗CPU的java线程

ps命令

命令：ps -mp pid -o THREAD,tid,time 或者 ps -Lfp pid

结果展示：

这个命令的作用，主要是可以获取到对应一个进程下的线程的一些信息。比如你想分析一下一个java进程的一些运行瓶颈点，可以通过该命令找到所有当前Thread的占用CPU的时间，也就是这里的最后一列。

比如这里找到了一个TID : 30834 ，所占用的TIME时间最高。

通过 printf "%x\n" 30834 首先转化成16进制，继续通过jstack命令dump出当前的jvm进程的堆栈信息。通过Grep命令即可以查到对应16进制的线程id信息，很快就可以找到对应最耗CPU的代码快在哪。

简单的解释下，jstack下这一串线程信息内容：

Java代码

"DboServiceProcessor-4-thread-295" daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]

"DboServiceProcessor-4-thread-295" daemon prio=10 tid=0x00002aab047a9800 nid=0x7d9b waiting on condition [0x0000000046f66000]

nid : 对应的linux操作系统下的tid，就是前面转化的16进制数字

tid: 这个应该是jvm的jmm内存规范中的唯一地址定位，如果你详细分析jvm的一些内存数据时用得上，我自己还没到那种程度，所以先放下

top命令

命令：top -Hp pid

结果显示：

和前面的效果一下，你可以实时的跟踪并获取指定进程中最耗cpu的线程。再用前面的方法提取到对应的线程堆栈信息。

判断I/O瓶颈

mpstat命令

命令：mpstat -P ALL 1 1000

结果显示：

注意一下这里面的%iowait列，CPU等待I/O操作所花费的时间。这个值持续很高通常可能是I/O瓶颈所导致的。

通过这个参数可以比较直观的看出当前的I/O操作是否存在瓶颈

iostat命令

命令: iostat -m -x 1 1000

同样你可以观察对应的CPU中的%iowait数据，除此之外iostat还提供了一些更详细的I/O状态数据，比如比较重要的有：

avgqu-sz : The average queue length of the requests that were issued to the device. (磁盘队列的请求长度，正常的话2,3比较好。可以和cpu的load一样的理解)

await : The average time (in milliseconds) for I/O requests issued to the device to be served. (代表一个I/O操作从wait到完成的总时间)

svctm和%util都是代表处理该I/O请求花费的时间和CPU的时间比例。判断是否瓶颈时，这两个参数不是主要的

r/s w/s 和 rMB/s wMB/s 都是代表当前系统处理的I/O的一些状态，前者是我们常说的tps，后者就是吞吐量。这也是评价一个系统的性能指标

pid命令

命令: pidstat -p pid -u -d -t -w -h 1 1000

结果显示：

相当实用的一个命令，可以基于当个进程分析对应的性能数据，包括CPU,I/O,IR , CS等，可以方便开发者更加精细化的观察系统的运行状态。不过pidstat貌似是在2.6内核的一些较新的版本才有，需要安装sysstat包。

ubuntu下，可以通过sudo apt-get install sysstat进行安装。

sar命令

命令：sar -x pid 1 1000

sar也可以指定对应的pid，关注固定的几个参数，没有pidstat那么强大。看不到对应的I/O, IR等信息。

sar的功能可以覆盖mpstat , iostat的相关功能。

dstat命令

命令：dstat -y --tcp 1 1000

通过dstat --tcp可以比较方便的看到当前的tcp的各种状态，不需要每次netstat -nat去看

dstat的使用

实时的监控cpu、磁盘、网络、IO、内存等使用情况
监控swap，process，sockets，filesystem并显示监控的时间
可以看下当前最消耗IO的进程和最消耗块设备IO的进程：dstat -t --top-io-adv --top-bio-adv

dstat -tamp 常用的

t: 时间
a: 一个缩写合集，包括CPU(-c), 磁盘IO(-d)，网络流量(-n), Swap page in/out(-g), 系统的中断和上下文切换(-y)
如果用bond0绑定了两块网卡，bond0与eth0+eth1会重复算，需要把值劈一半，或者用-N bond0 这样单拧出来。
如果想监控不同磁盘，可以-D sda,sdb,total
m: 内存
p: 进程数 (在运行的，被阻塞的，新增的)

想监控swap，process，sockets，filesystem并显示监控的时间，若要将结果输出到文件可以加--output filename

#dstat -tsp --socket --fs --output a.txt

从dstat理解Linux性能监控体系

其他命令

netstat -natp : 查看对应的网络链接，关注下Recv-Q , Send-Q , State。

或ss -s命令

lsof -p pid : 查找对应pid的文件句柄

lsof -i : 80 : 查找对应端口被哪个进程占用

lsof /tmp/1.txt ：查找对应文件被哪个进程占用

tcpdump / wireshark ：抓包分析工具

jstat / jmap / jstack / jps 等一系列的java监控命令

最后

如果你想做一些性能调优的工作，一定要善于利用一些工具进行关注相应的状态。通过linux命令你可以比较方便的观测到CPU , I/O , network等一些比较外围的状态，很多时候就已经可以解决大部分的问题。jvm内部的一些运行状态监控，得需要借助一些特有的工具进行细粒度的观测。

posted @ 2014-09-01 16:07 milkty 阅读(167) 评论(0) 编辑收藏举报

刷新页面返回顶部

milkty

芝兰生于深谷，不以无人而不芳。君子修身养德，不以穷困而改志。

常用的linux系统监控命令

找到最耗CPU的java线程

ps命令

top命令

mpstat命令

iostat命令

pid命令

sar命令

dstat命令

其他命令

最后

公告