性能测试初学_linux 计数器

参考如下几遍文章，整理出自己需要的计数器关注点

top： http://www.jb51.net/LINUXjishu/34604.html

vmstat： http://www.jb51.net/LINUXjishu/152024.html

iostat： http://www.jb51.net/LINUXjishu/152032.html

free： http://www.jb51.net/LINUXjishu/10945.html

汇总： http://www.cnblogs.com/taosim/articles/4054142.html

********************************************************

1.top 使用top查看系统的总体运行情况

1.1第一行：查看 load average 系统负载，输出的3个值不能大于系统逻辑cpu的个数。

例如：系统有4个逻辑CPU（我们经常说的4核），如果load average的三个值长期大于4时，说明CPU很繁忙，负载很高，会影响到系统性能，但是偶尔大于4时，一般不会影响系统的性能。如果load average 的输出值小于CPU的个数，表示CPU比较空闲

系统逻辑CPU如何查看：cat /proc/cpuinfo|grep processor|wc -l

1.2 第三行：查看us+sy<70%为好，=85%为坏，>90%为糟糕. 当CPU的处理时间更多的是在sy 时，说明已经超负荷

us：用户空间占用cpu百分比

sy: 内核空间占用CPU百分比

1.3 Tasks 这行反应的是当前系统的任务状态，主要看running和zombie进程的数量，一个健康的系统zombie（僵死进程）的数量一定是为0的，

否则肯定系统已经出不小的问题了

1.4 Mem这行反应当前系统内存使用状况

1.5 Swap 这行就是系统交换分区使用状态，一个性能优越的系统，交换分区使用量一定是为0的，交换分区只是一种应对在系统内存不足时的一种紧急机制，用到交换分区，说明可以考虑增加内存或者裁减现有内存数据大小了。毕竟交换分区就是硬盘，速度和内存差了太多。

2. df -h 查看硬盘

硬盘容量如果爆满的话，那么什么诡异的情况都可能出现，这个已经非常危急了

3.dstat -n 查看宽带

这里如果细分的话就复杂了，比如是否有网络攻击，封包数量和特征是否异常等，zabbix是其中的佼佼者，这里我们只要看目前的带宽有没有接近网卡的上限

dstat 功能很强大，

默认情况下，dstat 会每隔一秒刷新一次数据，一直刷新并一直输出，按 Ctrl+C 退出 "dstat"

4.iostat ，将对系统的磁盘操作活动进行监视

4.1 %iowait<20 为好，=35为坏，>=50为糟糕，如果%iowait的值过高，表示硬盘存在I/O瓶颈。

　　（%iowait：CPU等待输入输出完成时间的百分比）

4.2 若%idle值高，表示CPU较空闲，如果%idle值高但系统响应慢时，有可能是CPU等待分配内存，此时应加大内存容量。

　　%idle值如果持续低于10，那么系统的CPU处理能力相对较低，表明系统中最需要解决的资源是CPU。

（%idle：CPU空闲时间百分比）

命令：iostat -d -x -k 1 1

4.3 如果 %util 接近 100%，说明产生的I/O请求太多，I/O系统已经满负荷，该磁盘可能存在瓶颈。

　　（%util: 一秒中有百分之多少的时间用于 I/O 操作，即被io消耗的cpu百分比）

4.4 %idle小于70% IO压力就较大了，一般读取速度有较多的wait。

4.5 可以结合vmstat 查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比，高过30%时IO压力高)。

4.6 avgqu-sz 也是个做 IO 调优时需要注意的地方，这个就是直接每次操作的数据的大小，如果次数多，但数据拿的小的话，其实 IO 也会很小。如果数据拿的大，才IO 的数据会高。也可以通过 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s。也就是讲，读定速度是这个来决定的。

（avgqu-sz: 平均I/O队列长度。）

(r/s: 每秒完成的读 I/O 设备次数。即 rio/s)

(w/s: 每秒完成的写 I/O 设备次数。即 wio/s)

4.7 如果 svctm 比较接近 await，说明 I/O 几乎没有等待时间；如果 await 远大于 svctm，说明I/O 队列太长，io响应太慢，则需要进行必要优化。如果avgqu-sz比较大，也表示有大量io在等待。

其中的svctm一项，反应了磁盘的负载情况，如果该项大于15ms，并且util%接近100%，那就说明，磁盘现在是整个系统性能的瓶颈

await: 平均每次设备I/O操作的等待时间 (毫秒)。

svctm: 平均每次设备I/O操作的服务时间 (毫秒)。

5.vmstat 可对操作系统的虚拟内存、进程、CPU活动进行监控

备注：

5.1 如果 r经常大于 4 ，且id经常少于40，表示cpu的负荷很重

(r: 运行队列中进程数量)

(id: 空闲时间(包括IO等待时间),中央处理器的空闲时间。以百分比表示。)

5.2 如果pi，po 长期不等于0，表示内存不足。（pi、po用 dstat 查看）

当系统内核发现可运行内存变少时，就会通过Page-Out来释放一部分物理内存。尽管Page-Out不是经常发生，但是如果Page-out频繁不断的发生，直到当内核管理分页的时间超过运行程式的时间时，系统效能会急剧下降。这时的系统已经运行非常慢或进入暂停状态，这种状态亦被称作thrashing(颠簸)。

5.3 如果disk 经常不等于0，且在 b中的队列大于3，表示 io性能不好。（disk不为0也不理解）

若发现有些进程处于阻塞状态（查看b值很多不为0，且有些还达到3了）但cpu是又很空闲（如id值很大），应是等着进程进来运算，而进程迟迟没有到达，这个肯定就是数据在交换分区了，存取太慢导致的卡和延迟，后来关闭了交换分区，并且整理内存

5.4 如果swpd的值不为0，但是SI，SO的值长期为0，这种情况不会影响系统性能

（si: 每秒从交换区写到内存的大小，由磁盘调入内存）
（so: 每秒写入交换区的内存大小，由内存调入磁盘）
5.5 注意：如果cache的值大的时候，说明cache处的文件数多，如果频繁访问到的文件都能被cache处，那么磁盘的读IO bi会非常小。

5.6 内存够用的时候，si so 这2个值都是0，如果这2个值长期大于0时，系统性能会受到影响，磁盘IO和CPU资源都会被消耗。

有些朋友看到空闲内存（free）很少的或接近于0时，就认为内存不够用了，不能光看这一点，还要结合si和so，如果free很少，但是si和so也很少（大多时候是0），那么不用担心，系统性能这时不会受到影响的。

5.7

IO：（现在的Linux版本块的大小为1kb）

bi: 每秒读取的块数
bo: 每秒写入的块数

注意：随机磁盘读写的时候，这2个值越大（如超出1024k)，能看到CPU在IO等待的值也会越大。

系统：

in: 每秒中断数，包括时钟中断。
cs: 每秒上下文切换数。

注意：上面2个值越大，会看到由内核消耗的CPU时间会越大。

CPU（以百分比表示）：

us: 用户进程执行时间百分比(user time)

注意： us的值比较高时，说明用户进程消耗的CPU时间多，但是如果长期超50%的使用，那么我们就该考虑优化程序算法或者进行加速。

sy: 内核系统进程执行时间百分比(system time)

注意：sy的值高时，说明系统内核消耗的CPU资源多，这并不是良性表现，我们应该检查原因。

wa: IO等待时间百分比，

这里wa的参考值为30%，如果wa超过30%，说明IO等待严重，这可能是磁盘大量随机访问造成的，也可能磁盘或者磁盘访问控制器的带宽瓶颈造成的(主要是块操作)。

注意：wa的值高时，说明IO等待比较严重，这可能由于磁盘大量作随机访问造成，也有可能磁盘出现瓶颈（块操作）。

id: 空闲时间百分比

6. free 显示内存的使用情况，包括实体内存，虚拟的交换文件内存，共享内存区段，以及系统核心使用的缓冲区等

6.1 -buffers/cache 的内存数(等于第1行的 used - buffers - cached)，即实际使用的内存总量[t1]
+buffers/cache 的内存数 (等于第1行的 free + buffers + cached)，即系统当前实际可用内存

[t1]第一行是从OS的角度来看，因为对于OS，buffers/cached 都是属于被使用，第三行所指的是从应用程序角度来看，对于应用程序来说，buffers/cached 是等于可用的，因为buffer/cached是为了提高文件读取的性能，当应用程序需在用到内存的时候，buffer/cached会很快地被回收

6.2 当可用内存少于额定值的时候，就会开会进行交换.如何看额定值（RHEL4.0）：
#cat /proc/meminfo （这段不理解）

当内存的需求大于RAM（内存）的数量，服务器启动了虚拟内存机制，通过虚拟内存，可以将RAM段移到SWAP DISK的特殊磁盘段上，这样会出现虚拟内存的页导出和页导入现象，页导出并不能说明RAM瓶颈，虚拟内存系统经常会对内存段进行页导出，但页导入操作就表明了服务器需要更多的内存了，页导入需要从SWAP DISK上将内存段复制回RAM，导致服务器速度变慢。

posted on 2017-03-29 15:34 jilu1219 阅读(808) 评论(0) 编辑收藏举报