瓶颈分析
Top指令: CPU/内存情况
top
# top指令可以显示总体CPU占用率、内存使用率和交换情况,以及所有进程对应的CPU、内存占用情况
终端下使用该指令示例结果:
上图对一些重要的参数进行了简单标识,笔者这里使用的是XShell对远程Linux服务器进行连接和管理。
可以看到,在 top
指令返回的结果中,CPU和内存的占用信息都十分详细:
第一行中的Load Average则是Linux系统中任务调度队列里1分钟、5分钟与15分钟任务的负载(有关Linux系统任务调度相关内容可参阅高等教育出版社的《操作系统概念》); 第三行中用户模态和内核模态的分别占用率以及空闲CPU都反应了当前CPU的总体占用情况。I/O等待占CPU时间要注意,如果此项过高可能是I/O读写出现了故障或者瓶颈; 第四行是物理内存的使用情况,一般来说,内存根据实际需要配置,增添看当前是否够用,这方面没有什么技巧。 第五行是交换内存的使用情况。关于交换内存,首先,交换内存是指在等待或者被挂起的进程被交换到辅存(SSD、机械硬盘)。这样,能把空闲的进程腾出来,把空间让给更加活跃的进程。因此,交换内存的性能是低于物理内存的。当交换内存占用过大时,一方面可能是空闲进程多,还有一方面要注意的可能就是物理内存不够用,大量进程都被交换到了这里。 而下面的列表,则是各个进程的具体情况。比如,图中的php-fpm就反映了PHP的运行情况,同样还有mysqld可以反应MySQL数据库的运行情况
IOStat指令: 磁盘情况
iostat -d -k 2 # iostat主要用来显示磁盘IO情况,这里-d、-k、2是三个常加的参数: # -d 表示显示设备(磁盘)使用状态 # -k 某些使用block为单位的列强制使用Kilobytes为单位 # 2 表示数据显示每隔2秒刷新一次。可以使用Ctrl+C来终止输出
终端下使用该指令示例结果:
如上图,命令执行后每两秒钟会向终端输出一次当前的I/O状况。这些数据的具体含义是:
tps:该设备每秒的I/O请求次数,即频率; kB_read/s:每秒从设备读取的数据量; kB_wrtn/s:每秒向设备写入的数据量; kB_read:读取的总数据量; kB_wrtn:写入的总数量数据量;
更高级的用法:
iostat -d -x -k 1 10 # 这里添加了几个参数 -x 与 1 后面的 10 # -x 表示显示和io相关的扩展数据 # 1 10 1 表示每1秒刷新一次,1 后跟 10 表示一共输出10次数据
avgrq-sz:平均请求扇区的大小 avgqu-sz:是平均请求队列的长度。毫无疑问,队列长度越短越好。 await: 每一个IO请求的处理的平均时间(单位是微秒毫秒)。这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们的差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题。 svctm:表示平均每次设备I/O操作的服务时间(以毫秒为单位)。如果svctm的值与await很接近,表示几乎没有I/O等待,磁盘性能很好,如果await的值远高于svctm的值,则表示I/O队列等待太长,系统上运行的应用程序将变慢。 %util: 在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。