当看到I/O等待时间所占CPU时间的比重非常高的时候,首先要检查的就是机器是否正在大量使用交换空间。由于硬盘操作的速度远远低于RAM,所以当系统内存耗尽。開始使用交换空间的时候,系统的性能会受到严重影响。

不论什么想要訪问硬盘的操作都要完毕与硬盘的I/O交换。所以。故障排除的第一步是看内存是否耗尽。假设是,先解决问题。

假设还有大量可用的RAM。你须要明白那个进程占用了大部分I/O操作。

在你非常难弄明确究竟是哪个进程占用了大量I/O资源,使用iostat能够找到是哪个分区运行大量I/O操作。

iostat的使用

最上面显示的是1个cpu,64位系统。linux内核版本号

avg-cpu段:
%user: 在用户级别执行所使用的CPU的百分比
%nice: nice操作所使用的CPU的百分比
%system: 在系统级别(kernel)执行所使用CPU的百分比
%iowait: CPU等待硬件I/O时,所占用CPU百分比
%idle: CPU空暇时间的百分比
Device段:

sda:设备名
tps: 每秒钟发送到的I/O请求数.
Blk_read /s: 每秒读取的数据量
Blk_wrtn/s: 每秒写入的数据量.
Blk_read:   读入的总的数据量
Blk_wrtn:  写入的总的数据量

iostat各个參数说明:


-c 仅显示CPU统计信息.与-d选项相互排斥.
 -d 仅显示磁盘统计信息.与-c选项相互排斥.
 -k 以K为单位显示每秒的磁盘请求数,默认单位块.
 -p device | ALL
  与-x选项相互排斥,用于显示块设备及系统分区的统计信息.也能够在-p后指定一个设备名,如:
  # iostat -p hda
  或显示全部设备
  # iostat -p ALL
 -t    在输出数据时,打印搜集数据的时间.
 -V    打印版本和帮助信息.
 -x    输出扩展信息.

iostat后加一个数字

iostat 4 表示每隔4秒就刷新一次

iotop的使用



       --version 显示版本然后退出
       -h, --help 显示帮助然后退出
       -o, --only 仅仅显示正在产生I/O的进程或线程。除了传參。能够在执行过程中按o生效。
       -b, --batch 非交互模式,一般用来记录日志
       -n NUM, --iter=NUM 设置监測的次数。默认无限。在非交互模式下非常实用
       -d SEC, --delay=SEC 设置每次监測的间隔,默认1秒,接受非整形数据比如1.1
       -p PID, --pid=PID 指定监測的进程/线程
       -u USER, --user=USER 指定监測某个用户产生的I/O
       -P, --processes 仅显示进程,默认iotop显示全部线程
       -a, --accumulated 显示累积的I/O,而不是带宽
       -k, --kilobytes 使用kB单位,而不是对人友好的单位。在非交互模式下,脚本编程实用。


       -t, --time 加上时间戳,非交互非模式。
       -q, --quiet 禁止头几行,非交互模式。

有三种指定方式。


              -q     仅仅在第一次监測时显示列名
              -qq    永远不显示列名。
              -qqq   永远不显示I/O汇总。