Linux监控命令之sar - wfw001 - 博客园

:: :: :: ::

::

公告

Linux监控命令之sar

一、使用说明

sar 是目前 Linux 上最为全面的系统性能分析工具之一，可以从多方面对系统的活动进行报告，包括：文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、进程活动及IPC有关的活动等。

二、参数说明

-A：所有报告的总和
-u：显示CPU使用情况的统计信息
-v：显示inode、文件和其他内核表的统计信息
-p：显示当前系统中指定CPU使用信息
-d：显示硬盘使用信息
-r：显示内存和交换区间的统计信息
-n：显示网络运行状态。参数后面可以跟DEV、EDEV、SOCK和FULL。DEV显示网络接口信息，EDEV显示网络错误的统计数据，SOCK显示套接字信息，FULL显示前三参数所有信息
-q：显示运行队列的大小，它与系统当时的平均负载相同
-B：显示内存分页情况
-R：显示进程在采样时间内的活动情况
-g：显示串口I/O的情况
-b：显示缓冲区使用情况
-a：文件读写情况
-c：显示进程统计信息，每秒创建的进程数
-R：显示进程的活动情况
-y：显示终端设备活动情况
-w：显示系统交换活动信息

三、用法介绍

1、CPU资源监控

每隔2秒往屏幕输出一次CPU使用信息，共输出3次，也可以把-u省略不输，如下图：

CPU：all 表示统计信息为所有 CPU 的平均值。
%user：用户进程消耗的CPU 时间百分比。
%nice：运行正常进程消耗的CPU 时间百分比。
%system：系统进程消耗的CPU 时间百分比。
%iowait：I/O 等待所占CPU 时间百分比。
%steal：在内存紧张环境下，pagein 强制对不同的页面进行的steal 操作
%idle：CPU 空闲状态的时间百分比。
在所有的显示中，我们应主要注意%iowait 和%idle，%iowait 的值过高，表示硬盘存在I/O 瓶颈， %idle 值高，表示CPU 较空闲，如果%idle 值高但系统响应慢时，有可能是CPU 等待分配内存，此时应加大内存容量。%idle 值如果持续低于10，那么系统的CPU 处理能力相对较低，表明系统中最需要解决的资源是CPU。

2、inode、文件和其他内核表监控

每2秒采样一次，连续采样3次，观察核心表的状态

dentunusd：目录高速缓存中未被使用的条目数量
file-nr：文件句柄（file handle）的使用数量
inode-nr：索引节点句柄（inode handle）的使用数量
pty-nr：使用的pty数量

3、内存和交换空间监控

每2秒采样一次，连续采样3次，监控内存分页。也可以不指定次数，一直监控下去，如下图：

kbmemfree：这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间
kbmemused：这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间
%memused：这个值是kbmemused和内存总量(不包括swap)的一个百分比
kbbuffers和kbcached：这两个值就是free命令中的buffer和cache
kbcommit：保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap)
%commit：这个值是kbcommit与内存总量(包括swap)的一个百分比

4、内存分页监控

pgpgin/s：表示每秒从磁盘或SWAP置换到内存的字节数(KB)
pgpgout/s：表示每秒从内存置换到磁盘或SWAP的字节数(KB)
fault/s：每秒系统产生的缺页数,即主缺页与次缺页之和(major + minor)
majflt/s：每秒产生的主缺页数
pgfree/s：每秒被放入空闲队列中的页个数
pgscank/s：每秒被kswapd扫描的页个数
pgscand/s：每秒直接被扫描的页个数
pgsteal/s：每秒钟从cache中被清除来满足内存需要的页个数
%vmeff：每秒清除的页(pgsteal)占总扫描页(pgscank+pgscand)的百分比

5、I/O和传送速率监控

tps：每秒钟物理设备的 I/O 传输总量
rtps：每秒钟从物理设备读入的数据总量
wtps：每秒钟向物理设备写入的数据总量
bread/s：每秒钟从物理设备读入的数据量，单位为块/s
bwrtn/s：每秒钟向物理设备写入的数据量，单位为块/s

6、进程队列长度和平均负载状态监控

runq-sz：运行队列的长度（等待运行的进程数）
plist-sz：进程列表中进程（processes）和线程（threads）的数量
ldavg-1：最后1分钟的系统平均负载（System load average）
ldavg-5：过去5分钟的系统平均负载
ldavg-15：过去15分钟的系统平均负载

7、系统交换活动信息监控

pswpin/s：每秒系统换入的交换页面（swap page）数量
pswpout/s：每秒系统换出的交换页面（swap page）数量

8、设备使用情况监控

tps：每秒从物理磁盘I/O的次数.多个逻辑请求会被合并为一个I/O磁盘请求,一次传输的大小是不确定的
rd_sec/s：每秒读扇区的次数
wr_sec/s：每秒写扇区的次数
avgrq-sz：平均每次设备I/O操作的数据大小(扇区)
avgqu-sz：磁盘请求队列的平均长度
await：从请求磁盘操作到系统完成处理,每次请求的平均消耗时间,包括请求队列等待时间,单位是毫秒(1秒=1000毫秒)
svctm：系统处理每次请求的平均时间,不包括在请求队列中消耗的时间
%util：I/O请求占CPU的百分比,比率越大,说明越饱和
1.avgqu-sz 的值较低时，设备的利用率较高
2.当%util的值接近1% 时，表示设备带宽已经占满

四、性能分析帮助

要判断系统瓶颈问题，有时需要几个sar命令选项结合起来：

　　1、怀疑CPU存在瓶颈，可使用sar –u和sar –q来查看
　　2、怀疑内存存在瓶颈，可使用sar –B、sar –r和sar –W来查看
　　3、怀疑I/O存在瓶颈，可使用sar –b、sar –u和sar –d来查看

posted on 2022-12-10 17:22 wfw001 阅读(1657) 评论(0) 编辑收藏举报

刷新页面返回顶部