vmstat详解

一、vmstat命令介绍

　　vmstat主要是用来检测虚拟内存的，可以展现给定时间间隔的服务器的状态值，包括CPU使用率，内存使用率，虚拟内存交换情况，IO读写情况等。一般vmstat工具的使用是通过两个数字参数来完成的，第一个参数是采样的时间间隔数，单位是秒，第二个参数是采样的次数，如：

➜  test vmstat 2 1       #2表示每隔两秒采集一次服务器状态，1表示只采集一次
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 5403744 445268 8211656    0    0     0     7    0    0  1  2 97  0  0

在实际应用过程中，我们会在一段时间内一直监控，不想监控直接结束vmstat就行了，例如：

➜  test vmstat 2
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 5397244 445268 8221524    0    0     0     7    0    0  1  2 97  0  0
 1  0      0 5394448 445268 8221568    0    0     0   114 4273 7854  1  2 98  0  0
 0  0      0 5394300 445268 8221580    0    0     0     2 3590 6823  0  1 98  0  0
 0  0      0 5392520 445268 8221580    0    0     0    32 4232 7807  0  2 98  0  0
 0  0      0 5392516 445268 8221688    0    0     0    66 4400 8066  1  2 98  0  0

上面的命令表示vmstat每2秒采集一次数据，一直采集，直到我结束程序。vmstat命令常用的选项如下：

选项	功能
-a	显示活跃和非活跃内存
-f	显示从系统启动至今的fork数量
-m	显示slabinfo
-s	显示内存相关统计信息及多种系统活动数量
-d	显示磁盘相关的统计信息
-S	使用指定单位显示。参数有 k 、K 、m 、M ，分别代表1000、1024、1000000、1048576字节(Byte)，默认单位为K(1024 Bytes)
delay	刷新时间间隔，如果不指定，只显示一条结果
count	刷新次数，如果不指定刷新次数，但指定了刷新时间间隔，这时刷新次数为无穷

1.1、vmstat各个参数的含义

procs

r：运行队列中进程的数量，这些进程都是可运行状态，都在等待CPU的分配

　　解释：当这个值超过了CPU数目，就会出现CPU瓶颈，如果运行队列过大，表示你的CPU很繁忙，一般会造成CPU使用率很高

b：被blocked(阻塞)的进程数，正在等待IO

memory

swpd：使用的虚拟内存的大小，单位是KB

　　解释：如果该值大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器

free：可用的物理内存大小，单位是KB

buff：物理内存用来缓存读写操作的buffer大小，单位是KB

cache：物理内存用来缓存进程地址空间的cache大小，单位是KB

swap

si(换入)：每秒从SWAP(交换分区)读入到RAM（swap in）的大小，单位是KB

so(换出)：每秒从RAM写出到SWAP（swap out）的大小，单位是KB

　　解释：内存够用的时候，这2个值都是0，如果这2个值长期大于0时，系统性能会受到影响。有些朋友看到空闲内存(free)很少时，就认为内存不够用了，不能光看这一点，还要结合si和so，如果free很少，但是si和so也很少(大多时候是0)，那么不用担心，系统性能这时不会受到影响。

io

bi：每秒从文件系统或SWAP读入到RAM（blocks in）的块数，block(1KB磁盘块)为单位

bo：每秒从RAM写出到文件系统或SWAP（blocks out）的块数，block(1KB磁盘块)为单位

　　解释：随机磁盘读写的时候，这2个值越大（如超出1024k)，能看到CPU在IO等待的值也会越大。

system

in：每秒的中断数

cs：系统每秒进行上下文切换的次数

　　解释：cs表示每秒上下文切换的次数，例如，当我们调用系统函数，就要进行上下文切换；当进行线程的切换，也要进行上下文切换，这个值越小越好。例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程或线程数就是比较合适的值了。系统调用也是如此，每次调用系统函数，我们的代码就会进入到内核空间(内核态)，导致上下文切换，这个过程很耗资源，所以要尽量避免频繁的系统调用。上下文切换次数过多表示你的CPU大部分时间浪费在上下文切换中，导致CPU干正经事的时间少了。

cpu

us：用户空间占用CPU的百分比

　　解释：us的值比较高时，说明用户进程消耗的CPU时间比较多，但是如果长期超过50%，那么我们就该考虑优化程序算法或者进行加速。

sy：内核空间占用CPU的百分比

　　解释：sy的值高时，说明系统内核消耗的CPU资源多，这并不是良性表现，我们应该检查原因。

id：CPU空闲的百分比

wa：CPU等待IO的百分比

　　解释：wa的值高时，说明CPU等待IO的时间比较多，这可能是大量的磁盘随机访问造成的，也有可能是磁盘出现瓶颈。

st：来自于虚拟机偷取的CPU所占的百分比

1.2、vmstat命令使用实例

【例1】显示活跃和非活跃内存

➜  test vmstat -a 1    #每秒输出一次信息
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free  inact active   si   so    bi    bo   in   cs us sy id wa st
 2  0      0 5388064 4919824 3586956    0    0     0     7    0    1  1  2 97  0  0
 1  0      0 5388072 4919824 3587040    0    0     0     0 3607 6841  1  1 98  0  0
 0  0      0 5387824 4919836 3587388    0    0     0     0 3761 7198  1  2 98  0  0
 1  0      0 5387824 4919836 3587388    0    0     0     0 3558 6897  1  1 98  0  0
 1  0      0 5389012 4919852 3587388    0    0     0     0 3699 6932  1  2 98  0  0

二、虚拟内存相关知识

　　在系统中运行的每个进程都需要使用到内存，但并不是所有的进程每时每刻都会使用到内存。当系统运行所需内存超过实际的物理内存时，系统内核会释放某些进程所占用但未使用的部分或所有物理内存，将这部分数据存储在磁盘上直到进程下一次调用，并将释放出的内存提供给有需要的进程使用。在Linux内存管理中，主要是通过“调页Paging”和“交换Swapping”来完成上述的内存调度。调页算法是将内存中最近不常使用的页面换到磁盘上，把活动页面保留在内存中供进程使用。而交换是将整个进程，而不是部分页面，全部交换到磁盘上。分页(Page)写入磁盘的过程被称作Page-Out，分页(Page)从磁盘重新回到内存的过程被称作Page-In。当内核需要一个分页时，但发现此分页不在物理内存中(因为已经被Page-Out了)，此时就发生了分页错误(Page Fault)。当系统内核发现可运行内存变少时，就会通过Page-Out来释放一部分物理内存。尽管Page-Out不是经常发生，但是如果Page-Out频繁不断地发生，直到当内核管理分页的时间超过了运行程序的时间时，系统性能会急剧下降。这时的系统已经运行的非常慢或进入暂停状态，这种状态也被称作thrashing(颠簸)。

三、总结

　　vmstat是一个服务器监控命令，通过vmstat可以看到CPU和内存的使用情况。目前说来，对于服务器监控有用处的度量主要有：

r（运行队列）
pi（页导入）
us（用户CPU）
sy（系统CPU）
id（空闲CPU）

通过vmstat来识别CPU瓶颈：

　　r（运行队列）展示了正在执行和等待CPU资源的任务个数，当这个值超过了CPU数目，就会出现CPU瓶颈。

Linux下查看CPU核心数的命令：

cat /proc/cpuinfo|grep processor|wc -l

解决CPU瓶颈的办法如下：

1. 增加CPU个数或核数(推荐)

2. 调整任务的执行时间，如把大任务放到系统不繁忙的时候进行，进而平衡系统的任务。

3. 调整已有任务的优先级

通过vmstat识别CPU满负荷：

　　首先需要声明一点的是，vmstat中CPU的度量是百分比的。当us＋sy的值接近100的时候，表示CPU正在接近满负荷工作。但要注意的是，CPU满负荷工作并不能说明什么，Linux总是试图要CPU尽可能的繁忙，使得任务的吞吐量最大化。唯一能够确定CPU瓶颈的还是r（运行队列）的值。

通过vmstat识别内存瓶颈：

　　当内存的需求大于实际的物理内存时，服务器就会启动虚拟内存机制，通过虚拟内存，可以将内存段移到SWAP DISK的特殊磁盘段上，这样就会出现虚拟内存的页导入和页导出现象。页导出并不能说明出现了内存瓶颈，虚拟内存系统经常会对内存段进行页导出，但是页导入操作就表明服务器需要更多的内存了，页导入需要从SWAP DISK上将内存段复制回内存，导致服务器速度变慢。

解决内存瓶颈的办法如下：

1. 最简单的，增加内存(推荐)

2. 改小SGA，使得对内存的需求减少

3. 改小PGA，使得对内存的需求减少

原文：https://www.cnblogs.com/baichunyu/p/15362733.html

posted @ 2024-05-07 14:41 角刀牛Java 阅读(1096) 评论(0) 收藏举报

角刀牛it小窝