查看linux中swap内存的相关参数

内容主要来源于:linux的内存回收和交换

各项命令查看的linux环境是:Linux SUSE-33 2.6.32.12-0.7-defaul

 

zone?

内存管理的相关逻辑都是以zone为单位的,这里zone的含义是指内存的分区管理。Linux将内存分成多个区,主要有直接访问区(DMA)、一般区(Normal)和高端内存区(HighMemory)。内核对内存不同区域的访问因为硬件结构因素会有寻址和效率上的差别。如果在NUMA架构上,不同CPU所管理的内存也是不同的zone。

 

/proc/zoneinfo?

查看当前系统的内存水位标记。

weblogic@SUSE-33:/sbin> cat /proc/zoneinfo
Node 0, zone      DMA
  pages free     3929
        min      7
        low      7
        high     10
        scanned  0
        spanned  4096
        present  3832
    nr_free_pages 3929
    nr_inactive_anon 0
    nr_active_anon 0
    nr_inactive_file 0
    nr_active_file 0
    nr_unevictable 0
    nr_mlock     0
    nr_anon_pages 0
    nr_mapped    0
    nr_file_pages 0
    nr_dirty     0
    nr_writeback 0
    nr_slab_reclaimable 0
    nr_slab_unreclaimable 0
    nr_page_table_pages 0
    nr_kernel_stack 0
    nr_unstable  0
    nr_bounce    0
    nr_vmscan_write 0
    nr_writeback_temp 0
    nr_isolated_anon 0
    nr_isolated_file 0
    nr_shmem     0
    numa_hit     1
    numa_miss    0
    numa_foreign 0
    numa_interleave 0
    numa_local   1
    numa_other   0
        protection: (0, 3768, 4016, 4016)
  pagesets
    cpu: 0
              count: 0
              high:  0
              batch: 1
  vm stats threshold: 4
    cpu: 1
              count: 0
              high:  0
              batch: 1
  vm stats threshold: 4
  all_unreclaimable: 1
  prev_priority:     12
  start_pfn:         0
  inactive_ratio:    1
Node 0, zone    DMA32
  pages free     16200
        min      1898
        low      1898
        high     2847
        scanned  0
        spanned  1044480
        present  964664
    nr_free_pages 16200
    nr_inactive_anon 143811
    nr_active_anon 698860
    nr_inactive_file 18465
    nr_active_file 16433
    nr_unevictable 0
    nr_mlock     0
    nr_anon_pages 830848
    nr_mapped    2043
    nr_file_pages 46721
    nr_dirty     13
    nr_writeback 0
    nr_slab_reclaimable 5649
    nr_slab_unreclaimable 3655
    nr_page_table_pages 6618
    nr_kernel_stack 371
    nr_unstable  0
    nr_bounce    0
    nr_vmscan_write 26548123
    nr_writeback_temp 0
    nr_isolated_anon 0
    nr_isolated_file 0
    nr_shmem     18
    numa_hit     12025255812
    numa_miss    0
    numa_foreign 0
    numa_interleave 0
    numa_local   12025255812
    numa_other   0
        protection: (0, 0, 248, 248)
  pagesets
    cpu: 0
              count: 130
              high:  186
              batch: 31
  vm stats threshold: 24
    cpu: 1
              count: 133
              high:  186
              batch: 31
  vm stats threshold: 24
  all_unreclaimable: 0
  prev_priority:     12
  start_pfn:         4096
  inactive_ratio:    5
Node 0, zone   Normal
  pages free     153
        min      125
        low      125
        high     187
        scanned  0
        spanned  64512
        present  54158
    nr_free_pages 153
    nr_inactive_anon 11135
    nr_active_anon 9662
    nr_inactive_file 2144
    nr_active_file 2137
    nr_unevictable 0
    nr_mlock     0
    nr_anon_pages 18039
    nr_mapped    1155
    nr_file_pages 7039
    nr_dirty     26
    nr_writeback 0
    nr_slab_reclaimable 690
    nr_slab_unreclaimable 21507
    nr_page_table_pages 1063
    nr_kernel_stack 205
    nr_unstable  0
    nr_bounce    0
    nr_vmscan_write 1879470
    nr_writeback_temp 0
    nr_isolated_anon 0
    nr_isolated_file 0
    nr_shmem     1
    numa_hit     443690329
    numa_miss    0
    numa_foreign 0
    numa_interleave 8539
    numa_local   443690329
    numa_other   0
        protection: (0, 0, 0, 0)
  pagesets
    cpu: 0
              count: 89
              high:  90
              batch: 15
  vm stats threshold: 8
    cpu: 1
              count: 47
              high:  90
              batch: 15
  vm stats threshold: 8
  all_unreclaimable: 0
  prev_priority:     12
  start_pfn:         1048576
  inactive_ratio:    1
weblogic@SUSE-33:/sbin> 
从上边可看出有DMA、DMA32、Normal这三个内存区。

swappiness?

/proc/sys/vm/swappiness这个文件,这个文件的值用来定义内核使用swap的积极程度,是个可以用来调整跟swap相关的参数。值越高,内核就会越积极的使用swap,值越低就会降低对swap的使用积极性。这个文件的默认值是60,可以的取值范围是0-100。

1)swappiness这个参数实际上是指导内核在清空内存的时候,是更倾向于清空file-backed内存还是更倾向于进行匿名页的交换的。当然,这只是个倾向性,是指在两个都够用的情况下,更愿意用哪个,如果不够用了,那么该交换还是要交换。

2)如果swappiness设置为100,那么匿名页和文件将用同样的优先级进行回收。很明显,使用清空文件的方式将有利于减轻内存回收时可能造成的IO压力。因为如果file-backed中的数据不是脏数据的话,那么可以不用写回,这样就没有IO发生,而一旦进行交换,就一定会造成IO。所以系统默认将swappiness的值设置为60,这样回收内存时,对file-backed的文件cache内存的清空比例会更大,内核将会更倾向于进行缓存清空而不是交换。

3)如果这个值为0,那么内存在free和file-backed(文件映射页的大小)使用的页面总量小于高水位标记(high water mark)之前,不会发生交换。有剩余内存的情况下可能发生交换。

weblogic@SUSE-33:/proc/sys/vm> cat /proc/sys/vm/swappiness 
60

 

min_free_kbytes?

/proc/sys/vm/min_free_kbytes,这个参数本身决定了系统中每个zone的watermark[min]的值大小,然后内核根据min的大小并参考每个zone的内存大小分别算出每个zone的low水位和high水位值。

weblogic@SUSE-33:/proc/sys/vm> cat /proc/sys/vm/min_free_kbytes 
8127

 

zone_reclaim_mode?

zone_reclaim_mode模式是在2.6版本后期开始加入内核的一种模式,可以用来管理当一个内存区域(zone)内部的内存耗尽时,是从其内部进行内存回收还是可以从其他zone进行回收的选项,我们可以通过/proc/sys/vm/zone_reclaim_mode文件对这个参数进行调整。

weblogic@SUSE-33:/proc/sys/vm> cat /proc/sys/vm/zone_reclaim_mode
0

在申请内存时,内核在当前zone内没有足够内存可用的情况下,会根据zone_reclaim_mode的设置来决策是从下一个zone找空闲内存还是在zone内部进行回收。这个值为0时表示可以从下一个zone找可用内存,非0表示在本地回收。这个文件可以设置的值及其含义如下:

  1. echo 0 > /proc/sys/vm/zone_reclaim_mode:意味着关闭zone_reclaim模式,可以从其他zone或NUMA节点回收内存。
  2. echo 1 > /proc/sys/vm/zone_reclaim_mode:表示打开zone_reclaim模式,这样内存回收只会发生在本地节点内。
  3. echo 2 > /proc/sys/vm/zone_reclaim_mode:在本地回收内存时,可以将cache中的脏数据写回硬盘,以回收内存。
  4. echo 4 > /proc/sys/vm/zone_reclaim_mode:可以用swap方式回收内存。

不同的参数配置会在NUMA环境中对其他内存节点的内存使用产生不同的影响。默认情况下,zone_reclaim模式是关闭的。这在很多应用场景下可以提高效率,比如文件服务器,或者依赖内存中cache比较多的应用场景。这样的场景对内存cache速度的依赖要高于进程本身对内存速度的依赖,所以我们宁可让内存从其他zone申请使用,也不愿意清本地cache。

如果确定应用场景是内存需求大于缓存,而且尽量要避免内存访问跨越NUMA节点造成的性能下降的话,则可以打开zone_reclaim模式。此时页分配器会优先回收容易回收的可回收内存(主要是当前不用的page cache页),然后再回收其他内存。

打开本地回收模式的写回可能会引发其他内存节点上的大量的脏数据写回处理。如果一个内存zone已经满了,那么脏数据的写回也会导致进程处理速度收到影响,产生处理瓶颈。这会降低某个内存节点相关的进程的性能,因为进程不再能够使用其他节点上的内存。但是会增加节点之间的隔离性,其他节点的相关进程运行将不会因为另一个节点上的内存回收导致性能下降。

 

min_unmapped_ratio

这个参数只在NUMA架构的内核上生效。这个值表示NUMA上每个内存区域的pages总数的百分比。在zone_reclaim_mode模式下,只有当相关区域的内存使用达到这个百分比,才会发生区域内存回收。在zone_reclaim_mode设置为4的时候,内核会比较所有的file-backed和匿名映射页,包括swapcache占用的页以及tmpfs文件的总内存使用是否超过这个百分比。其他设置的情况下,只比较基于一般文件的未映射页,不考虑其他相关页。

weblogic@SUSE-33:/proc/sys/vm> cat /proc/sys/vm/min_unmapped_ratio
1

 

page-cluster

page-cluster是用来控制从swap空间换入数据的时候,一次连续读取的页数,这相当于对交换空间的预读。这里的连续是指在swap空间上的连续,而不是在内存地址上的连续。因为swap空间一般是在硬盘上,对硬盘设备的连续读取将减少磁头的寻址,提高读取效率。这个文件中设置的值是2的指数。就是说,如果设置为0,预读的swap页数是2的0次方,等于1页。如果设置为3,就是2的3次方,等于8页。同时,设置为0也意味着关闭预读功能。

文件默认值为3。我们可以根据我们的系统负载状态来设置预读的页数大小。

weblogic@SUSE-33:/proc/sys/vm> cat /proc/sys/vm/page-cluster
3

 

手工清理缓存

在系统中除了内存将被耗尽的时候可以清缓存以外,还可以使用下面这个文件来人工触发缓存清除的操作:

weblogic@SUSE-33:/sbin> cat /proc/sys/vm/drop_caches 
0

weblogic@SUSE-33:/sbin>  echo 1 > /proc/sys/vm/drop_caches

当然,这个文件可以设置的值分别为1、2、3。它们所表示的含义为:

echo 1 > /proc/sys/vm/drop_caches:表示清除page cache。

echo 2 > /proc/sys/vm/drop_caches:表示清除回收slab分配器中的对象(包括目录项缓存和inode缓存)。slab分配器是内核中管理内存的一种机制,其中很多缓存数据实现都是用的pagecache。

echo 3 > /proc/sys/vm/drop_caches:表示清除pagecache和slab分配器中的缓存对象。

 

posted @ 2016-08-29 15:27  milkty  阅读(9721)  评论(0编辑  收藏  举报