AIX性能监控笔记

  由于这次测试有幸采用了两台小型机,IBMm80,虽然不是高端机器,但是还是很庆幸用来作为我的测试试验机,很好的把玩把玩,以前出去部署在实地环境也把玩过很多的p595高端机器,ibm的小型机确实很厉害,呵呵。性能很好,要不买那么贵啊。两台,一台作为数据库服务器安装oralce9i,一台作为应用服务器安装weblogic;搭建一个测试环境测试在此环境下系统负载承受能力情况。

     以下是在性能测试中用到的监控m80 aix5.3服务器性能的一些命令行工具,很有实用性。实践中体会这些参数的含义还是很快的。

     客户端很多方式连接到小型机,我一般采用Xmanager连入,telnet连入也行,不过不喜欢cmd的黑屏,呵呵。废话少说,开始正题:

备注:一下命令行都可以采用管道命令将抓取到的数据写入到txt中用来分析用。

1、aix常用的监控工具(常用命令、软件包) vmstat,iostat,sar bos.acct topas,svmon,filemon,fileplace bos.perf.tools vmtune,schedtune bos.adt.samples netstat bos.net.tcp.clint

2、vmstat报告cpu与内存信息 执行vmstat 2 10 kthr    memory              page              faults        cpu    ----- ----------- ------------------------ ------------ ----------- r  b   avm   fre  re  pi  po  fr   sr  cy  in   sy  cs us sy id wa 1  0 140831 895234   0   0   0   0    0   0   6  882  75  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0  12 1056  94  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   5 1012  76  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4 1001  76  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4  995  71  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4  986  74  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4  995  73  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4 1072  75  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4 1001  71  0  0 99  0 0  0 140835 895229   0   0   0   0    0   0   4 1000  72  0  0 99  0

内核线程 r表示内核中运行的线程数,如果其数超过系统的cpu个数,则说明进程越多 b表示内核中等待的线程数,由于挂起或IO等待

内存列 pi列表示每秒钟从Paging Space置换到内存的页数。 po列表示每秒钟从内存置换到Paging Space的页数。 如果这两列持续大于5,则系统的性能瓶颈很可能是内存不足,而导致交换频繁。

fr列表示每秒钟页面置换算法释放的页数。 sr列表示每秒钟页面置换算法检查的页数。

故障列 in 设备中断次数 sy 系统调用次数 cs 内核线程上下文交换,即时间片用完后,再轮到时的上下文计算,如果太高,则要仔细观察

内存信息 avm与free两项分别表示了物理内存的活动页数与可用页数(每页4096bytes),其大小可用其值/256获得MB数。 其中free数如果持续为0或很低则预示内存不足,此时可能会导致大量的页面交换,而在CPU中显示为wa很高,此值的多少也与vmtune中的-f -p设置有关

CPU信息 在以上信息中,关于CPU是的后四列: id高表示系统空闲,us、sy分别表示用户和系统进程CPU占用,wa表示IO等待时间 如果us与sy之和持续超过90%时,CPU出现了瓶颈。 如果wa长期很高>50,则表示IO太忙,具体看是应用IO多,还是交换分页多,如果是后者,则显示内存不足, 如果是前者,则应关注应用的IO性能状况,优化应用与磁盘设备

3、sar命令优势 sar可以针对SMP系统来分别查看CPU使用情况 sar -P ALL 3 2 AIX testhost 1 5 0050C33A4C00 06/28/05

17:30:02 cpu %usr %sys %wio %idle 17:30:05 0 38 4 43 15 1 32 3 49 16 2 51 3 44 2 3 53 3 42 2 - 44 3 44 9 17:30:08 0 35 1 46 18 1 18 3 70 9 2 24 2 60 14 3 16 1 81 3 - 23 2 64 11

Average 0 36 2 45 16 1 25 3 59 13 2 38 3 52 8 3 34 2 62 2 - 33 3 54 10 以上显示了一个单CPU系统的显示,

sar也可以查看系统调用情况 sar -c 3 2 AIX test 1 5 0050C33A4C00 06/28/05

17:31:00 scall/s sread/s swrit/s fork/s exec/s rchar/s wchar/s 17:31:03 5738 484 439 0.00 0.00 952729 1073997 17:31:06 3365 149 266 0.00 0.00 11620 930150

Average 4553 317 352 0.00 0.00 482957 1002193

4、svmon使用 svmon可以查看内存的详细使用情况,含分页 svmon -G  -i 5 2                size      inuse       free        pin    virtual memory      2097136    2096903        233     107570    1622941 pg space    1507328    1400132

               work       pers       clnt      lpage pin          107324        246          0          0 in use      1236897     860006          0          0                size      inuse       free        pin    virtual memory      2097136    2096212        924     107570    1623787 pg space    1507328    1400135

               work       pers       clnt      lpage pin          107324        246          0          0 in use      1237139     859073          0          0 其中memory行显示了内存总量,使用量,钉入量和虚拟总量 pg space行显示了分面空间的使用量 pin行显示了正在用的钉入量,永久钉入量和客户量 in use显示了总内存的工作页面量,永久页面量,客户端页面量 如想将oracle进行lock_sga设置,可以查看PIN值来确认是否生效 要使pin生效必需vmtune -S 1

svmon -U oracle可以查看oracle用户的用量 svmon -U oracle =============================================================================== User                                 Inuse      Pin     Pgsp  Virtual  LPageCap oracle                             1897660     3007  1210399  1459736         N 计算出其大小为         7412M 11M 4728M  5702M ............................................................................... SYSTEM segments                      Inuse      Pin     Pgsp  Virtual                                       3236     2089     1935     4889                                       13M      8M        8M    
............................................................................... EXCLUSIVE segments                   Inuse      Pin     Pgsp  Virtual                                    1893883      918  1208317  1453304                                       7398      4M SHARED segments                      Inuse      Pin     Pgsp  Virtual                                        541        0      147     1543                                        2M 在以上表中SYSTEM是所有系统共用段,EXCLUSIVE是此用户专用段,SHARED段是共享段

5、磁盘IO iostat 可以查看时间段内的CPU状况和磁盘状况 tty:      tin         tout   avg-cpu:  % user    % sys     % idle    % iowait           0.0         55.3              11.6      2.0       20.4      66.0    

Disks:        % tm_act     Kbps      tps    Kb_read   Kb_wrtn hdisk0          24.9     153.0      38.3       1236       296 hdisk1          31.3     193.8      48.7       1656       284 dac0             0.0     2969.1     179.1      11564     18164 hdisk2         100.0     2969.1     179.1      11564     18164 cd0              0.0       0.0       0.0          0         0 其中% tm_act是指活动时间,kbps是在统计时间内所有Kb_read与Kb_wrtn之和除以时间的值,即每秒传输的字节数 如果%tm_act常过70%却只有很低的Kbps,系统可能是有比较多的LV碎片或文件碎片,当都高时则系统正常。 tps表示每秒的IO数,不同的磁盘系统其可承受的IO数不同。

sar -d 10 2也可以查看IO情况 12:11:16     device    %busy    avque    r+w/s   blks/s   avwait   avserv

12:11:26     hdisk0     34      1.0       50      201      0.0      0.0              hdisk1     41      0.0       64      259      0.0      0.0                dac0      0      0.0      331     4197      0.0      0.0              hdisk2     99      5.0      331     4197      0.0      0.0                 cd0      0      0.0        0        0      0.0      0.0 其中的%busy对应的% tm_act avque表示等待IO对列数,其值很高则预示着磁盘有较大瓶颈 r+w/s对应tps,blks/s是按0.5Kbytes/s计算的传输速度 sar -d 最大好处是可以对较长时间的值会有一个总体平均值

posted @ 2013-06-21 23:08  wilson.han  阅读(619)  评论(0编辑  收藏  举报