服务器性能瓶颈分析方法

1. 内存分析方法

  • 内存分析用于判断系统有无内存瓶颈,是否需要通过增加内存等手段提高系统性能表现。
  • 内存分析需要使用的计数器:Memory类别和Physical Disk类别的计数器。内存分析的主要方法和步骤:

(1)首先查看Memory\Available Mbytes指标
如果该指标的数据比较小,系统可能出现了内存方面的问题,需要继续下面步骤进一步分析。
注:在UNIX/LINUX中,对应指标是FREE(KB)

(2)注意Pages/sec、Pages Read/sec和Page Faults/sec的值
操作系统会利用磁盘较好的方式提高系统可用内存量或者提高内存的使用效率。这三个指标直接反应了操作系统进行磁盘交换的频度。
如果Pages/sec的计数持续高于几百,可能有内存问题。但Pages/sec值不一定就表明有内存问题,可能是运行使用内存映射文件的程序所致。Page Faults/sec说明每秒发生页面失效次数,页面失效次数越多,说明操作系统向内存读取的次数越多。此事需要查看Pages Read/sec的计数值,该计数器的阀值为5,如果计数值超过5,则可以判断存在内存方面的问题。
注:在UNIX/LINUX系统中,对于指标是(page)si和(page)so.

(3)根据Physical Disk计数器的值分析性能瓶颈
对Physical Disk计数器的分析包括对Page Reads/sec和%Disk Time及Aerage Disk Queue Length的分析。如果Pages Read/sec很低,同时%Disk Time和Average Disk Queue Length的值很高,则可能有磁盘瓶颈。但是,如果队列长度增加的同时Pages Read/sec并未降低,则是内存不足。
注:在 UNIX/LINUX系统中,对应的指标是Reads(Writes)per sec、Percent of time the disk is busy和Average number of transactions waiting for service.

 

--------------------------------------------------------------------------

 

2.处理器分析法

(1)首先看System\%Total Processor Time 性能计数器的计数值
该计数器的值体现服务器整体处理器利用率,对多处理器的系统而言,该计数器提醒所有CPU的平均利用率。如果该值持续超过90%,则说明整个系统面临着处理器方面的瓶颈,需要通过增加处理器来提高性能。
注:多处理器系统中,该数据本身不大,但PUT直接负载状况极不均衡,也应该视作系统产生处理器方面瓶颈。

(2)其次查看每个CPU的Processor\%Processor Time 和 Processor\%User Time 和 Processor\%Privileged Time
Processor\%User Time 是系统非核心操作消耗的CPU时间,如果该值较大,可以考虑是否能通过友好算法等方法降低这个值。如果该服务器是数据库服务器, Processor\%User Time 值大的原因很可能是数据库的排序或是函数操作消耗了过多的CPU时间,此时可以考虑对数据库系统进行优化。

(3)研究系统处理器瓶颈
查看 System\Processor Queue Length 计数器的值,当该计数器的值大于CPU数量的总数+1时,说明产生了处理器阻塞。在处理器的%Process Time很高时,一般都随处理器阻塞,但产生处理器阻塞时,Processor\%Process Time 计数器的值并不一定很大,此时就必须查找处理器阻塞的原因。
%DOC Time 是另一个需要关注的内容,该计数器越低越好。在多处理器系统中,如果这个值大于50%,并且Processor\%Precessor Time非常高,加入一个网卡可能回提高性能。

 

--------------------------------------------------------------------------

 

3.磁盘I/O分析方法

(1)计算梅磁盘的I/O数
每磁盘的I/O数可用来与磁盘的I/O能力进行对比,如果经过计算得到的每磁盘I/O数超过了磁盘标称的I/O能力,则说明确实存在磁盘的性能瓶颈。
每磁盘I/O计算方法
RAID0计算方法:(Reads +Writes)/Number of Disks
RAID0计算方法:(Reads +2*Writes)/2
RAID0计算方法:[Reads +(4*Writes)]/Number of Disks
RAID0计算方法:[Reads +(2*Writes)]/Number of Disks

(2)与Processor\Privileged Time 合并进行分析
如果在Physical Disk 计数器中,只有%Disk Time 比较大,其他值都比较适中,硬盘可能会是瓶颈。若几个值都比较大,且数值持续超过80%,则可能是内存泄漏。

(3)根据Disk sec/Transfer进行分析
一般来说,定义该数值小于15ms为Excellent,介于15~30ms之间为良好,30~60ms之间为可以接受,超过60ms则需要考虑更换硬盘或是硬盘的RAID方式了。

 

--------------------------------------------------------------------------

 

4.进程分析方法

(1)查看进程的%Processor Time值
每个进程的%Processor Time反映进程所消耗的处理器时间。用不同进程所消耗的处理器时间进行对比,可以看出具体哪个进程在性能测试过程中消耗了最多的处理器时间,从而可以据此针对应用进行优化。

(2)查看每个进程产生的页面失效
可以用每个进程产生的页面失效(通过PRCESS\PAGE FAILURES/SEC计数器获得)和系统页面失效(可以通过MEMORY\PAGE FAILURES/SEC计数器获得)的比值,来判断哪个进程产生了最多的页面失效,这个进程要么是需要大量内存的进程,要么是非常活跃的进程,可以对其进行重点分析。

(3)了解进程的Process/Private Bytes
Process/Private Bytes是指进程所分配的无法与其他进程共享的当前字节数量。该计数器主要用来判断进程在性能测试过程中有无内存泄漏。例如:对于一个IIS之上的 WEB应用,我们可以重点监控inetinfo进程的Private Bytes,如果在性能测试过程中,该进程的Private Bytes计数器值不断增加,或是性能测试停止后一段时间,该进程的Private Bytes仍然持续在高水平,则说明应用存在内存泄漏。
注:在UNIX/LINUX系统中,对应的指标是Resident Size

 

--------------------------------------------------------------------------

 

5.网络分析方法

(1)Network Interface\Bytes Total/sec为发送和接收字节的速率,可以通过该计数器值来判断网络链接速度是否是瓶颈,具体操作方法是用该计数器的值和目前网络的带宽进行相除,结果小于50%。
1Mdit/sec(兆比特/秒)=131072bytes/sec(字节/秒)
1byte=8bit
IOMeter安装、配置
IOMeter是业界广泛使用的IO性能测试软件。通过使用不同的IOMeter设定值来呈现文件服务器(选择范围为512Bytes到64KB)和网站服务器(选择512Bytes到512KB作为I/O范围)的相应负载。

在实际测试过程中可以使用IOMeter进行如下测量:

Max IO:
为了得到完整的磁盘性能数据,可以测试512Bytes到512MBytes等多种数据块大小,并分别测试了100%读取操作或100%写入操作下的表现,测试随机率可以从0%-100%,用于检测磁盘子系统的最大输入输出能力。从所有的数据中,可以分别得到的数据指IOps(每秒操作数)以及MBps(传输速率)。

File Server:
文件服务器应用在一个多用户或网络化的环境中专门用于文件的储存,恢复和管理。不同用户的访问形成了多线程,因此,其工作负载是随机性的。输入输出大小是可变的,取决于所操作的文件大小。读/写分布也是变化的。总的来说,一个频繁使用的多用户服务器应该采用较高的队列深度来模拟。

Web Server:
网站服务器应用于处理多用户通过Internet或Intranet进行的访问。这些请求具有典型的随机性,并且在用户访问不同页面或视频应用时大量偏向于读请求。同样,一个访问频繁网站服务器也应该采用较高的队列深度来模拟。最后,测试读取尺寸从512Bytes到512KB不等,100%读取操作,随机率为100%,用于模拟Web服务器的性能。在实际的桌面环境中,小于4KB的块访问数量不少,但是由于操作系统的缓存的存在而具有一定的降低,主要的块大小基于4KB。

IOMeter硬盘性能测试对CPU、内存等参数并不是很敏感——当然CPU要保证在测试中不能出现100%的占用率。

posted @ 2017-01-24 15:10  牧师/preacher  阅读(2354)  评论(0编辑  收藏  举报