linux系统调优工具

系统调优思路
性能优化就是找到系统处理中的瓶颈以及去除这些的过程,性能优化其实是对 OS 各子系统达到一种平衡的定义。具体步骤如下:
    1. 系统的运行状况: CPU -> MEM -> DISK-> NETWORK -> application
    2. 分析是否有瓶颈(依据当前应用需求)
    3. 调优(采取一定措施使变得优异)
    这些子系统之间关系是相互彼此依赖的,任何一个高负载都会导致其他子系统出现问题.比如:
    大量的网页调入请求导致内存队列的拥塞;
    网卡的大吞吐量可能导致更多的 CPU 开销;
    大量的 CPU 开销又会尝试更多的内存使用请求;
    大量来自内存的磁盘写请求可能导致更多的 CPU 以及 IO 问题;
    所以要对一个系统进行优化,查找瓶颈来自哪个方面是关键,虽然看似是某一个子系统出现问题,其实有
    可能是别的子系统导致的。调优就像医生看病,因此需要你对服务器所有地方都了解清楚。
1. 查看 CPU 负载相关工具
    uptime 
    12:38:33 当前时间
    up 50days 系统运行时间 ,说明此服务器连续运行 50 天了
    3 user 当前登录用户数
    load average: 0.06, 0.60, 0.48 系统负载,即任务队列的平均长度。 三个数值分别为 1 分钟、5 分钟、15 分钟前到现在的平均值。

2. 找出系统中使用 CPU 最多的进程
    运行 top 命令,按下大写的 P,可以按 CPU 使用率来排序显示
    ps -aux --sort -pcpu | more #按 cpu 降序排序
    查看CPU信息
     cat /proc/cpuinfo
    VIRT:virtual memory usage 虚拟内存
    1、进程“需要的”虚拟内存大小,包括进程使用的库、代码、数据等; 
    2、假如进程申请 100m 的内存,但实际只使用了 10m,那么它会增长 100m,而不是实际的使用量。
    RES:resident memory usage 常驻内存
    1、进程当前使用的内存大小,但不包括 swap out;
    2、包含其他进程的共享; 
    3、如果申请 100m 的内存,实际使用 10m,它只增长 10m,与 VIRT 相反; 
    4、关于库占用内存的情况,它只统计加载的库文件所占内存大小。
    SHR:shared memory 共享内存
    1、除了自身进程的共享内存,也包括其他进程的共享内存; 
    2、虽然进程只使用了几个共享库的函数,但它包含了整个共享库的大小; 
    3、计算某个进程所占的物理内存大小公式:RES – SHR;
    PR:任务调度优先级
    NI:进程优先级
 
3. 使用 mpstat 查看 CPU 运行情况
    yum install -y sysstat
    mpstat
    每列参数说明
    usr:用户空间 CPU 使用占比。
    nice:低优先级进程使用 CPU 占比。nice 值大于 0。
    sys:内核空间 CPU 使用占比。
    iowait:CPU 等待 IO 占比。
    irq:CPU 处理硬中断占比。
    soft:CPU 处理软中断占比。
    idle:CPU 空闲时间占比。
    guest 与 steal 与虚拟机有关
     mpstat -P ALL #查看所有 CPU 运行状态

 

4. 查看 Memory 运行状态相关工具
    free -m/-h
    cat /proc/meminfo
    运行 top,然后按下大写的 M 可以按内存使用率来排序显示

  

5. 查看 IO 运行状态相关工具
    ext4 文件系统,查看文件系统块大小
    tune2fs -l /dev/sda1 | grep size

     xfs 文件系统,查看文件系统块大小
     xfs_growfs -l /dev/sda1 |grep bsize

6. 找出系统中对磁盘读写最多的进程
     iostat -d -k -p /dev/sda
     iostat 2 5
    kB_read/s 每秒从磁盘读入的数据量,单位为K.
    kB_wrtn/s 每秒向磁盘写入的数据量,单位为K.
    kB_read 读入的数据总量,单位为K.
    kB_wrtn 写入的数据总量,单位为K
    
    iotop:
    yum install -y iotop
    -o, -only 只显示在读写硬盘的程序
    -d SEC, -delay=SEC 设定显示时间间隔。 刷新时间
    iotop 常用快捷键:
    <- / ->:左右箭头:改变排序方式,默认是按 IO 排序。
    r:改变排序顺序。
    o:只显示有 IO 输出的进程。
    p:进程/线程的显示方式的切换。
    a:显示累积使用量。
    q:退出,按 q 或 ctrl+C
     iotop -o -d 1 #显示正在使用磁盘的进程

  

7.查看 Network 运行状态相关工具
    yum install epel-release -y
    yum install nload -y
    nload #开始监控
    安装ab命令
    yum install -y httpd
    ab -n 1000 -c 2 http://www.baidu.com/index.html #产生一些测试
数据
    
8.使用nethogs找出使用带宽最多的进程
    nethogs-0.8.5-1.el7.x86_64.rpm 程序包下载:
     wget 
http://dl.fedoraproject.org/pub/epel/7/x86_64/Packages/n/nethogs-0.8.5-1.el7.x86_64.rpm
    rpm -ivh nethogs-0.8.5-1.el7.x86_64.rpm
    nethogs开始监控
    

  

9. 查看系统整体运行状态
    vmstat:命令是最常见的Linux/Unix监控工具,可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率,MEM内存使用,VMSwap虚拟内存交换情况,IO读写情况
    每一列参数作用:r 运行状态的进程个数。展示了正在执行和等待cpu资源的任务个数。当这个值超过了cpu个数,就会出现cpu瓶颈。
    b 不可中断睡眠正在进行i/o等待--阻塞状态的进程个数进程读取外设上的数据,等待时
    ree   剩余内存,单位是K
    Bbuffers#内存从磁盘读出的内容
    cached#内存需要写入磁盘的内容
    si  swapin   swap换入到内存
    so swapout  内存换出到swap   换出的越多,内存越不够用
    bi  blockin 从硬盘往内存读。单位是块。把磁盘中的数据读入内存
    bo blockout从内存拿出到硬盘(周期性的有值)写到硬盘#判断是读多还是写多,是否有i/o瓶颈
    in 系统的中断次数,cpu调度的次数多
    cs 每秒的上下文切换速度
    CPU上下文切换--程序在运行的时候,CPU对每个程序切换的过程。

  

10. 使用sar命令记录系统一段时间的运行状态
    安装:yum -y install sysstat
    sysstat 工具包可以把检查到的信息保存下来,存在/var/log/sa目录下。sar 默认显示每10分钟统计一次状态信息(从装sysstat包开始)
    sar 命令行的常用格式:sar [options] [-A] [-ofile] t [n]在命令行中,n 和t 两个参数组合起来定义采样间隔和次数,t为采样间隔,是必须有的参数,n为采样次数,是可选的,默认值是1,-o file表示将命令结果以二进制格式存放在文件中,file 在此处不是关键字,是文件名。options 为命令行选项,sar命令的选项很多,下面只列出常用选项:
    下面只列出常用选项:
    -A:所有报告的总和。
    -n:网络接口的情况。 sar -n DEV
    -u:CPU利用率
    -v:进程、I节点、文件和锁表状态。
    -d:硬盘使用报告。
    -r:没有使用的内存页面和硬盘块。
    -g:串口I/O的情况。
    -b:缓冲区使用情况。
    -a:文件读写情况。
    -c:系统调用情况。
    -R:进程的活动情况。
    -y:终端设备活动情况。
    -w:系统交换活动。
    -o 文件名:打印到屏幕并将采样结果以二进制形式存入当前目录下的文件中。
    -f 文件名:查看之前保存的二进制文件。
    -d:显示磁盘。-d 1 100 #必须得指定次数。-c:每秒创建进程的个数。
    -i 1 10 #指定时间间隔。
    -P:查看cpu。
    -r:查看内存。
    -w:每秒上下文切换次数。
    sar -u 2 5 -o cpu.sar#屏幕显示以一下内容,同时内容也会写到当前目录的./cpu.sar中
    在显示内容包括:%usr:CPU处在用户模式下的时间百分比。
    %sys:CPU处在系统模式下的时间百分比。
    %wio:CPU等待输入输出完成时间的百分比。
    %idle:CPU空闲时间百分比。
    在所有的显示中,我们应主要注意%wio和%idle,%wio的值过高,表示硬盘存在I/O瓶颈,%idle 值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。
    使用参数-n查看网络接口流量情况:sar -n DEV 1 10 -o net.sar 
     sar -n DEV -f  /var/log/sa/sa04 #查看网络相关信息。
    sar -r -f  /var/log/sa/sa15 -r 查看内存
    sar -d -f /var/log/sa/sa16  -d:磁盘使用报告
    sar 最大特点是可以监控所有状态,sar 的其他使用方法如下:
    sar -r 1 #查看内存
    sar -n ALL #查看所有
    sar -b 1 10 #缓冲区使用情况,每秒刷新一次,查看 10 次
    sar -I ALL 1 10
    sar -r -f /tmp/file -n -r -b -m
    sar -s 15:00:00 -e 15:30:00 #查看某个时间段,系统运行情况
    sar -s 15:00:00 -e 15:30:20 -f /var/log/sa/sa01
    sar -r -s 15:00:00 -e 15:30:20 -f /var/log/sa/sa01

  

  

  

posted @ 2020-04-15 17:50  MlxgzZ  阅读(241)  评论(0编辑  收藏  举报