Fork me on GitHub

Linux中CPU、磁盘、网络监测命令

1.top命令
是常用来监控linux的系统状态,是常用的性能分析工具,能够实时显示系统中各个进程的资源占用情况。

可以使用 top 指令查出 JVM 中占用 CPU 过高的线程,通过 jstack 找到对应的线程代码调用,排查出问题代码。
jstack是 java stack(java堆栈)的缩写

top使用方式:
top [-d number] | top [-bnp]
参数解释:
-d: number代表秒数,表示top命令显示的页面更新一次的间隔。默认是5秒。-b:以批次的方式执行top。
-n:与-b配合使用,表示需要进行几次top命令的输出结果。-p:指定特定的pid进程号进行观察。
top -Hp 23344 H 查看线程信息 P 代表pid

使用后图示如下:

系统信息(前五行):

第1行:Top 任务队列信息(系统运行状态及平均负载),与uptime命令结果相同。 
    第1段:系统当前时间,例如:16:07:37
    第2段:系统运行时间,未重启的时间,时间越长系统越稳定。 
    格式:up xx days, HH:MM
    例如:241 days, 20:11, 表示连续运行了241天20小时11分钟
    第3段:当前登录用户数,例如:1 user,表示当前只有1个用户登录
    第4段:系统负载,即任务队列的平均长度,3个数值分别统计最近1,5,15分钟的系统平均负载 
    系统平均负载:单核CPU情况下,0.00 表示没有任何负荷,1.00表示刚好满负荷,超过1侧表示超负荷,理想值是0.7;
    多核CPU负载:CPU核数 * 理想值0.7 = 理想负荷,例如:4核CPU负载不超过2.8何表示没有出现高负载。
第2行:Tasks 进程相关信息 
    第1段:进程总数,例如:Tasks: 231 total, 表示总共运行231个进程
    第2段:正在运行的进程数,例如:1 running,
    第3段:睡眠的进程数,例如:230 sleeping,
    第4段:停止的进程数,例如:0 stopped,
    第5段:僵尸进程数,例如:0 zombie
第3行:Cpus CPU相关信息,如果是多核CPU,按数字1可显示各核CPU信息,此时1行将转为Cpu核数行,数字1可以来回切换。 
    第1段:us 用户空间占用CPU百分比,例如:Cpu(s): 12.7%us,
    第2段:sy 内核空间占用CPU百分比,例如:8.4%sy,
    第3段:ni 用户进程空间内改变过优先级的进程占用CPU百分比,例如:0.0%ni,
    第4段:id 空闲CPU百分比,例如:77.1%id,
    第5段:wa 等待输入输出的CPU时间百分比,例如:0.0%wa,
    第6段:hi CPU服务于硬件中断所耗费的时间总额,例如:0.0%hi,
    第7段:si CPU服务软中断所耗费的时间总额,例如:1.8%si,
    第8段:st Steal time 虚拟机被hypervisor偷去的CPU时间(如果当前处于一个hypervisor下的vm,实际上hypervisor也是要消耗一部分CPU处理时间的)
第4行:Mem 内存相关信息(Mem: 12196436k total, 12056552k used, 139884k free, 64564k buffers) 
    第1段:物理内存总量,例如:Mem: 12196436k total,
    第2段:使用的物理内存总量,例如:12056552k used,
    第3段:空闲内存总量,例如:Mem: 139884k free,
    第4段:用作内核缓存的内存量,例如:64564k buffers
 第5行:Swap 交换分区相关信息(Swap: 2097144k total, 151016k used, 1946128k free, 3120236k cached) 
    第1段:交换区总量,例如:Swap: 2097144k total,
    第2段:使用的交换区总量,例如:151016k used,
    第3段:空闲交换区总量,例如:1946128k free,
    第4段:缓冲的交换区总量,3120236k cached

在top命令中按f按可以查看显示的列信息,按对应字母来开启/关闭列,大写字母表示开启,小写字母表示关闭。带*号的是默认列。
(数据默认是按CPU使用总量进行排序)

A: PID = (Process Id) 进程Id;  (重点)
E: USER = (User Name) 进程所有者的用户名;
H: PR = (Priority) 优先级
I: NI = (Nice value) nice值。负值表示高优先级,正值表示低优先级
O: VIRT = (Virtual Image (kb)) 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES  (重点)
Q: RES = (Resident size (kb)) 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
T: SHR = (Shared Mem size (kb)) 共享内存大小,单位kb
W: S = (Process Status) 进程状态。D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程
K: %CPU = (CPU usage) 上次更新到现在的CPU时间占用百分比 (重点)
N: %MEM = (Memory usage (RES)) 进程使用的物理内存百分比  (重点)
M: TIME+ = (CPU Time, hundredths) 进程使用的CPU时间总计,单位1/100秒 
b: PPID = (Parent Process Pid) 父进程Id 
c: RUSER = (Real user name) 
d: UID = (User Id) 进程所有者的用户id 
f: GROUP = (Group Name) 进程所有者的组名 
g: TTY = (Controlling Tty) 启动进程的终端名。不是从终端启动的进程则显示为 ? 
j: P = (Last used cpu (SMP)) 最后使用的CPU,仅在多CPU环境下有意义 
p: SWAP = (Swapped size (kb)) 进程使用的虚拟内存中,被换出的大小,单位kb 
l: TIME = (CPU Time) 进程使用的CPU时间总计,单位秒 
r: CODE = (Code size (kb)) 可执行代码占用的物理内存大小,单位kb 
s: DATA = (Data+Stack size (kb)) 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb 
u: nFLT = (Page Fault count) 页面错误次数 
v: nDRT = (Dirty Pages count) 最后一次写入到现在,被修改过的页面数 
y: WCHAN = (Sleeping in Function) 若该进程在睡眠,则显示睡眠中的系统函数名 
z: Flags = (Task Flags <sched.h>) 任务标志,参考 sched.h
X: COMMAND = (Command name/line) 命令名/命令行

2.了解cpu的使用情况

vmstat

一般只看procs与cpu部分

procs:

  • r:运行和等待CPU时间片的进程数,一般来说整个系统的运行队列不要超过总核数的两倍,不然系统压力太大了。
  • b:等待资源的进程数,比如正在等待磁盘IO,网络IO等。
    cpu:
  • us:用户进程消耗CPU时间百分比,us值高的话,说明用户进程消耗CPU的时间比较长,如果长期大于50%的话,那就说明程序还有需要优化的地方。
  • sy:内核进程消耗的CPU时间百分比
  • us + sy参考值为80%,如果大于80%的话,说明可能存在CPU不足。

free
查看内存使用情况用free命令,它主要有三个命令,free、free -g、free -m,
推荐使用free -m,如果应用程序可用内存/系统物理内存大于70%的话,证明内存充足,
如果小于20%的话,就要考虑增加内存了。

df(disk free)
-h或--human-readable 以可读性较高的方式来显示信息。

查看磁盘空间用df 或者 df -h这两个命令。

iostat
查看磁盘io情况使用iostat,如果提示:-bash:iostat:command not found,
那是因为没有安装sysstat,安装一下就可以了:yum install -y sysstat
接下来运行命令:iostat -xdk 3 2,和vmstat命令很像。

只需要看这些指标就行了:

  • rkb/s 每秒读取数据量kb;
  • wkb/s: 每秒写入数据量kb;
  • svctm:I/O请求的平均服务时间,单位毫秒;
  • util:一秒中有百分之几的时间用于I/O操作,如果接近100%说明磁盘带宽跑满了,这个时间就要优化程序或者增加磁盘了。

网络IO命令:sar
通过sar -n DEV 3 2来查看

  • IFACE:LAN接口
  • rxpck/s:每秒钟接收的数据包
  • txpck/s:每秒钟发送的数据包
  • rxKB/s:每秒接收的数据量,单位KByte
  • txKB/s:每秒发出的数据量,单位KByte
  • rxcmp/s:每秒钟发送的压缩数据包
  • txcmp/s:每秒钟发送的压缩数据包
  • rxmcst/s:每秒钟接收的多播数据包

ps
显示进程信息

netstat
显示网络情况

posted @   三脚半猫  阅读(215)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示