GrandOB

进程以及其有关命令

程序

什么是程序?

  • 是一组计算机能识别和执行的指令,运行于电子计算机上,满足人们某种需求的信息化工具
  • 用于描述进程要完成的功能,是控制进程执行的指令集

进程

什么是进程

运行中的程序的一个副本,是被载入内存的一个指令集合,是资源分配的单位,

  • 进程ID(Process ID,PID)号码被用来标记各个进程
  • UID、GID语境决定对文件系统的存取和访问权限
  • 通常从执行进程的用户来继承
  • 存在生命周期
  • 都由其父进程创建

进程创建:

  • init:第一个进程,从 CentOS7 以后为systemd

  • 进程:都由其父进程创建,fork(),父子关系,CoW:Copy On Write 写实更新,有数据写入子进程需要新的内存空间

    进程具有的特征:

  • 动态性:进程是程序的一次执行过程,是临时的,有生命期的,是动态产生,动态消亡的;

  • 并发性:任何进程都可以同其他进程一起并发执行;

  • 独立性:进程是系统进行资源分配和调度的一个独立单位;

  • 结构性:进程由程序、数据和进程控制块三部分组成。

进程与线程的区别

线程是程序执行的最小单位,而进程是操作系统分配资源的最小单位

如何确定一个程序 是多线程 还是 单线程?
pstree
[root@localhost opt]# pstree -p |grep polkitd ----总共6线程
           |-polkitd(797)-+-{polkitd}(824)
           |              |-{polkitd}(827)
           |              |-{polkitd}(836)
           |              |-{polkitd}(838)
           |              `-{polkitd}(847)
grep -i threads /proc/进程的PID/status
[root@localhost opt]# grep -i threads /proc/797/status
Threads:	6
prtstat 进程pid号
[root@localhost opt]# prtstat 797
Process: polkitd       		State: S (sleeping)
  CPU#:  0  		TTY: 0:0	Threads: 6
Process, Group and Session IDs
  Process ID: 797		  Parent ID: 1
    Group ID: 797		 Session ID: 797
  T Group ID: -1

Page Faults
  This Process    (minor major):    17484        50
  Child Processes (minor major):    96259         1
CPU Times
  This Process    (user system guest blkio):   0.38   1.10   0.00   0.04
  Child processes (user system guest):         0.45   0.93   0.00
Memory
  Vsize:       551 MB    
  RSS:         12 MB      		 RSS Limit: 18446744073709 MB
  Code Start:  0x560d7a88c000		 Code Stop:  0x560d7a8a61fc
  Stack Start: 0x7ffd0d318c80
  Stack Pointer (ESP): 0x7ffd0d318ab0	 Inst Pointer (EIP): 0x7ff17f7b2a3d
Scheduling
  Policy: normal
  Nice:   0 		 RT Priority: 0 (non RT)

进程更多的状态

  • 运行态:running
  • 就绪态:ready
  • 睡眠态:分为两种,可中断:interruptable,不可中断:uninterruptable
  • 停止态:stopped,暂停于内存,但不会被调度,除非手动启动
  • 僵死态:zombie,僵尸态,结束进程,父进程结束前,子进程不关闭,杀死父进程可以关闭僵死态 的子进程

进程结束父进程会回收子进程的硬件资源, 子进程如果出现意外关闭, 父进程无感知就不会收回资源,这个人为关闭父进程, 资源不会回收产生僵尸进程

范例:僵尸态

[root@localhost ~]# bash
[root@localhost ~]# pstree -p |grep bash
           |-gnome-terminal-(14092)-+-bash(14105)
           |-sshd(1138)-+-sshd(53996)---bash(54000)---bash(54069)-+-grep(54157)
           |            `-sshd(54115)---bash(54119)

[root@localhost ~]# kill -19 54000 ----停止父进程
[root@localhost ~]# kill -9 54069 ----关闭子进程
[root@localhost ~]# ps aux |grep -v grep |grep Z ----筛选僵尸进程(54069变成了僵尸进程)
USER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root      54069  0.0  0.0      0     0 pts/2    Z+   17:21   0:00 [bash] <defunct>

恢复父进程消除僵尸进程

[root@localhost ~]# kill -18 54000
[root@localhost ~]# ps aux |grep -v grep |grep Z
USER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND

关闭父进程消除僵尸进程

[root@localhost ~]# kill -9 54000
[root@localhost ~]# ps aux |grep -v grep |grep Z
USER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND

进程使用内存的问题

内存泄漏:Memory Leak

指程序中用malloc或new申请了一块内存,但是没有用free或delete将内存释放,导致这块内存一直处于占用状态

内存溢出:Memory Overflow

指程序申请了10M的空间,但是在这个空间写入10M以上字节的数据,就是溢出,类似红杏出墙

内存不足:OOM

OOM 即 Out Of Memory,“内存用完了”,在情况在java程序中比较常见。系统会选一个进程将之杀死,在日志messages中看到类似下面的提示

ps

ps 即 process state,可以查看进程当前状态的快照,默认显示当前终端中的进程,Linux系统各进程的相关信息均保存在/proc/数字目录/status 下的文件中

支持三种选项:

  • UNIX选项 如: -A -e
  • GNU选项 如: --help
  • BSD选项 如: a

查看静态的进程统计信息

  • "ps aux" 可以查看系统中所有的进程;
  • "ps -le" 可以查看系统中所有的进程,而且还能看到进程的父进程的 PID 和进程优先级;
  • "ps -l" 只能看到当前 Shell 产生的进程;

常用选项

  • a:显示当前终端下的所有进程信息,包括其他用户的进程。与“x”选项结合时将示系统中所有的进程信息。
  • u:使用以用户为主的格式输出进程信息。
  • x:显示当前用户在所有终端下的进程信息。
  • -e:显示系统内的所有进程信息。
  • -l:使用长(Long)格式显示进程信息。
  • -f:使用完整的(Full)格式显示进程信
  • k|--sort 属性 对属性排序,属性前加 - 表示倒序 ps aux k -%cpu
  • o 属性… 选项显示定制的信息 pid、cmd、%cpu、%mem

ps 输出属性

C :  ps -ef 显示列 C 表示cpu利用率
VSZ: Virtual memory SiZe,虚拟内存集,线性内存
RSS: ReSident Size, 常驻内存集
STAT:进程状态
 R:running
 S: interruptable sleeping
 D: uninterruptable sleeping
 T: stopped
 Z: zombie
 +: 前台进程
 l: 多线程进程
 L:内存分页并带锁
 N:低优先级进程
 <: 高优先级进程
 s: session leader,会话(子进程)发起者
 I:Idle kernel thread,CentOS 8 新特性
ni: nice值
pri: priority 优先级
rtprio: 实时优先级
psr: processor CPU编号


ps axo pid,cmd,psr,ni,pri,rtprio
选项实例
ps  a
ps -a   
#风格不同  显示结果不同

ps  
#显示当前终端中的进程
ps  a    
#看到所有


ps ax
#终端有关或无关的进程

ps  aux
#u和用户有关等详细信息
ps aux表头含义
[root@localhost opt]# ps aux
USER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root          1  0.0  0.3 193700  6824 ?        Ss   14:08   0:02 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root          2  0.0  0.0      0     0 ?        S    14:08   0:00 [kthreadd]
表头 含义
USER 该进程是由哪个用户产生的。
PID 进程的 ID。
%CPU 该进程占用 CPU 资源的百分比,占用的百分比越高,进程越耗费资源。
%MEM 该进程占用物理内存的百分比,占用的百分比越高,进程越耗费资源。
VSZ 该进程占用虚拟内存的大小,单位为 KB。
RSS 该进程占用实际物理内存的大小,单位为 KB。
TTY 该进程是在哪个终端运行的。其中,tty1 ~ tty7 代表本地控制台终端(可以通过 Alt+F1 ~ F7 快捷键切换不同的终端),tty1~tty6 是本地的字符界面终端,tty7 是图形终端。pts/0 ~ 255 代表虚拟终端,一般是远程连接的终端,第一个远程连接占用 pts/0,第二个远程连接占用 pts/1,依次増长。?代表和终端无关,系统进程
STAT 进程状态。常见的状态有以下几种: -D:不可被唤醒的睡眠状态,通常用于 I/O 情况。
-R:该进程正在运行。
-S:该进程处于睡眠状态,可被唤醒。
-T:停止状态,可能是在后台暂停或进程处于除错状态。
-W:内存交互状态(从 2.6 内核开始无效)。
-X:死掉的进程(应该不会出现)。
-Z:僵尸进程。进程已经中止,但是还是占用硬件资源。
-<:高优先级(以下状态在 BSD 格式中出现)。
-N:低优先级。
-L:被锁入内存。
-s:包含子进程。
-l:多线程(小写 L)。
-+:位于后台。
START 该进程的启动时间。
TIME 该进程占用 CPU 的运算时间,注意不是系统时间。
COMMAND 产生此进程的命令名。
ps -ef 命令输出信息
[root@localhost ~]# ps -ef
UID         PID   PPID  C STIME TTY          TIME CMD
root          1      0  0 16:00 ?        00:00:07 /usr/lib/systemd/systemd --switched-roo
root          2      0  0 16:00 ?        00:00:00 [kthreadd]
表头 含义
F 进程标志,说明进程的权限,常见的标志有两个: 1:进程可以被复制,但是不能被执行;4:进程使用超级用户权限;
S 进程状态。具体的状态和"psaux"命令中的 STAT 状态一致;
UID 运行此进程的用户的 ID;
PID 进程的 ID;
PPID 父进程的 ID;
C 该进程的 CPU 使用率,单位是百分比;
PRI 进程的优先级,数值越小,该进程的优先级越高,越早被 CPU 执行;系统定义不可以人为修改
NI 进程的优先级,数值越小,该进程越早被执行;可以人为修改
ADDR 该进程在内存的哪个位置;
SZ 该进程占用多大内存;
WCHAN 该进程是否运行。"-"代表正在运行;
TTY 该进程由哪个终端产生;
TIME 该进程占用 CPU 的运算时间,注意不是系统时间;
CMD 产生此进程的命令名;

找到未知进程的执行程序文件路径

[root@localhost opt]# ps aux k -%cpu |head ----查看CPU占用最高的10个进程
USER        PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root        840  0.1  0.3 231564  6272 ?        Ss   14:08   0:16 /usr/bin/vmtoolsd
root          1  0.0  0.3 193700  6824 ?        Ss   14:08   0:02 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root          2  0.0  0.0      0     0 ?        S    14:08   0:00 [kthreadd]
root          3  0.0  0.0      0     0 ?        S    14:08   0:00 [ksoftirqd/0]
root          5  0.0  0.0      0     0 ?        S<   14:08   0:00 [kworker/0:0H]
root          7  0.0  0.0      0     0 ?        S    14:08   0:00 [migration/0]
root          8  0.0  0.0      0     0 ?        S    14:08   0:00 [rcu_bh]
root          9  0.0  0.0      0     0 ?        S    14:08   0:03 [rcu_sched]
root         10  0.0  0.0      0     0 ?        S    14:08   0:00 [watchdog/0]

[root@localhost opt]# ll /proc/840/exe ----查看程序实际位置
lrwxrwxrwx. 1 root root 0 4月  16 14:09 /proc/840/exe -> /usr/bin/vmtoolsd


遏制异常文件
建立同名文件并锁定它
[root@localhost ~]#touch a;chattr +i  a

查看进程信息 prtstat

[root@localhost opt]# prtstat 840
Process: vmtoolsd      		State: S (sleeping)
  CPU#:  1  		TTY: 0:0	Threads: 1
Process, Group and Session IDs
  Process ID: 840		  Parent ID: 1
    Group ID: 840		 Session ID: 840
  T Group ID: -1

Page Faults
  This Process    (minor major):    13471        28
  Child Processes (minor major):      653         0
CPU Times
  This Process    (user system guest blkio):   7.70   9.25   0.00   0.02
  Child processes (user system guest):         0.00   0.00   0.00
Memory
  Vsize:       237 MB    
  RSS:         6422 kB    		 RSS Limit: 18446744073709 MB
  Code Start:  0x5604caef0000		 Code Stop:  0x5604caefa03c
  Stack Start: 0x7fff96dd8f60
  Stack Pointer (ESP): 0x7fff96dd8d88	 Inst Pointer (EIP): 0x7f804b8c9a20
Scheduling
  Policy: normal
  Nice:   0 		 RT Priority: 0 (non RT)

top

ps 命令可以一次性给出当前系统中进程状态,但使用此方式得到的信息缺乏时效性,并且,如果管理员需要实时监控进程运行情况,就必须不停地执行 ps 命令,这显然是缺乏效率的。

为此,Linux 提供了 top 命令。top 命令可以动态地持续监听进程地运行状态,与此同时,该命令还提供了一个交互界面,用户可以根据需要,人性化地定制自己的输出,进而更清楚地了进程的运行状态。

选项:

  • -d 秒数:指定 top 命令每隔几秒更新。默认是 3 秒;
  • -b:使用批处理模式输出。一般和"-n"选项合用,用于把 top 命令重定向到文件中;
  • -n 次数:指定 top 命令执行的次数。一般和"-"选项合用;
  • -p 进程PID:仅查看指定 ID 的进程;
  • -s:使 top 命令在安全模式中运行,避免在交互模式中出现错误;
  • -u 用户名:只监听某个用户的进程;

在 top 命令的显示窗口中,还可以使用如下按键,进行一下交互操作

  • ? 或 h:显示交互模式的帮助;
  • c:按照 CPU 的使用率排序,默认就是此选项;
  • M:按照内存的使用率排序;
  • N:按照 PID 排序;
  • T:按照 CPU 的累积运算时间排序,也就是按照 TIME+ 项排序;
  • k:按照 PID 给予某个进程一个信号。一般用于中止某个进程,信号 9 是强制中止的信号;
  • r:按照 PID 给某个进程重设优先级(Nice)值;
  • q:退出 top 命令;

首部信息显示:

uptime信息:l命令

tasks及cpu信息:t命令

cpu分别显示:1 (数字)

memory信息:m命令

退出命令:q

修改刷新时间间隔:s

终止指定进程:k

保存文件:W

top 命令的输出内容是动态的,默认每隔 3 秒刷新一次。命令的输出主要分为两部分:

  1. 第一部分是前五行,显示的是整个系统的资源使用状况,我们就是通过这些输出来判断服务器的资源使用状态的;
  2. 第二部分从第六行开始,显示的是系统中进程的信息;

第一部分

top - 10:06:37 up 5:36, 3 users, load average: 0.00, 0.01, 0.05
Tasks: 204 total, 1 running, 202 sleeping, 1 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1867048 total, 74348 free, 755112 used, 1037588 buff/cache
KiB Swap: 4194300 total, 4191856 free, 2444 used. 878688 avail Mem

第一行为任务队列信息,具体内容如表 所示。

内 容 说 明
12:26:46 系统当前时间
up 1 day, 13:32 系统的运行时间.本机己经运行 1 天 13 小时 32 分钟
2 users 当前登录了两个用户
load average: 0.00,0.00,0.00 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数)

第二行为进程信息,具体内容如表

内 容 说 明
Tasks: 95 total 系统中的进程总数
1 running 正在运行的进程数
94 sleeping 睡眠的进程数
0 stopped 正在停止的进程数
0 zombie 僵尸进程数。如果不是 0,则需要手工检查僵尸进程

第三行为 CPU 信息,具体内容如表

内 容 说 明
Cpu(s): 0.1 %us 用户模式占用的 CPU 百分比 个人用户开启的进程占用的 cpu 率
0.1%sy 系统模式占用的 CPU 百分比
0.0%ni 改变过优先级的用户进程占用的 CPU 百分比
99.7%id 空闲 CPU 占用的 CPU 百分比
0.1%wa 等待输入/输出的进程占用的 CPU 百分比 1
0.0%hi 硬中断请求服务占用的 CPU 百分比
0.1%si 软中断请求服务占用的 CPU 百分比
0.0%st st(steal time)意为虚拟程序占用 cpu 时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比

第四行为物理内存信息,具体内容如表buff cache

内 容 说 明
Mem: 625344k total 物理内存的总量,单位为KB
571504k used 己经使用的物理内存数量
53840k&ee 空闲的物理内存数量。我们使用的是虚拟机,共分配了 628MB内存,所以只有53MB的空闲内存
65800k buffers 作为缓冲的内存数量

第五行为交换分区(swap)信息,如表

内 容 说 明
Swap: 524280k total 交换分区(虚拟内存)的总大小
Ok used 已经使用的交换分区的大小
524280k free 空闲交换分区的大小
409280k cached 作为缓存的交换分区的大小

通过 top 命令的第一部分就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于 1,则证明系统压力较大。如果 CPU 的使用率过高或空闲率过低,则证明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大。

这时,我们就应该判断是什么进程占用了系统资源。如果是不必要的进程,就应该结束这些进程;如果是必需进程,那么我们该増加服务器资源(比如増加虚拟机内存),或者建立集群服务器。

缓冲(buffer)和缓存(cache)的区别:

  • 缓存(cache)是在读取硬盘中的数据时,把最常用的数据保存在内存的缓存区中,再次读取该数据时,就不去硬盘中读取了,而在缓存中读取。
  • 缓冲(buffer)是在向硬盘写入数据时,先把数据放入缓冲区,然后再一起向硬盘写入,把分散的写操作集中进行,减少磁盘碎片和硬盘的反复寻道,从而提高系统性能。

简单来说,缓存(cache)是用来加速数据从硬盘中"读取"的,而缓冲(buffer)是用来加速数据"写入"硬盘的。

第二部分

top 命令的第二部分输出,主要是系统进程信息,各个字段的含义如下:

  • PID:进程的 ID。
  • USER:该进程所属的用户。
  • PR:优先级,数值越小优先级越高。
  • NI:优先级,数值越小、优先级越高。
  • VIRT:该进程使用的虚拟内存的大小,单位为 KB。
  • RES:该进程使用的物理内存的大小,单位为 KB。
  • SHR:共享内存大小,单位为 KB。
  • S:进程状态。
  • %CPU:该进程占用 CPU 的百分比。
  • %MEM:该进程占用内存的百分比。
  • TIME+:该进程共占用的 CPU 时间。
  • COMMAND:进程的命令名。
排序:
P:以占据的CPU百分比,%CPU
M:占据内存百分比,%MEM
T:累积占据CPU时长,TIME+
首部信息显示:
uptime信息:l命令
tasks及cpu信息:t命令
cpu分别显示:1 (数字)
memory信息:m命令
退出命令:q
修改刷新时间间隔:s
终止指定进程:k
保存文件:W

[root@localhost opt]# top
top - 18:58:09 up  4:50,  1 user,  load average: 0.00, 0.01, 0.05
Tasks: 165 total,   1 running, 164 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.0 us,  0.0 sy,  0.0 ni,100.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  1867048 total,   514788 free,   303812 used,  1048448 buff/cache
KiB Swap:  4194300 total,  4194300 free,        0 used.  1330052 avail Mem 


top命令栏位信息简介
us:用户空间
sy:内核空间
ni:调整nice时间
id:空闲
wa:等待IO时间
hi:硬中断
si:软中断(模式切换)
st:虚拟机偷走的时间


top选项:
-d # 指定刷新时间间隔,默认为3秒
-b 全部显示所有进程
-n # 刷新多少次后退出


htop  

htop

下载htop的包

https://dl.fedoraproject.org/pub/epel/7/x86_64/Packages/h/htop-2.2.0-3.el7.x86_64.rpm

pgrep

查看指定的进程

  • -U 指定用户
  • -l: 显示进程名
  • -a: 显示完整格式的进程名
  • -P pid: 显示指定进程的子进程
[root@test ~]# pgrep -l "log"
# 显示进程名
435 xfs-log/dm-0
713 xfs-log/sda1
790 xfs-log/md5
877 systemd-logind
885 abrt-watch-log
886 abrt-watch-log
890 rsyslogd
[root@test ~]# pgrep -l -U zhangsan
#指定用户


pidof    
#根据进程名 来找pid号
pidof  dd

uptime
[root@localhost ~]#uptime
 10:36:45 up  5:02,  2 users,  load average: 0.97, 0.50, 0.23

pidof

已知程序名不知道pid号

[root@localhost ~]#pidof nginx ----查看nginx进程的pid号
817 816

pstree

以树形结构列出进程信息

格式:pstree [OPTION] [ PID | USER ]

常用选项
-a 显示启动每个进程对应的完整指令,包括启动进程的路径、参数等
-p 显示PID
-T 不显示线程thread,默认显示线程
-u 显示用户切换
-H pid 高亮显示指定进程及其前辈进程

[root@localhost ~]# pstree -p 816 ----查看进程号为816的进程
nginx(816)───nginx(817)
 
[root@localhost ~]# pstree lancer ----查看用户lancer的进程
bash

[root@test ~]# pstree -pH 816 ----高亮
#字体加粗

lsof

lsof 命令,“list opened files”的缩写,直译过来,就是列举系统中已经被打开的文件。通过 lsof 命令,我们就可以根据文件找到对应的进程信息,也可以根据进程信息找到进程打开的文件。

格式:lsof [选项]

选项 功能
-c 字符串 只列出以字符串开头的进程打开的文件。
+d 目录名 列出某个目录中所有被进程调用的文件。
-u 用户名 只列出某个用户的进程打开的文件。
-p pid 列出某个 PID 进程打开的文件。
[root@localhost ~]# lsof | more
#查询系统中所有进程调用的文件




误删文件可以找回(要有人在使用)
lsof |grep delete
cupsd      1144(pid)           root   10r      REG              253,0      2337    9381005 /etc/passwd+ (deleted)

ll /proc/1144/fd
fd 是文件描述符
[root@localhost data]#ll /proc/1144/fd
总用量 0
lr-x------. 1 root root 64 11月 29 11:26 0 -> /dev/null
lrwx------. 1 root root 64 11月 29 11:26 1 -> socket:[20288]
lr-x------. 1 root root 64 11月 29 11:26 10 -> /etc/passwd+ (deleted)
lrwx------. 1 root root 64 11月 29 11:26 11 -> socket:[24022]
lrwx------. 1 root root 64 11月 29 11:26 12 -> socket:[24023]

cat /proc/1144/fd/10

posted on 2024-04-16 19:10  OB书写  阅读(18)  评论(0编辑  收藏  举报

导航