进程以及其有关命令
程序
什么是程序?
- 是一组计算机能识别和执行的指令,运行于电子计算机上,满足人们某种需求的信息化工具
- 用于描述进程要完成的功能,是控制进程执行的指令集
进程
什么是进程
运行中的程序的一个副本,是被载入内存的一个指令集合,是资源分配的单位,
- 进程ID(Process ID,PID)号码被用来标记各个进程
- UID、GID语境决定对文件系统的存取和访问权限
- 通常从执行进程的用户来继承
- 存在生命周期
- 都由其父进程创建
进程创建:
-
init:第一个进程,从 CentOS7 以后为systemd
-
进程:都由其父进程创建,fork(),父子关系,CoW:Copy On Write 写实更新,有数据写入子进程需要新的内存空间
进程具有的特征:
-
动态性:进程是程序的一次执行过程,是临时的,有生命期的,是动态产生,动态消亡的;
-
并发性:任何进程都可以同其他进程一起并发执行;
-
独立性:进程是系统进行资源分配和调度的一个独立单位;
-
结构性:进程由程序、数据和进程控制块三部分组成。
进程与线程的区别
线程是程序执行的最小单位,而进程是操作系统分配资源的最小单位
如何确定一个程序 是多线程 还是 单线程?
pstree
[root@localhost opt]# pstree -p |grep polkitd ----总共6线程
|-polkitd(797)-+-{polkitd}(824)
| |-{polkitd}(827)
| |-{polkitd}(836)
| |-{polkitd}(838)
| `-{polkitd}(847)
grep -i threads /proc/进程的PID/status
[root@localhost opt]# grep -i threads /proc/797/status
Threads: 6
prtstat 进程pid号
[root@localhost opt]# prtstat 797
Process: polkitd State: S (sleeping)
CPU#: 0 TTY: 0:0 Threads: 6
Process, Group and Session IDs
Process ID: 797 Parent ID: 1
Group ID: 797 Session ID: 797
T Group ID: -1
Page Faults
This Process (minor major): 17484 50
Child Processes (minor major): 96259 1
CPU Times
This Process (user system guest blkio): 0.38 1.10 0.00 0.04
Child processes (user system guest): 0.45 0.93 0.00
Memory
Vsize: 551 MB
RSS: 12 MB RSS Limit: 18446744073709 MB
Code Start: 0x560d7a88c000 Code Stop: 0x560d7a8a61fc
Stack Start: 0x7ffd0d318c80
Stack Pointer (ESP): 0x7ffd0d318ab0 Inst Pointer (EIP): 0x7ff17f7b2a3d
Scheduling
Policy: normal
Nice: 0 RT Priority: 0 (non RT)
进程更多的状态
- 运行态:running
- 就绪态:ready
- 睡眠态:分为两种,可中断:interruptable,不可中断:uninterruptable
- 停止态:stopped,暂停于内存,但不会被调度,除非手动启动
- 僵死态:zombie,僵尸态,结束进程,父进程结束前,子进程不关闭,杀死父进程可以关闭僵死态 的子进程
进程结束父进程会回收子进程的硬件资源, 子进程如果出现意外关闭, 父进程无感知就不会收回资源,这个人为关闭父进程, 资源不会回收产生僵尸进程
范例:僵尸态
[root@localhost ~]# bash
[root@localhost ~]# pstree -p |grep bash
|-gnome-terminal-(14092)-+-bash(14105)
|-sshd(1138)-+-sshd(53996)---bash(54000)---bash(54069)-+-grep(54157)
| `-sshd(54115)---bash(54119)
[root@localhost ~]# kill -19 54000 ----停止父进程
[root@localhost ~]# kill -9 54069 ----关闭子进程
[root@localhost ~]# ps aux |grep -v grep |grep Z ----筛选僵尸进程(54069变成了僵尸进程)
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 54069 0.0 0.0 0 0 pts/2 Z+ 17:21 0:00 [bash] <defunct>
恢复父进程消除僵尸进程
[root@localhost ~]# kill -18 54000
[root@localhost ~]# ps aux |grep -v grep |grep Z
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
关闭父进程消除僵尸进程
[root@localhost ~]# kill -9 54000
[root@localhost ~]# ps aux |grep -v grep |grep Z
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
进程使用内存的问题
内存泄漏:Memory Leak
指程序中用malloc或new申请了一块内存,但是没有用free或delete将内存释放,导致这块内存一直处于占用状态
内存溢出:Memory Overflow
指程序申请了10M的空间,但是在这个空间写入10M以上字节的数据,就是溢出,类似红杏出墙
内存不足:OOM
OOM 即 Out Of Memory,“内存用完了”,在情况在java程序中比较常见。系统会选一个进程将之杀死,在日志messages中看到类似下面的提示
ps
ps 即 process state,可以查看进程当前状态的快照,默认显示当前终端中的进程,Linux系统各进程的相关信息均保存在/proc/数字目录/status 下的文件中
支持三种选项:
- UNIX选项 如: -A -e
- GNU选项 如: --help
- BSD选项 如: a
查看静态的进程统计信息
- "ps aux" 可以查看系统中所有的进程;
- "ps -le" 可以查看系统中所有的进程,而且还能看到进程的父进程的 PID 和进程优先级;
- "ps -l" 只能看到当前 Shell 产生的进程;
常用选项
- a:显示当前终端下的所有进程信息,包括其他用户的进程。与“x”选项结合时将示系统中所有的进程信息。
- u:使用以用户为主的格式输出进程信息。
- x:显示当前用户在所有终端下的进程信息。
- -e:显示系统内的所有进程信息。
- -l:使用长(Long)格式显示进程信息。
- -f:使用完整的(Full)格式显示进程信
- k|--sort 属性 对属性排序,属性前加 - 表示倒序 ps aux k -%cpu
- o 属性… 选项显示定制的信息 pid、cmd、%cpu、%mem
ps 输出属性
C : ps -ef 显示列 C 表示cpu利用率
VSZ: Virtual memory SiZe,虚拟内存集,线性内存
RSS: ReSident Size, 常驻内存集
STAT:进程状态
R:running
S: interruptable sleeping
D: uninterruptable sleeping
T: stopped
Z: zombie
+: 前台进程
l: 多线程进程
L:内存分页并带锁
N:低优先级进程
<: 高优先级进程
s: session leader,会话(子进程)发起者
I:Idle kernel thread,CentOS 8 新特性
ni: nice值
pri: priority 优先级
rtprio: 实时优先级
psr: processor CPU编号
ps axo pid,cmd,psr,ni,pri,rtprio
选项实例
ps a
ps -a
#风格不同 显示结果不同
ps
#显示当前终端中的进程
ps a
#看到所有
ps ax
#终端有关或无关的进程
ps aux
#u和用户有关等详细信息
ps aux表头含义
[root@localhost opt]# ps aux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 1 0.0 0.3 193700 6824 ? Ss 14:08 0:02 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root 2 0.0 0.0 0 0 ? S 14:08 0:00 [kthreadd]
表头 | 含义 |
---|---|
USER | 该进程是由哪个用户产生的。 |
PID | 进程的 ID。 |
%CPU | 该进程占用 CPU 资源的百分比,占用的百分比越高,进程越耗费资源。 |
%MEM | 该进程占用物理内存的百分比,占用的百分比越高,进程越耗费资源。 |
VSZ | 该进程占用虚拟内存的大小,单位为 KB。 |
RSS | 该进程占用实际物理内存的大小,单位为 KB。 |
TTY | 该进程是在哪个终端运行的。其中,tty1 ~ tty7 代表本地控制台终端(可以通过 Alt+F1 ~ F7 快捷键切换不同的终端),tty1~tty6 是本地的字符界面终端,tty7 是图形终端。pts/0 ~ 255 代表虚拟终端,一般是远程连接的终端,第一个远程连接占用 pts/0,第二个远程连接占用 pts/1,依次増长。?代表和终端无关,系统进程 |
STAT | 进程状态。常见的状态有以下几种: -D:不可被唤醒的睡眠状态,通常用于 I/O 情况。 -R:该进程正在运行。 -S:该进程处于睡眠状态,可被唤醒。 -T:停止状态,可能是在后台暂停或进程处于除错状态。 -W:内存交互状态(从 2.6 内核开始无效)。 -X:死掉的进程(应该不会出现)。 -Z:僵尸进程。进程已经中止,但是还是占用硬件资源。 -<:高优先级(以下状态在 BSD 格式中出现)。 -N:低优先级。 -L:被锁入内存。 -s:包含子进程。 -l:多线程(小写 L)。 -+:位于后台。 |
START | 该进程的启动时间。 |
TIME | 该进程占用 CPU 的运算时间,注意不是系统时间。 |
COMMAND | 产生此进程的命令名。 |
ps -ef 命令输出信息
[root@localhost ~]# ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 16:00 ? 00:00:07 /usr/lib/systemd/systemd --switched-roo
root 2 0 0 16:00 ? 00:00:00 [kthreadd]
表头 | 含义 |
---|---|
F | 进程标志,说明进程的权限,常见的标志有两个: 1:进程可以被复制,但是不能被执行;4:进程使用超级用户权限; |
S | 进程状态。具体的状态和"psaux"命令中的 STAT 状态一致; |
UID | 运行此进程的用户的 ID; |
PID | 进程的 ID; |
PPID | 父进程的 ID; |
C | 该进程的 CPU 使用率,单位是百分比; |
PRI | 进程的优先级,数值越小,该进程的优先级越高,越早被 CPU 执行;系统定义不可以人为修改 |
NI | 进程的优先级,数值越小,该进程越早被执行;可以人为修改 |
ADDR | 该进程在内存的哪个位置; |
SZ | 该进程占用多大内存; |
WCHAN | 该进程是否运行。"-"代表正在运行; |
TTY | 该进程由哪个终端产生; |
TIME | 该进程占用 CPU 的运算时间,注意不是系统时间; |
CMD | 产生此进程的命令名; |
找到未知进程的执行程序文件路径
[root@localhost opt]# ps aux k -%cpu |head ----查看CPU占用最高的10个进程
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
root 840 0.1 0.3 231564 6272 ? Ss 14:08 0:16 /usr/bin/vmtoolsd
root 1 0.0 0.3 193700 6824 ? Ss 14:08 0:02 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root 2 0.0 0.0 0 0 ? S 14:08 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 14:08 0:00 [ksoftirqd/0]
root 5 0.0 0.0 0 0 ? S< 14:08 0:00 [kworker/0:0H]
root 7 0.0 0.0 0 0 ? S 14:08 0:00 [migration/0]
root 8 0.0 0.0 0 0 ? S 14:08 0:00 [rcu_bh]
root 9 0.0 0.0 0 0 ? S 14:08 0:03 [rcu_sched]
root 10 0.0 0.0 0 0 ? S 14:08 0:00 [watchdog/0]
[root@localhost opt]# ll /proc/840/exe ----查看程序实际位置
lrwxrwxrwx. 1 root root 0 4月 16 14:09 /proc/840/exe -> /usr/bin/vmtoolsd
遏制异常文件
建立同名文件并锁定它
[root@localhost ~]#touch a;chattr +i a
查看进程信息 prtstat
[root@localhost opt]# prtstat 840
Process: vmtoolsd State: S (sleeping)
CPU#: 1 TTY: 0:0 Threads: 1
Process, Group and Session IDs
Process ID: 840 Parent ID: 1
Group ID: 840 Session ID: 840
T Group ID: -1
Page Faults
This Process (minor major): 13471 28
Child Processes (minor major): 653 0
CPU Times
This Process (user system guest blkio): 7.70 9.25 0.00 0.02
Child processes (user system guest): 0.00 0.00 0.00
Memory
Vsize: 237 MB
RSS: 6422 kB RSS Limit: 18446744073709 MB
Code Start: 0x5604caef0000 Code Stop: 0x5604caefa03c
Stack Start: 0x7fff96dd8f60
Stack Pointer (ESP): 0x7fff96dd8d88 Inst Pointer (EIP): 0x7f804b8c9a20
Scheduling
Policy: normal
Nice: 0 RT Priority: 0 (non RT)
top
ps 命令可以一次性给出当前系统中进程状态,但使用此方式得到的信息缺乏时效性,并且,如果管理员需要实时监控进程运行情况,就必须不停地执行 ps 命令,这显然是缺乏效率的。
为此,Linux 提供了 top 命令。top 命令可以动态地持续监听进程地运行状态,与此同时,该命令还提供了一个交互界面,用户可以根据需要,人性化地定制自己的输出,进而更清楚地了进程的运行状态。
选项:
- -d 秒数:指定 top 命令每隔几秒更新。默认是 3 秒;
- -b:使用批处理模式输出。一般和"-n"选项合用,用于把 top 命令重定向到文件中;
- -n 次数:指定 top 命令执行的次数。一般和"-"选项合用;
- -p 进程PID:仅查看指定 ID 的进程;
- -s:使 top 命令在安全模式中运行,避免在交互模式中出现错误;
- -u 用户名:只监听某个用户的进程;
在 top 命令的显示窗口中,还可以使用如下按键,进行一下交互操作:
- ? 或 h:显示交互模式的帮助;
- c:按照 CPU 的使用率排序,默认就是此选项;
- M:按照内存的使用率排序;
- N:按照 PID 排序;
- T:按照 CPU 的累积运算时间排序,也就是按照 TIME+ 项排序;
- k:按照 PID 给予某个进程一个信号。一般用于中止某个进程,信号 9 是强制中止的信号;
- r:按照 PID 给某个进程重设优先级(Nice)值;
- q:退出 top 命令;
首部信息显示:
uptime信息:l命令
tasks及cpu信息:t命令
cpu分别显示:1 (数字)
memory信息:m命令
退出命令:q
修改刷新时间间隔:s
终止指定进程:k
保存文件:W
top 命令的输出内容是动态的,默认每隔 3 秒刷新一次。命令的输出主要分为两部分:
- 第一部分是前五行,显示的是整个系统的资源使用状况,我们就是通过这些输出来判断服务器的资源使用状态的;
- 第二部分从第六行开始,显示的是系统中进程的信息;
第一部分
top - 10:06:37 up 5:36, 3 users, load average: 0.00, 0.01, 0.05
Tasks: 204 total, 1 running, 202 sleeping, 1 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1867048 total, 74348 free, 755112 used, 1037588 buff/cache
KiB Swap: 4194300 total, 4191856 free, 2444 used. 878688 avail Mem
第一行为任务队列信息,具体内容如表 所示。
内 容 | 说 明 |
---|---|
12:26:46 | 系统当前时间 |
up 1 day, 13:32 | 系统的运行时间.本机己经运行 1 天 13 小时 32 分钟 |
2 users | 当前登录了两个用户 |
load average: 0.00,0.00,0.00 | 系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的,则这个数值超过 1 就是高负载:如果 CPU 是四核的,则这个数值超过 4 就是高负载 (这个平均负载完全是依据个人经验来进行判断的,一般认为不应该超过服务器 CPU 的核数) |
第二行为进程信息,具体内容如表
内 容 | 说 明 |
---|---|
Tasks: 95 total | 系统中的进程总数 |
1 running | 正在运行的进程数 |
94 sleeping | 睡眠的进程数 |
0 stopped | 正在停止的进程数 |
0 zombie | 僵尸进程数。如果不是 0,则需要手工检查僵尸进程 |
第三行为 CPU 信息,具体内容如表
内 容 | 说 明 |
---|---|
Cpu(s): 0.1 %us | 用户模式占用的 CPU 百分比 个人用户开启的进程占用的 cpu 率 |
0.1%sy | 系统模式占用的 CPU 百分比 |
0.0%ni | 改变过优先级的用户进程占用的 CPU 百分比 |
99.7%id | 空闲 CPU 占用的 CPU 百分比 |
0.1%wa | 等待输入/输出的进程占用的 CPU 百分比 1 |
0.0%hi | 硬中断请求服务占用的 CPU 百分比 |
0.1%si | 软中断请求服务占用的 CPU 百分比 |
0.0%st | st(steal time)意为虚拟程序占用 cpu 时间百分比,就是当有虚拟机时,虚拟 CPU 等待实际 CPU 的时间百分比 |
第四行为物理内存信息,具体内容如表buff cache
内 容 | 说 明 |
---|---|
Mem: 625344k total | 物理内存的总量,单位为KB |
571504k used | 己经使用的物理内存数量 |
53840k&ee | 空闲的物理内存数量。我们使用的是虚拟机,共分配了 628MB内存,所以只有53MB的空闲内存 |
65800k buffers | 作为缓冲的内存数量 |
第五行为交换分区(swap)信息,如表
内 容 | 说 明 |
---|---|
Swap: 524280k total | 交换分区(虚拟内存)的总大小 |
Ok used | 已经使用的交换分区的大小 |
524280k free | 空闲交换分区的大小 |
409280k cached | 作为缓存的交换分区的大小 |
通过 top 命令的第一部分就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于 1,则证明系统压力较大。如果 CPU 的使用率过高或空闲率过低,则证明系统压力较大。如果物理内存的空闲内存过小,则也证明系统压力较大。
这时,我们就应该判断是什么进程占用了系统资源。如果是不必要的进程,就应该结束这些进程;如果是必需进程,那么我们该増加服务器资源(比如増加虚拟机内存),或者建立集群服务器。
缓冲(buffer)和缓存(cache)的区别:
- 缓存(cache)是在读取硬盘中的数据时,把最常用的数据保存在内存的缓存区中,再次读取该数据时,就不去硬盘中读取了,而在缓存中读取。
- 缓冲(buffer)是在向硬盘写入数据时,先把数据放入缓冲区,然后再一起向硬盘写入,把分散的写操作集中进行,减少磁盘碎片和硬盘的反复寻道,从而提高系统性能。
简单来说,缓存(cache)是用来加速数据从硬盘中"读取"的,而缓冲(buffer)是用来加速数据"写入"硬盘的。
第二部分
top 命令的第二部分输出,主要是系统进程信息,各个字段的含义如下:
- PID:进程的 ID。
- USER:该进程所属的用户。
- PR:优先级,数值越小优先级越高。
- NI:优先级,数值越小、优先级越高。
- VIRT:该进程使用的虚拟内存的大小,单位为 KB。
- RES:该进程使用的物理内存的大小,单位为 KB。
- SHR:共享内存大小,单位为 KB。
- S:进程状态。
- %CPU:该进程占用 CPU 的百分比。
- %MEM:该进程占用内存的百分比。
- TIME+:该进程共占用的 CPU 时间。
- COMMAND:进程的命令名。
排序:
P:以占据的CPU百分比,%CPU
M:占据内存百分比,%MEM
T:累积占据CPU时长,TIME+
首部信息显示:
uptime信息:l命令
tasks及cpu信息:t命令
cpu分别显示:1 (数字)
memory信息:m命令
退出命令:q
修改刷新时间间隔:s
终止指定进程:k
保存文件:W
[root@localhost opt]# top
top - 18:58:09 up 4:50, 1 user, load average: 0.00, 0.01, 0.05
Tasks: 165 total, 1 running, 164 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1867048 total, 514788 free, 303812 used, 1048448 buff/cache
KiB Swap: 4194300 total, 4194300 free, 0 used. 1330052 avail Mem
top命令栏位信息简介
us:用户空间
sy:内核空间
ni:调整nice时间
id:空闲
wa:等待IO时间
hi:硬中断
si:软中断(模式切换)
st:虚拟机偷走的时间
top选项:
-d # 指定刷新时间间隔,默认为3秒
-b 全部显示所有进程
-n # 刷新多少次后退出
htop
htop
下载htop的包
https://dl.fedoraproject.org/pub/epel/7/x86_64/Packages/h/htop-2.2.0-3.el7.x86_64.rpm
pgrep
查看指定的进程
- -U 指定用户
- -l: 显示进程名
- -a: 显示完整格式的进程名
- -P pid: 显示指定进程的子进程
[root@test ~]# pgrep -l "log"
# 显示进程名
435 xfs-log/dm-0
713 xfs-log/sda1
790 xfs-log/md5
877 systemd-logind
885 abrt-watch-log
886 abrt-watch-log
890 rsyslogd
[root@test ~]# pgrep -l -U zhangsan
#指定用户
pidof
#根据进程名 来找pid号
pidof dd
uptime
[root@localhost ~]#uptime
10:36:45 up 5:02, 2 users, load average: 0.97, 0.50, 0.23
pidof
已知程序名不知道pid号
[root@localhost ~]#pidof nginx ----查看nginx进程的pid号
817 816
pstree
以树形结构列出进程信息
格式:pstree [OPTION] [ PID | USER ]
常用选项
-a 显示启动每个进程对应的完整指令,包括启动进程的路径、参数等
-p 显示PID
-T 不显示线程thread,默认显示线程
-u 显示用户切换
-H pid 高亮显示指定进程及其前辈进程
[root@localhost ~]# pstree -p 816 ----查看进程号为816的进程
nginx(816)───nginx(817)
[root@localhost ~]# pstree lancer ----查看用户lancer的进程
bash
[root@test ~]# pstree -pH 816 ----高亮
#字体加粗
lsof
lsof 命令,“list opened files”的缩写,直译过来,就是列举系统中已经被打开的文件。通过 lsof 命令,我们就可以根据文件找到对应的进程信息,也可以根据进程信息找到进程打开的文件。
格式:lsof [选项]
选项 | 功能 |
---|---|
-c 字符串 | 只列出以字符串开头的进程打开的文件。 |
+d 目录名 | 列出某个目录中所有被进程调用的文件。 |
-u 用户名 | 只列出某个用户的进程打开的文件。 |
-p pid | 列出某个 PID 进程打开的文件。 |
[root@localhost ~]# lsof | more
#查询系统中所有进程调用的文件
误删文件可以找回(要有人在使用)
lsof |grep delete
cupsd 1144(pid) root 10r REG 253,0 2337 9381005 /etc/passwd+ (deleted)
ll /proc/1144/fd
fd 是文件描述符
[root@localhost data]#ll /proc/1144/fd
总用量 0
lr-x------. 1 root root 64 11月 29 11:26 0 -> /dev/null
lrwx------. 1 root root 64 11月 29 11:26 1 -> socket:[20288]
lr-x------. 1 root root 64 11月 29 11:26 10 -> /etc/passwd+ (deleted)
lrwx------. 1 root root 64 11月 29 11:26 11 -> socket:[24022]
lrwx------. 1 root root 64 11月 29 11:26 12 -> socket:[24023]
cat /proc/1144/fd/10