Linux下僵尸进程的处理与回收

Linux下僵尸进程的处理与回收

一、僵尸进程是什么?

僵尸进程就是已经结束的进程(几乎不占计算机资源),但是它并没有从进程列表中删除。僵尸进程太多会导致操作系统的进程数目过多,从而占满了OS的进程表。进而导致无法创建新进程,致使OS崩溃。
僵尸进程几乎不占资源,它没有可执行代码,也不能被调度,但是它占据着进程表中的一个位置,记载着该进程的PCB信息。它需要等待他的父进程来终结它。一旦它的父进程是一个循环,不会结束(父进程不去调用wait函数或者waitpid函数)。那么子进程将会一直保持僵尸状态。那么它将一直占用进程号,系统就没法回收利用。

二、僵尸进程是怎么样产生的?

每个Linux进程在进程表中都有一个进入点,内核执行该进程时,使用到的一切信息都存入在进程点。我们可以使用ps命令来查看进程状态。当一个父进程以fork()系统调用建立一个新的子进程后,内核就会在进程表中给这个子进程分配一个进入点,然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。而当这个子进程结束的时候(调用exit命令结束),其实他并没有真正的被销毁,而是留下一个僵尸进程的。此时原来进程表中的数据会被该进程的退出码(exit code)、执行时所用的CPU时间等数据所取代,这些数据会一直保留到系统将它传递给它的父进程为止。

三、僵尸进程如何避免?

  1. 可以在父进程中通过调用wait()和waitpid函数等待子进程结束,但是这会导致父进程挂起。
  2. 父进程不能挂起,父进程要做的工作很多,很忙。那么可以使用signal函数为信号SIGCHLD注册处理函数。当子进程结束之后会发出SIGCHLD信号,然后父进程会收到该信号,可以在信号处理函数中使用wait函数来回收子进程。
  3. 如果父进程不关心子进程什么时候结束(比如fork后使用了execl函数启动了另外一个可执行程序),那么可以使用single(SIGCHLD,SIG_IGN)通知内核来回收子进程。
  4. fork两次,首先父进程fork一个子进程,然后继续工作,子进程fork一个孙子进程后退出,那么孙子进程将会变成孤儿进程(因为他父亲死了,这就是孤儿),从而被init进程接管。但是子进程的回收仍旧需要父进程来做,好处是不用使用wait()来挂起了,父进程可以忙自己的。

关键点:如果父进程有多个子进程,那么当其中某一个子进程终止的时候,wait函数就会立即回收该子进程,并且返回。如果父进程关心子进程的终止状态(正常结束还是异常结束),那么需要传递一个参数来获取状态,如果不关心,可以传递参数NULL。

四、僵尸状态是每个子进程必须经过的状态吗?

任何一个子进程(init除外)在exit()之后,并非马上就消失掉,而是留下一个称为僵尸进程(Zombie)的数据结构(它占用一点内存 资源,也就是进程表里还有一个记录),等待父进程处理。这是每个子进程在结束时都要经过的阶段。如果子进程在exit()之后,父进程没有来得及处理,这时用ps命令就能看到子进程的状态是“Z”。

五、僵尸进程如何查看?

在linux中,利用命令ps,可以看到有标记为Z的进程就是僵尸进程。

ps -ef|grep defunc #可以找出僵尸进程.

可以用ps的-l选项,得到更详细的进程信息. F(Flag):一系列数字的和,表示进程的当前状态。这些数字的含义为:

00:若单独显示,表示此进程已被终止。
01:进程是核心进程的一部分,常驻于系统主存。如:sched、 vhand 、bdflush 等。
02:Parent is tracing process.
04:Tracing parent’s signal has stopped the process; the parent is waiting ( ptrace(S)).
10:进程在优先级低于或等于25时,进入休眠状态,而且不能用信号唤醒,例如在等待一个inode被创建时   
20:进程被装入主存(primary memory)
40:进程被锁在主存,在事务完成前不能被置换

S(state of the process )
O:进程正在处理器运行 
S:休眠状态(sleeping)
R:等待运行(runable)   
I:空闲状态(idle)
Z:僵尸状态(zombie)   
T:跟踪状态(Traced)
B:进程正在等待更多的内存页
C:cpu利用率的估算值(cpu usage)

六、僵尸进程如何清除?

  1. 改写父进程,在子进程死后要为它收尸。具体做法是接管SIGCHLD信号。子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信 号后,执行waitpid()函数为子进程收尸。这是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,尽管对的默认处 理是忽略,如果想响应这个消息,可以设置一个处理函数。

SIGCHLD信号:子进程结束时, 父进程会收到这个信号。如果父进程没有处理这个信号,也没有等待(wait)子进程,子进程虽然终止,但是还会在内核进程表中占有表项,这时的子进程称为 僵尸进程。这种情况我们应该避免(父进程或者忽略SIGCHILD信号,或者捕捉它,或者wait它派生的子进程,或者父进程先终止,这时子进程的终止自 动由init进程来接管)。

  1. kill -18 PPID (PPID是其父进程)

这个信号是告诉父进程,该子进程已经死亡了,请收回分配给他的资源。

SIGCONT也是一个有意思的信号。如前所述,当进程停止的时候,这个信号用来告诉进程恢复运行。该信号的有趣的地方在于:它不能被忽略或阻塞,但可以被捕获。缺省行为是丢弃该信号。

3. 终止父进程

如果方法2不能终止,可采用终止其父进程的方法(如果其父进程不需要的话)父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。

先看其父进程又无其他子进程,如果有,可能需要先kill其他子进程,也就是兄弟进程。方法是:

kill –15 PID1 PID2 (PID1,PID2是僵尸进程的父进程的其它子进程)。

然后再kill父进程:kill –15 PPID

这样僵尸进程就可能被完全杀掉了。

参考链接:
https://blog.csdn.net/weixin_44489823/article/details/103260332
https://blog.csdn.net/zy010101/article/details/83715103

posted @ 2022-05-17 20:37  John_yan15  阅读(1623)  评论(0编辑  收藏  举报