linux对于zombie的处理
@(Linux基础)[僵尸进程处理]
今天在服务器上推送项目的时候,突然发现很卡。就用top查看了一下,果然此事不简单啊。
top - 10:39:16 up 20 days, 23:11, 2 users, load average: 1.13, 1.09, 1.03
Tasks: 204 total, 2 running, 196 sleeping, 1 stopped, 5 zombie
Cpu(s): 22.2%us, 1.9%sy, 0.0%ni, 73.2%id, 1.6%wa, 0.0%hi, 0.0%si, 1.2%st
Mem: 6122764k total, 5311160k used, 811604k free, 785232k buffers
Swap: 2046972k total, 168792k used, 1878180k free, 2787720k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
18715 root 20 0 245m 58m 6692 R 31.3 1.0 0:00.94 python
21231 root 20 0 538m 96m 7180 S 1.0 1.6 208:55.76 gunicorn
21237 root 20 0 538m 96m 7272 S 1.0 1.6 208:47.87 gunicorn
21229 root 20 0 539m 97m 7352 S 0.7 1.6 208:57.03 gunicorn
21240 root 20 0 539m 96m 7368 S 0.7 1.6 208:42.90 gunicorn
2239 rabbitmq 20 0 3768m 69m 2764 S 0.3 1.2 46:00.09 beam.smp
18681 root 20 0 17172 1364 964 R 0.3 0.0 0:00.01 top
18724 root 20 0 121m 7448 5320 S 0.3 0.1 0:00.01 nginx
1 root 20 0 21404 1064 848 S 0.0 0.0 0:02.10 init
2 root 20 0 0 0 0 S 0.0 0.0 0:00.02 kthreadd
注意:zombie 僵尸进程而且还是5个。
此时此刻,只想说这些这帮人捣乱玩。
解决办法:
在linux中,利用命令ps,可以看到有标记为Z的进程就是僵尸进程。
ps -ef|grep defunc可以找出僵尸进程.
可以用ps的-l选项,得到更详细的进程信息. F(Flag):一系列数字的和,表示进程的当前状态。这些数字的含义为:
00:若单独显示,表示此进程已被终止。
01:进程是核心进程的一部分,常驻于系统主存。如:sched、 vhand 、bdflush 等。
02:Parent is tracing process.
04:Tracing parent’s signal has stopped the process; the parent is waiting ( ptrace(S)).
10:进程在优先级低于或等于25时,进入休眠状态,而且不能用信号唤醒,例如在等待一个inode被创建时
20:进程被装入主存(primary memory)
40:进程被锁在主存,在事务完成前不能被置换
S(state of the process )
O:进程正在处理器运行
S:休眠状态(sleeping)
R:等待运行(runable)
I:空闲状态(idle)
Z:僵尸状态(zombie)
T:跟踪状态(Traced)
B:进程正在等待更多的内存页
C:cpu利用率的估算值(cpu usage)
处理僵尸进程
kill -18 PPID (PPID是其父进程)
这个信号是告诉父进程,该子进程已经死亡了,请收回分配给他的资源。
SIGCONT也是一个有意思的信号。如前所述,当进程停止的时候,这个信号用来告诉进程恢复运行。该信号的有趣的地方在于:它不能被忽略或阻塞,但可以被捕获。缺省行为是丢弃该信号。
终止父进程
如果方法2不能终止,可采用终止其父进程的方法(如果其父进程不需要的话)父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。
先看其父进程又无其他子进程,如果有,可能需要先kill其他子进程,也就是兄弟进程。方法是:
kill –15 PID1 PID2 (PID1,PID2是僵尸进程的父进程的其它子进程)。
然后再kill父进程:kill –15 PPID
这样僵尸进程就可能被完全杀掉了。