【Linux进程】六、wait()函数——子进程回收
1. 僵尸进程与孤儿进程
孤儿进程:父进程结束,子进程被init进程收养。
僵尸进程:子进程结束,父进程没有回收子进程的资源(PCB),这个资源必须要由父进程回收,否则就形成僵尸进程。
测试1: 孤儿进程测试
/************************************************************
>File Name : orphan.c
>Author : Mindtechnist
>Company : Mindtechnist
>Create Time: 2022年05月19日 星期四 20时53分41秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
pid_t pid = fork();
if(pid == 0)
{
while(1)
{
printf("child: %d, ppid: %d\n", getpid(), getppid());
sleep(1);
}
}
if(pid > 0)
{
printf("parent: %d\n", getpid());
sleep(3);
}
return 0;
}
我们看到,子进程的父进程ID在3秒后变成了1,这说明父进程结束后,它变成了孤儿进程,并被init进程收养,使用kill命令基于可以杀死孤儿进程。
测试2: 僵尸进程测试
/************************************************************
>File Name : zombie.c
>Author : Mindtechnist
>Company : Mindtechnist
>Create Time: 2022年05月19日 星期四 20时54分20秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
pid_t pid = fork();
if(pid == 0)
{
printf("child: %d, ppid: %d\n", getpid(), getppid());
sleep(1);
}
if(pid > 0)
{
while(1)
{
printf("parent: %d\n", getpid());
sleep(1);
}
}
return 0;
}
我们可以通过ps命令查看僵尸进程
图中红色标出的三个地方Z+、[]、default都可以表明这是僵尸进程,另外Z+是进程类型的一个表示,可以通过 man ps 查看,我们可以通过 man ps 进入帮助手册,然后在命令行输入 /zombie 来搜索zombie相关的信息。
僵尸进程是不能用kill杀死的,因为kill命令是终止进程,而僵尸进程已经终止了。我们知道僵尸进程的资源需要由父进程去回收,那么我们在这种情况下如何回收僵尸进程的资源呢?方法就是杀死父进程,父进程被杀死后,由init接管子进程并回收子进程资源。
2. wait()函数与waitpid()函数
2.1 wait()函数
一个进程在终止的时候会关闭所有的文件描述符,释放在用户空间分配的内存,但是它的PID还保留着,内核在其中保存了一些信息:如果进程是正常终止则保存进程退出状态;如果进程是异常终止,则保存导致该进程终止的那个信号。这个进程的父进程可以调用wait()或者waitpid()来获取这些信息,然后彻底清除这个进程。我们知道,一个进程的退出状态可以在shell中用特殊变量$?查看,因为shell进程是它的父进程,当它终止的时候shell调用wait()或waitpid()得到它的退出状态,同时彻底清除这个进程。父进程调用wait()函数可以回收子进程终止信息,wait()函数功能主要有三个:阻塞等待子进程退出;回收子进程残留资源;获取子进程退出状态(退出原因)。
- 包含头文件及函数原型
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status);
/*
pid_t waitpid(pid_t pid, int *status, int options);
int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options);
*/
-
函数描述
wait()函数用于回收子进程,获取子进程的终止原因,如果子进程没有终止,那么将会阻塞等待子进程的终止。
-
函数参数
- status:传出参数(C语言一级指针做输出)
WIFEXITED(status) /*wait if exited 等待是否退出*/ WEXITSTATUS(status) /*wait exit status 退出原因*/ WIFSIGNALED(status) /*wait if signaled 是否被信号杀死*/ WTERMSIG(status) /*wait term sugnaled 被几号信号杀死的*/ WCOREDUMP(status) WIFSTOPPED(status) WSTOPSIG(status) WIFCONTINUED(status)
- 根据status判断子进程终止原因
- WIFEXITED(status)判断子进程是否正常退出;
- WIFEXITED(status)为真表示正常退出,使用WEXITSTATUS(status)获取退出状态;
- WIFEXITED(status)非真,表示非正常退出,使用WIFSIGNALED(status)判断是否被信号杀死;
- WIFSIGNALED(status)为真,表示是被信号杀死,使用WTERMSIG(status) 获取杀死进程的信号;
-
函数返回值
- on success, returns the process ID of the terminated child; wait()函数成功返回终止的子进程的ID.
- on error, -1 is returned. 失败返回-1.
案例测试: wait()获取子进程退出原因
/************************************************************
>File Name : wait_test.c
>Author : Mindtechnist
>Company : Mindtechnist
>Create Time: 2022年05月19日 星期四 22时45分28秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(int argc, char* argv[])
{
pid_t pid = fork();
if(pid == 0)
{
printf("child: %d, ppid: %d\n", getpid(), getppid());
sleep(3); /*子进程睡眠3秒,那么父进程中的wait函数会阻塞3秒,一直等到子进程退出*/
return 66; /*正常退出,这个值可以被WEXITSTATUS获取到,这个值是有范围的*/
/*exit(66); 也表示正常退出*/
}
if(pid > 0)
{
int status;
pid_t wpid = wait(&status);
printf("wpid: %d, cpid: %d\n", wpid, pid);
if(WIFEXITED(status)) /*进程正常退出,获取退出原因*/
{
printf("child exit because: %d\n", WEXITSTATUS(status));
}
else /*非正常退出*/
{
if(WIFSIGNALED(status)) /*为真表示被信号杀死*/
{
printf("signal is: %d", WTERMSIG(status));
}
else
{
printf("other...\n");
}
}
while(1)
{
sleep(3);
}
}
return 0;
}
我们首先演示一下子进程的正常退出,并获取退出状态,子进程的退出状态可以用return或者exit来传递。
下面我们在子进程中增加一个循环,然后用信号杀死子进程
if(pid == 0)
{
printf("child: %d, ppid: %d\n", getpid(), getppid());
sleep(2); /*子进程睡眠3秒,那么父进程中的wait函数会阻塞3秒,一直等到子进程退出*/
while(1)
{
printf("child: %d, ppid: %d\n", getpid(), getppid());
sleep(1);
}
}
重新编译运行,并开启另一个shell,使用 kill -9 杀死子进程
获取到杀死进程的信号,正好是9号信号,如果直接使用 kill pid 默认使用的是15号信号。
2.2 waitpid()函数
- 包含头文件及函数原型
#include <sys/types.h>
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *status, int options);
-
函数描述
The waitpid() system call suspends execution of the calling process until a child specified by pid argument has changed state.
-
函数参数
- pid:
- 小于 -1:meaning wait for any child process whose process group ID is equal to the absolute value of pid. 回收一个组的子进程,使用时把组ID(一般是父进程ID)传给pid参数,就可以使用waitpid()回收这个进程组的所有子进程。
- -1:meaning wait for any child process. 回收所有,任何子进程,这是最常用的取值,把所有子进程都回收。
- 0:meaning wait for any child process whose process group ID is equal to that of the calling process. 回收和调用进程组ID相同的组内的子进程。
- 大于0:meaning wait for the child whose process ID is equal to the value of pid. 回收指定的进程pid。
- status:传出参数,同wait()函数
- options:选项
- WNOHANG: return immediately if no child has exited. wait no hang,如果子进程没有结束,立即返回,不会挂起等待(wait函数如果子进程没有退出会阻塞等待)。如果options参数填0,那么和wait()函数一样会挂起等待子进程结束。
- WUNTRACED: also return if a child has stopped (but not traced via ptrace(2)). Status for traced children which have stopped is provided even if this option is not specified.
- WCONTINUED: also return if a stopped child has been resumed by delivery of SIGCONT.
- pid:
-
函数返回值
- on success, returns the process ID of the child whose state has changed; if WNOHANG was specified and one or more child(ren) specified by pid exist, but have not yet changed state, then 0 is returned. 如果设置了WNOHANG选项,并且没有子进程退出则返回0,如果有子进程退出则返回退出子进程的pid。
- On error, -1 is returned. 比如说没有子进程或子进程早就全部结束了,可能就会出错返回-1。
下面通过例子演示waitpid()函数的用法。
/************************************************************
>File Name : waitpid_test.c
>Author : Mindtechnist
>Company : Mindtechnist
>Create Time: 2022年05月20日 星期五 16时31分35秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(int argc, char* argv[])
{
pid_t pid = fork();
if(pid == 0)
{
printf("child: %d\n", getpid());
sleep(2);
}
if(pid > 0)
{
printf("parent: %d\n", getpid());
int ret = waitpid(-1, NULL, WNOHANG);
printf("ret: %d\n", ret);
while(1)
{
sleep(1);
}
}
return 0;
}
为什么使用了waitpid()函数还会产生僵尸进程呢,这是因为在waitpid()函数中使用了选项参数WNOHANG,而子进程中有一个睡眠函数,子进程睡眠的时候,父进程中waitpid()语句没有等到子进程结束就执行了,由于WNOHANG选项参数的存在,waitpid不会阻塞等待之进程结束,而是直接返回。当waitpid()返回父进程中后,子进程才结束,但是waitpid()已经执行完了,所以并没有回收子进程,子进程因此变成僵尸进程。
解决方法就是在一个循环中执行waitpid()函数,直到ret不等于0的时候说明子进程退出了,跳出循环。
3. 回收多个子进程
上面使用wait()函数和waitpid()函数举的例子都是回收一个子进程,有时候我们可能需要回收多个子进程,下面介绍回收多个子进程的方法。
3.1 使用wait()回收多个子进程
首先使用wait()函数来回收多个子进程,我们可以在一个for循环中等待子进程的结束,创建了几个子进程就for循环等待几次,代码如下。
/************************************************************
>File Name : mutipwait.c
>Author : Mindtechnist
>Company : Mindtechnist
>Create Time: 2022年05月20日 星期五 17时23分57秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(int argc, char* argv[])
{
int i = 0;
pid_t pid;
for(i = 0; i < 5; i++)
{
pid = fork();
if(pid == 0)
{
printf("child: %d\n", getpid());
break;
}
}
sleep(i);
if(i == 5) /*只有父进程可以执行到i=5*/
{
for(i = 0; i < 5; i++)
{
pid_t wpid = wait(NULL);
printf("wpid: %d\n", wpid);
}
while(1)
{
sleep(1);
}
}
return 0;
}
编译运行,可以看到所有子进程都被回收。
3.2 使用waitpid()回收多个子进程
如果使用waitpid()函数,可以借助函数的参数和返回值去判断每个子进程是否回收成功。
/************************************************************
>File Name : mutipwaitpid.c
>Author : Mindtechnist
>Company : Mindtechnist
>Create Time: 2022年05月20日 星期五 17时45分39秒
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main(int argc, char* argv[])
{
int i = 0;
pid_t pid;
for(i = 0; i < 5; i++)
{
pid = fork();
if(pid == 0)
{
break;
}
}
if(i == 5) /*只有父进程可以执行到i=5*/
{
printf("parent: %d\n", getpid());
while(1) /*无限循环保证所有子进程全部回收*/
{
pid_t wpid = waitpid(-1/*回收任何子进程*/, NULL, WNOHANG);
if(wpid == -1)
{
break; /*如果返回-1说明已经没有子进程了,退出循环*/
}
if(wpid > 0)
{
printf("wpid: %d\n", wpid); /*打印被回收的子进程的ID*/
}
}
while(1)
{
sleep(1);
}
}
if(i < 5) /*说明是子进程*/
{
printf("no. %d child: %d\n", i, getpid());
}
return 0;
}
编译执行,可以看到所有进程都被回收了