wait和waitpid详解

前记：恩，很多文章都是转载的，有的时候也没有附上别人的链接，这样是不好，但是就像是学习笔记做摘抄一样，我的博文不会商用，如果有商用那一天，一定保证好著作权。

学习本就是一个相互借鉴和模仿的过程。恩，大家一起学习，一起成长，才能不断进步！

关于wait和waitpid的区别，之前在严冰的linux程序设计书里只是简单介绍了一下，今天看一位有名的博主的UNIX网络编程的读书笔记的时候，发现自己对于wait和waitpid还是不理解。

wait()就是得到子进程的返回码，等于就是为子进程“收尸”，否则子进程会变僵尸进程（关于僵尸和孤儿进程的区别，之前有总结过），如果父进程结束了，init进程会为僵尸进程收尸的。

SIGCHLD信号处理函数：

进程一章讲过用wait和waitpid函数清理僵尸进程，父进程可以阻塞等待子进程结束，也可以非阻塞地查询是否有子进程结束等待清理（也就是轮询的方式）。采用第一种方式，父进程阻塞了就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。
其实，子进程在终止时会给父进程发SIGCHLD信号，该信号的默认处理动作是忽略，父进程可以自定义SIGCHLD信号的处理函数，这样父进程只需专心处理自己的工作，不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait清理子进程即可。
事实上，由于UNIX的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的，但这是一个特例。此方法对于Linux可用，但不保证在其它UNIX系统上都可用。请编写程序验证这样做不会产生僵尸进程。

wait的函数原型是：　

#include

pid_t wait(int *status) 　　　　

进程一旦调用了wait，就立即阻塞自己，由wait自动分析是否当前进程的某个子进程已经退出，如果让它找到了这样一个已经变成僵尸的子进程，wait就会收集这个子进程的信息，并把它彻底销毁后返回；如果没有找到这样一个子进程，wait就会一直阻塞在这里，直到有一个出现为止。　

参数：

参数status用来保存被收集进程退出时的一些状态，它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意，只想把这个僵尸进程消灭掉，（事实上绝大多数情况下，我们都会这样想），我们就可以设定这个参数为NULL，就象下面这样：

pid = wait(NULL);

返回值：

如果成功，wait会返回被收集的子进程的进程ID

如果调用进程没有子进程，调用就会失败，此时wait返回-1，同时errno被置为ECHILD。　

waitpid的函数原型是：　　　　

#include

pid_t waitpid(pid_t pid,int *status,int options)

从本质上讲，系统调用waitpid和wait的作用是完全相同的，但waitpid多出了两个可由用户控制的参数pid和options，从而为我们编程提供了另一种更灵活的方式。

参数：(status同上)　　　　

pid:从参数的名字pid和类型pid_t中就可以看出，这里需要的是一个进程ID。但当pid取不同的值时，在这里有不同的意义。　　　　

pid>0时，只等待进程ID等于pid的子进程，不管其它已经有多少子进程运行结束退出了，只要指定的子进程还没有结束,waitpid就会一直等下去。

pid=-1时，等待任何一个子进程退出，没有任何限制，此时waitpid和wait的作用一模一样。　　

pid=0时，等待同一个进程组中的任何子进程，如果子进程已经加入了别的进程组，waitpid不会对它做任何理睬。

pid<-1时，等待一个指定进程组中的任何子进程，这个进程组的ID等于pid的绝对值。　　

options: options提供了一些额外的选项来控制waitpid，目前在Linux中只支持WNOHANG和WUNTRACED两个选项，这是两个常数，可以用"|"运算符把它们连接起来使用

比如：

ret=waitpid(-1,NULL,WNOHANG | WUNTRACED); 　　

如果我们不想使用它们，也可以把options设为0，如：　　

ret=waitpid(-1,NULL,0); 　　　　

如果使用了WNOHANG参数调用waitpid，即使没有子进程退出，它也会立即返回，不会像wait那样永远等下去。

而WUNTRACED参数，由于涉及到一些跟踪调试方面的知识，加之极少用到，这里就不多费笔墨了，有兴趣的读者可以自行查阅相关材料.

看到这里，聪明的读者可能已经看出端倪了--wait不就是经过包装的waitpid吗？

没错，察看<内核源码目录>/include/unistd.h文件349-352行就会发现以下程序段：　　　　

static inline pid_t wait(int * wait_stat) 　　
{ 　
　 return waitpid(-1,wait_stat,0); 　　//返回值和错误
}

返回值：　　

waitpid的返回值比wait稍微复杂一些，一共有3种情况：　

● 当正常返回的时候，waitpid返回收集到的子进程的进程ID；

● 如果设置了选项WNOHANG，而调用中waitpid发现没有已退出的子进程可收集，则返回0；　　　　

● 如果调用中出错，则返回-1，这时errno会被设置成相应的值以指示错误所在；当pid所指示的子进程不存在，或此进程存

在，但不是调用进程的子进程，waitpid就会出错返回，这时errno被设置为ECHILD

其它：调用 wait＆waitpid 来处理终止的子进程：

pid_t wait(int * status);

pid_t waitpid(pid_t pid,int * status, int options);

两个函数都返回两个值：函数的返回值和终止的子进程ID，而子进程终止的状态则是通过status指针返回的。

wait＆waitpid 的区别是显而易见的，wait等待第一个终止的子进程，而waitpid则可以指定等待特定的子进程。

这的区别可能会在下面这种情况时表现得更加明显：

当同时有5个客户连上服务器，也就是说有五个子进程分别对应了5个客户，此时，五个客户几乎在同时请求终止，这样一来，几乎同时，五个FIN发向服务器，同样的，五个SIGCHLD信号到达服务器，然而，UNIX的信号往往是不会排队的，显然这样一来，信号处理函数将只会执行一次，残留剩余四个子进程作为僵尸进程驻留在内核空间。此时，正确的解决办法是利用waitpid(-1, &stat, WNOHANG)防止留下僵尸进程。

其中的pid为－1表明等待任一个子进程，而WNOHANG选择项通知内核在没有已终止进程项时不要阻塞。

wait＆waitpid 区别 :

waitpid提供了wait函数不能实现的3个功能:

1.waitpid等待特定的子进程, 而wait则返回任一终止状态的子进程;

2.waitpid提供了一个wait的非阻塞版本;

3.waitpid支持作业控制(以WUNTRACED选项). 用于检查wait和waitpid两个函数返回终止状态的宏: 这两个函数返回的子进程状态都保存在status指针中, 用以下3个宏可以检查该状态:

WIFEXITED(status): 若为正常终止, 则为真. 此时可执行 WEXITSTATUS(status): 取子进程传送给exit或_exit参数的低8位.

WIFSIGNALED(status): 若为异常终止, 则为真.此时可执行 WTERMSIG(status): 取使子进程终止的信号编号.

WIFSTOPPED(status): 若为当前暂停子进程, 则为真. 此时可执行 WSTOPSIG(status): 取使子进程暂停的信号编号

注：(网上看到的感觉方法很好，推荐)

如果用在父进程用wait()和waitpid()会使父进程挂起，解决的办法：

(1).可以用signal函数为SIGCHLD安装handler。在子进程结束后，父进程会收到该信号，可以在handler中调用wait回收。

(2).如果父进程不关心子进程什么时候结束，那么可以用signal(SIGCLD, SIG_IGN)或signal（SIGCHLD, SIG_IGN）通知内核，自己对子进程的结束不感兴趣，那么子进程结束后，内核会回收，并不再给父进程发送信号。

(3).fork两次，父进程fork一个子进程，然后继续工作，子进程fork一个孙进程后退出，那么孙进程被init接管，孙进程结束后，init会回收。不过子进程的回收还要自己做。

posted @ 2016-08-24 20:13 0giant 阅读(15310) 评论(1) 收藏举报

刷新页面返回顶部

wait和waitpid详解

公告