子进程父进程的退出&&简单的同步&&wait/waitpid
http://blog.csdn.net/lxmuyu/article/details/7234040
父子进程之间的关系
父进程先于子进程终止
孤儿进程(Orphan process):父进程退出,而它子进程还在
运行,那么那些子进程将成为孤儿进程。
孤儿进程将被init进程(进程号为1)所收养,并由init进程对它
们完成状态收集工作。
子进程先于父进程终止
有SIGCHLD signal发送给父进程
如在父进程中用wait/waitpid处理
一个子进程在其父进程还没有调用wait()或waitpid()的情况下
退出。这个子进程就是僵尸进程。
僵尸进程将会导致资源浪费,而孤儿则不会。
wait/waitpid作用就是在子进程先于父进程退出时 对子进程(僵尸进程)进行资源回收的
wait的函数原型是:
#include<sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status)
进程一旦调用了wait,就立即阻塞自己,由wait自动分析是否当前进程的某个子进程已经退出,如果让它找到了这样一个已经变成僵尸的子进程, wait就会收集这个子进程的信息,并把它彻底销毁后返回;如果没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。
参数status用来保存被收集进程退出时的一些状态,它是一个指向int类型的指针。但如果我们对这个子进程是如何死掉的毫不在意,只想把这个僵尸进程消灭掉,(事实上绝大多数情况下,我们都会这样想),我们就可以设定这个参数为NULL,就象下面这样: pid = wait(NULL);如果成功,wait会返回被收集的子进程的进程ID,如果调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD。
waitpid的函数原型是:
waitpid系统调用在Linux函数库中的原型是:
#include <sys/types.h>#include <sys/wait.h>
pid_t waitpid(pid_t pid,int *status,int options)
从本质上讲,系统调用waitpid和wait的作用是完全相同的,但waitpid多出了两个可由用户控制的参数pid和options,从而为我们编程提供了另一种更灵活的方式。
下面我们就来详细介绍一下这两个参数:
● pid 从参数的名字pid和类型pid_t中就可以看出,这里需要的是一个进程ID。但当pid取不同的值时,在这里有不同的意义。 pid>0时,只等待进程ID等于pid的子进程,不管其它已经有多少子进程运行结束退出了,只要指定的子进程还没有结束,waitpid就会一直等下去。 pid=-1时,等待任何一个子进程退出,没有任何限制,此时waitpid和wait的作用一模一样。 pid=0时,等待同一个进程组中的任何子进程,如果子进程已经加入了别的进程组,waitpid不会对它做任何理睬。 pid<-1时,等待一个指定进程组中的任何子进程,这个进程组的ID等于pid的绝对
值。
● options options提供了一些额外的选项来控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED两个选项,这是两个常数,可以用"|"运算符把它们连接起来使用,比如: ret=waitpid(-1,NULL,WNOHANG | WUNTRACED); 如果我们不想使用它们,也可以把options设为0,如: ret=waitpid(-1,NULL,0); 如果使用了WNOHANG参数调用waitpid,即使没有子进程退出,它也会立即返回,不会像wait那样永远等下去。 而WUNTRACED参数,由于涉及到一些跟踪调试方面的知识,加之极少用到,这里就不多费笔墨了,有兴趣的读者可以自行查阅相关材料。 看到这里,聪明的读者可能已经看出端倪了--wait不就是经过包装的waitpid吗?没错,察看<内核源码目录>/include/unistd.h文件349-352行就会发现以下程序段: static inline id_t wait(int * wait_stat) { return waitpid(-1,wait_stat,0); }
返回值和错误 waitpid的返回值比wait稍微复杂一些,一共有3种情况: ● 当正常返回的时候,waitpid返回收集到的子进程的进程ID;● 如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0; ● 如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;当pid所指示的子进程不存在,或此进程存在,但不是调用进程的子进程,waitpid就会出错返回,这时errno被设置为ECHILD 它: 调用 wait&waitpid 来处理终止的子进程: pid_t wait(int * statloc); pid_t waitpid(pid_t pid,int *statloc, int options); 两个函数都返回两个值:函数的返回值和终止的子进程ID,而子进程终止的状态则是通过statloc指针返回的。 wait&waitpid 的区别是显而易见的,wait等待第一个终止的子进程,而waitpid则可以指定等待特定的子进程。这样的区别可能会在下面这种情况时表现得更加明显:当同时有5个客户连上服务器,也就是说有五个子进程分别对应了5个客户,此时,五个客户几乎在同时请求终止,这样一来,几乎同时,五个FIN发向服务器,同样的,五个SIGCHLD信号到达服务器,然而,UNIX的信号往往是不会排队的,显然这样一来,信号处理函数只会执行一次,残留剩余四个子进程作为僵尸进程驻留在内核空间。此时,正确的解决办法是利用waitpid(-1, &stat, WNOHANG)防止留下僵尸进程。其中的pid为-1表
明等待第一个终止的子进程,而WNOHANG选择项通知内核在没有已终止进程项时不要阻塞。
wait&waitpid 区别 :
waitpid提供了wait函数不能实现的3个功能: waitpid等待特定的子进程, 而wait则返回任一终止状态的子进程; waitpid提供了一个wait的非阻塞版本; waitpid支持作业控制(以WUNTRACED选项). 用于检查wait和waitpid两个函数返回终止状态的宏: 这两个函数返回的子进程状态都保存在statloc指针中, 用以下3个宏可以检查该状态:WIFEXITED(status): 若为正常终止, 则为真. 此时可执行 WEXITSTATUS(status): 取子进程传送给exit或_exit参数的低8位. WIFSIGNALED(status): 若为异常终止, 则为真.此时可执行 WTERMSIG(status): 取使子进程终止的信号编号.WIFSTOPPED(status): 若为当前暂停子进程, 则为真. 此时可执行 WSTOPSIG(status): 取使子进程暂停的信号编号
/************************************************************************* > File Name: process_.c > Author: Simba > Mail: dameng34@163.com > Created Time: Sat 23 Feb 2013 02:34:02 PM CST ************************************************************************/ #include<sys/types.h> #include<sys/stat.h> #include<unistd.h> #include<fcntl.h> #include<stdio.h> #include<stdlib.h> #include<errno.h> #include<string.h> #include<sys/wait.h> #define ERR_EXIT(m) do { perror (m); exit (EXIT_FAILURE); } while (0) int main( int argc, char *argv[]) { pid_t pid; pid = fork(); if (pid == -1) ERR_EXIT( "fork error" ); if (pid == 0) { sleep(3); printf ( "this is childn" ); // exit(100); abort (); } printf ( "this is parentn" ); int status; int ret; ret = wait(&status); // 阻塞等待子进程退出 // ret = waitpid(-1, &status, 0); // ret = waitpid(pid, &status, 0); /* waitpid可以等待特定的进程,而不仅仅是第一个退出的子进程 * 且可以设置option为WNOHANG,即不阻塞等待 */ printf ( "ret=%d, pid=%dn" , ret, pid); if (WIFEXITED(status)) printf ( "child exited normal exit status=%dn" , WEXITSTATUS(status)); else if (WIFSIGNALED(status)) printf ( "child exited abnormal signal number=%dn" , WTERMSIG(status)); else if (WIFSTOPPED(status)) printf ( "child stopped signal number=%dn" , WSTOPSIG(status)); return 0; } |
输出为:
simba@ubuntu:~/Documents/code/linux_programming/APUE/process$ ./wait this is parent this is child ret=7156, pid=7156 child exited abnormal signal number=6
说明子进程被信号异常终止,因为我们调用了abort(), 即产生SIGABRT信号将子进程终止,可以查到此信号序号为6。如果我们不使用abort 而是exit(100), 则应该输出 child exited normal exit status=100 ,即正常退出。
要回收多个子进程 while
- #include <sys/types.h>
- #include <sys/wait.h>
- #include <unistd.h>
- #include <stdio.h>
- int main()
- {
- pid_t pc, pr;
- pc = fork();
- if(pc<0){
- printf("fork error\n");
- }else if(pc == 0){
- printf("child pid = %d\n", getpid());
- }else{
- pr = fork();
- if(pr == 0)
- printf("child pid = %d\n", getpid());
- else{
- printf("parent pid = %d\n", getpid());
- sleep(20);
- while((pr = wait(NULL)) != -1)
- ;
- printf("this is parent process.\n");
- sleep(20);
- }
- }
- exit(0);
- }
运行后, 程序先输出 child pid = 14478 parent pid = 14477 child pid = 14479 然后进入sleep(20); 这时候 开另一个terminal, 运行 ps auxw | grep 1447, 得到 1000 14477 0.0 0.0 4124 316 pts/3 S+ 05:36 0:00 ./wait
1000 14478 0.0 0.0 0 0 pts/3 Z+ 05:36 0:00 [wait] <defunct>
1000 14479 0.0 0.0 0 0 pts/3 Z+ 05:36 0:00 [wait] <defunct>
1000 14499 0.0 0.0 109244 868 pts/5 S+ 05:36 0:00 grep --color=auto 1447
可以看到,两个子进程已经编程僵尸进程
然后20秒后,父进程执行了wait() ,输出 child pid = 14478 parent pid = 14477 child pid = 14479 this is parent process.
这时候,到另一个终端里,再次运行ps 1000 14477 0.0 0.0 4124 316 pts/3 S+ 05:36 0:00 ./wait
1000 14619 0.0 0.0 109244 872 pts/5 S+ 05:37 0:00 grep --color=auto 1447
可以看到两个僵尸子进程已经被回收。。