fork子进程僵尸问题及解决方案

额，原来用 c 写 cgi 的时候用过 fork 。那时候 cgi 的生命很短，所以遇到的问题压根没出现过。这次也是更加深入的对 fork 机制进行了一下了解。

参考这里的文档：http://ju.outofmemory.cn/entry/98971

1. 我们都是小僵尸

下面是这次应用的一个 fork 的例子。主进程继续进行数据处理，一定时间后用下面的代码开新进程，并将处理结果发送出去。看起来似乎没什么问题，但是，一定时间后，fork 总是failed。。。用 ps aux 查看进程列表，列表被僵尸进程占满了！！

...
        if ((pid=fork())<0)
        {
            printf("fork failed \n");
        } 
        else if ( 0 == pid)
        {
            test_result.error_1 = (double)error_1 / test_result.total * 10000;
            test_result.error_2 = (double)error_2 / test_result.total * 10000;
            test_result.error_4 = (double)error_4 / test_result.total * 10000;
            test_result.error_6 = (double)error_6 / test_result.total * 10000;
            
            n = sendto(sock, &test_result, sizeof(test_result), 0, 
                        (struct sockaddr *)&addr_to, sizeof(addr_to));    
            exit(0);
        }
...

好吧，难道 exit(0) 之后，它还在留恋什么？所以，又回来继续摸索什么是最有可能性。

2. 小僵尸找爸爸

好吧，最后目光落到了这里 SIGCHLD。通常，父进程不会始终处于等待状态，它还需要执行其它代码，因此“等待”的工作会使用信号机制来完成；或者说，子进程在处理完任务以后，内核会发送一个SIGCHLD信号。。。对，这孩子还要向它爸做最后的告别。

那孩它爸能做些什么呢？

1）孩它爸也不在了。

2）孩它爸在等待关于这孩子的消息，完成告别仪式，各安天命。

3）孩它爸发布了告示“我没有儿子，你们都别来烦我”。

恩，第一个这是肯定的，因为fork机制天生的属性，如果孩它爸不在了，它会被送给init来监管抚养。。。init是个负责任的好爸爸，他会处理好一切。那接下来两个是怎么回事呢？

3.小僵尸和爸爸最后的告别

用于监督子进程的完成情况，fork配套使用的有waitpid()和wait()两个函数。waitpid()的功能和wait()类似，但waitpid()提供了额外的选项（wait(NULL)等价于waitpid(-1, NULL, 0)）。如，wait()函数是阻塞的，而waitpid()提供了WNOHANG选项，调用后会立刻返回，可根据返回值判断等待结果。

#include <stdint.h>
#include <stdlib.h>
#include <string.h>
#include <stdbool.h>
#include <malloc.h>

#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>

#include <unistd.h>
#include <fcntl.h>

#include <signal.h>

void signal_handler(int signo) {
    if (signo == SIGCHLD) {
        pid_t pid;
        while ((pid = waitpid(-1, NULL, WNOHANG)) > 0) {
            printf("SIGCHLD pid %d\n", pid);
        }
    }
}
void mysleep(int sec) {
    time_t start = time(NULL), elapsed = 0;
    while (elapsed < sec) {
        sleep(sec - elapsed);
        elapsed = time(NULL) - start;
    }
}
int main(int argc, char **argv) {
    signal(SIGCHLD, signal_handler);
    while (1) {
        pid_t pid = fork();
        if (pid > 0) {
            // parent process
            mysleep(5);
        } else if (pid == 0) {
            // child process
            printf("child pid %d\n", getpid());
            return 0;
        } else {
            fprintf(stderr, "fork error\n");
            return 2;
        }
    }
}

比如上面的代码。我们在信号处理中使用了一个循环体，不断调用waitpid()，直到失败为止。那是因为在系统繁忙时，信号可能会被合并，即两个子进程结束只会发送一次SIGCHLD信号，如果只wait()一次，就会产生僵尸进程。（由于默认的sleep()函数会在接收到信号时立即返回，因此为了方便演示，这里定义了mysleep()函数）。

4.做个不负责任的爸爸

很简单，用下面这句话，告诉操作系统，你不关心所有那些子进程的死活。

signal(SIGCHLD, SIG_IGN);

但是，这样做的问题是，有些BSD系统不支持这样的用法。所以，更为广泛的，还是使用wait。

perl中

下面是perl中使用fork-waitpid的代码，也是也不是我写的：

#!/usr/bin/perl

sub REAPER {
    my $pid;
    while (($pid = waitpid(-1, WNOHANG)) > 0) {
        print "SIGCHLD pid $pid\n";
    }
}

$SIG{CHLD} = \&REAPER;
my $pid = fork();
if ($pid > 0) {
    print "[Parent] child pid $pid\n";
    sleep(10);
} elsif ($pid == 0) {
    print "[Child] pid $$\n";
    exit;
}

这个和c基本一样的。如果想要忽略SIGCHLD，可使用$SIG{CHLD} = 'IGNORE'。

posted @ 2015-04-20 15:37 Biiigfish 阅读(4915) 评论(0) 收藏举报

刷新页面返回顶部

勤敬端正

无论在哪里做什么，只要坚持服务、创新、创造价值，其他的东西自然都会来的。 —— (余锋语，我只是拿来用啊)

fork子进程僵尸问题及解决方案

公告