linux c语言 fork() 和 exec 函数的简介和用法

 

      假如我们在编写1个c程序时想调用1个shell脚本或者执行1段 bash shell命令, 应该如何实现呢?

      其实在<stdlib.h> 这个头文件中包含了1个调用shell命令或者脚本的函数 system();直接把 shell命令作为参数传入 system函数就可以了, 的确很方便. 关于system 有一段这样的介绍:   system 执行时内部会自动启用fork() 新建1个进程,  效率没有直接使用fork() 和 exec函数高.

 

       那么这篇文章其实就是介绍一下fork() 和 exec函数的用法, 以及如何使用它们来替代system函数.

      

1. fork() 函数

1.1 fork() 函数的作用

       一般来讲, 我们编写1个普通的c程序, 运行这个程序直到程序结束, 系统只会分配1个pid给这个程序, 也就就说, 系统里只会有一条关于这个程序的进程.

 

        但是执行了fork() 这个函数就不同了. 

        fork 这个英文单词在英文里是"分叉"意思,  fork() 这个函数作用也很符合这个意思.  它的作用是复制当前进程(包括进程在内存里的堆栈数据)为1个新的镜像. 然后这个新的镜像和旧的进程同时执行下去. 相当于本来1个进程, 遇到fork() 函数后就分叉成两个进程同时执行了. 而且这两个进程是互不影响

 

        参考下面这个小程序:

 

[cpp] view plain copy
 
  1. int fork_3(){  
  2.     printf("it's the main process step 1!!\n\n");  
  3.   
  4.     fork();  
  5.   
  6.     printf("step2 after fork() !!\n\n");  
  7.   
  8.     int i; scanf("%d",&i);   //prevent exiting  
  9.     return 0;  
  10. }  


 

          在这个函数里, 共有两条printf语句, 但是执行执行时则打出了3行信息. 如下图: 

 

            为什么呢, 因为fork()函数将这个程序分叉了啊,  见下面的图解:

 

         可以见到程序在fork()函数执行时都只有1条主进程, 所以 step 1 会被打印输出1次.

         执行 fork()函数后,  程序分叉成为了两个进程, 1个是原来的主进程,  另1个是新的子进程, 它们都会执行fork() 函数后面的代码, 所以 step2 会被 两条进程分别打印输出各一次, 屏幕上就总共3条printf 语句了!

 

         可以见到这个函数最后面我用了 scanf()函数来防止程序退出,  这时查看系统的进程, 就会发现两个相同名字的进程:

 

 

如上图, pid 8808 那个就是主进程了, 而 pid  8809那个就是子进程啊, 因为它的parent pid是 8808啊!

          

          需要注意的是, 假如没有做特殊处理, 子进程会一直存在, 即使fork_3()函数被调用完成,  子进程会和主程序一样,返回调用fork_3() 函数的上一级函数继续执行, 直到整个程序退出.

 

          可以看出, 假如fork_3() 被执行2次,  主程序就会分叉两次, 最终变成4个进程, 是不是有点危险. 所以上面所谓的特殊处理很重要啊!

 

1.2 区别分主程序和子程序.

        实际应用中, 单纯让程序分叉意义不大, 我们新增一个子程序, 很可能是为了让子进程单独执行一段代码. 实现与主进程不同的功能.

         要实现上面所说的功能, 实际上就是让子进程和主进程执行不同的代码啊.

         所以fork() 实际上有返回值, 而且在两条进程中的返回值是不同的, 在主进程里 fork()函数会返回主进程的pid,   而在子进程里会返回0!   所以我们可以根据fork() 的返回值来判断进程到底是哪个进程, 就可以利用if 语句来执行不同的代码了!

 

        如下面这个小程序fork_1():

 

[cpp] view plain copy
 
  1. int fork_1(){  
  2.     int childpid;  
  3.     int i;  
  4.   
  5.     if (fork() == 0){  
  6.         //child process  
  7.         for (i=1; i<=8; i++){  
  8.             printf("This is child process\n");  
  9.         }  
  10.     }else{  
  11.         //parent process  
  12.         for(i=1; i<=8; i++){  
  13.             printf("This is parent process\n");  
  14.         }  
  15.     }  
  16.   
  17.     printf("step2 after fork() !!\n\n");  
  18. }  

        我对fork() 函数的返回值进行了判断, 如果 返回值是0, 我就让认为它是子进程, 否则是主程序.  那么我就可以让这两条进程输出不同的信息了.

 

       

          输出信息如下图:

 

          可以见到 子程序和主程序分别输出了8条不同的信息,  但是它们并不是规则交替输出的, 因为它们两条进程是互相平行影响的, 谁的手快就在屏幕上先输出,  每次运行的结果都有可能不同哦.

 

        下面是图解:

 

          由图解知两条进程都对fork()返回值执行判断,  在if 判断语句中分别执行各自的代码.  但是if判断完成后,  还是会回各自执行接下来的代码. 所以 step2 还是输出了2次.

1.4 使用exit() 函数令子进程在if 判断内结束.

          参考上面的函数, 虽然使用if 对 fork() 的返回值进行判断,  实现了子进程和 主进程在if判断的范围内执行了不同的代码,  但是就如上面的流程图, 一旦if执行完成, 他们还是会各自执行后面的代码. 

          通常这不是我们期望的,  我们更多时会希望子进程执行一段特别的代码后就让他结束,  后面的代码让主程序执行就行了.

          这个实现起来很简单, 在子程序的if 条件内最后加上exit() 函数就ok了.

 

         将上面的fork_1()函数修改一下, 加上exit语句:

 

[cpp] view plain copy
 
  1. int fork_1(){  
  2.     int childpid;  
  3.     int i;  
  4.   
  5.     if (fork() == 0){  
  6.         //child process  
  7.         for (i=1; i<=8; i++){  
  8.             printf("This is child process\n");  
  9.         }  
  10.         exit(0);  
  11.     }else{  
  12.         //parent process  
  13.         for(i=1; i<=8; i++){  
  14.             printf("This is parent process\n");  
  15.         }  
  16.     }  
  17.   
  18.     printf("step2 after fork() !!\n\n");  
  19. }  

       再看看输出:

 

 


            可以见到, step2只输出1次了,   这是因为子程序在 if条件内结束了啊, 一旦 if 判断成, 就只剩下1个主进程执行下面的代码了, 这正是我们想要的!

            注意: exit() 函数在 stdlib.h 头文件内

 

流程图:

 

 

 

1.4 使用wait() 函数主程序等子程序执行完成(退出)后再执行.   

 

        由上面例子得知,  主程序和子程序的执行次序是随机的,  但是实际情况下, 通常我们希望子进程执行后,  才继续执行主进程. 

        例如对于上面的fork_1()函数, 我想先输出子进程的8个 "This is child process"  然后再输出 8个 主进程"This is parent process", 改如何做?

        wait()函数就提供了这个功能,    在if 条件内的  主进程呢部分内 加上wait() 函数, 就可以让主进程执行fork()函数时先hold 住, 等子进程退出后再执行, 通常会配合子进程的exit()函数一同使用.

 

        我将fork_1()函数修改一下, 添加了wait()语句:

 

[cpp] view plain copy
 
  1. int fork_1(){  
  2.     int childpid;  
  3.     int i;  
  4.   
  5.     if (fork() == 0){  
  6.         //child process  
  7.         for (i=1; i<=8; i++){  
  8.             printf("This is child process\n");  
  9.         }  
  10.         exit(0);  
  11.     }else{  
  12.         //parent process  
  13.         wait();  
  14.         for(i=1; i<=8; i++){  
  15.             printf("This is parent process\n");  
  16.         }  
  17.     }  
  18.   
  19.     printf("step2 after fork() !!\n\n");  
  20. }  

 

输出:

 

      见到这时的屏幕输出就很有规律了!

      其实wait() 函数还有1个功能, 就是可以接收1个 pid_t(在unistd.h内,其实就是Int啦) 指针类型参数,   给这个参数赋上子进程退出前的系统pid值

     流程图:

  

 

 

 

 

2. exec 函数组

 

      需要注意的是exec并不是1个函数, 其实它只是一组函数的统称, 它包括下面6个函数:

     

[cpp] view plain copy
 
  1. #include <unistd.h>  
  2.   
  3. int execl(const char *path, const char *arg, ...);  
  4.   
  5. int execlp(const char *file, const char *arg, ...);  
  6.   
  7. int execle(const char *path, const char *arg, ..., char *const envp[]);  
  8.   
  9. int execv(const char *path, char *const argv[]);  
  10.   
  11. int execvp(const char *file, char *const argv[]);  
  12.   
  13. int execve(const char *path, char *const argv[], char *const envp[]);  

 

       可以见到这6个函数名字不同, 而且他们用于接受的参数也不同.

       实际上他们的功能都是差不多的, 因为要用于接受不同的参数所以要用不同的名字区分它们, 毕竟c语言没有函数重载的功能嘛..  

 

       但是实际上它们的命名是有规律的:

       exec[l or v][p][e]

       exec函数里的参数可以分成3个部分,      执行文件部分,     命令参数部分,   环境变量部分.

        例如我要执行1个命令   ls -l /home/gateman  

        执行文件部分就是  "/usr/bin/ls"

        命令参赛部分就是 "ls","-l","/home/gateman",NULL              见到是以ls开头 每1个空格都必须分开成2个部分, 而且以NULL结尾的啊.

        环境变量部分, 这是1个数组,最后的元素必须是NULL 例如  char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};

        

        好了说下命名规则:

        e后续,  参数必须带环境变量部分,   环境变零部分参数会成为执行exec函数期间的环境变量, 比较少用

        l 后续,   命令参数部分必须以"," 相隔, 最后1个命令参数必须是NULL

        v 后续,   命令参数部分必须是1个以NULL结尾的字符串指针数组的头部指针.         例如char * pstr就是1个字符串的指针, char * pstr[] 就是数组了, 分别指向各个字符串.

        p后续,   执行文件部分可以不带路径, exec函数会在$PATH中找

 

          

         还有1个注意的是, exec函数会取代执行它的进程,  也就是说, 一旦exec函数执行成功, 它就不会返回了, 进程结束.   但是如果exec函数执行失败, 它会返回失败的信息,  而且进程继续执行后面的代码!

 

       通常exec会放在fork() 函数的子进程部分, 来替代子进程执行啦, 执行成功后子程序就会消失,  但是执行失败的话, 必须用exit()函数来让子进程退出!

       下面是各个例子:

 

2.1  execv 函数

 

[cpp] view plain copy
 
  1. int childpid;  
  2. int i;  
  3.   
  4. if (fork() == 0){  
  5.     //child process  
  6.     char * execv_str[] = {"echo", "executed by execv",NULL};  
  7.     if (execv("/usr/bin/echo",execv_str) <0 ){  
  8.         perror("error on exec");  
  9.         exit(0);  
  10.     }  
  11. }else{  
  12.     //parent process  
  13.     wait(&childpid);  
  14.     printf("execv done\n\n");  
  15. }  
注意字符串指针数组的定义和赋值

 

 

2.2  execvp 函数

 

 

[cpp] view plain copy
 
  1. if (fork() == 0){  
  2.     //child process  
  3.     char * execvp_str[] = {"echo", "executed by execvp",">>", "~/abc.txt",NULL};  
  4.     if (execvp("echo",execvp_str) <0 ){  
  5.         perror("error on exec");  
  6.         exit(0);  
  7.     }  
  8. }else{  
  9.     //parent process  
  10.     wait(&childpid);  
  11.     printf("execvp done\n\n");  
  12. }  

 

2.3 execve 函数

 

[cpp] view plain copy
 
  1. if (fork() == 0){  
  2.     //child process  
  3.     char * execve_str[] = {"env",NULL};  
  4.     char * env[] = {"PATH=/tmp", "USER=lei", "STATUS=testing", NULL};  
  5.     if (execve("/usr/bin/env",execve_str,env) <0 ){  
  6.         perror("error on exec");  
  7.         exit(0);  
  8.     }  
  9. }else{  
  10.     //parent process  
  11.     wait(&childpid);  
  12.     printf("execve done\n\n");  
  13. }  

 

 

2.4 execl 函数

 

[cpp] view plain copy
 
  1. if (fork() == 0){  
  2.     //child process  
  3.     if (execl("/usr/bin/echo","echo","executed by execl" ,NULL) <0 ){  
  4.         perror("error on exec");  
  5.         exit(0);  
  6.     }  
  7. }else{  
  8.     //parent process  
  9.     wait(&childpid);  
  10.     printf("execv done\n\n");  
  11. }  

 

2.5 execlp 函数

 

[cpp] view plain copy
 
  1. if (fork() == 0){  
  2.     //child process  
  3.     if (execlp("echo","echo","executed by execlp" ,NULL) <0 ){  
  4.         perror("error on exec");  
  5.         exit(0);  
  6.     }  
  7. }else{  
  8.     //parent process  
  9.     wait(&childpid);  
  10.     printf("execlp done\n\n");  
  11. }  


 

2.6 execle 函数

 

[cpp] view plain copy
 
  1. if (fork() == 0){  
  2.     //child process  
  3.     char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};  
  4.     if (execle("/usr/bin/env","env",NULL,env) <0){  
  5.         perror("error on exec");  
  6.         exit(0);  
  7.     }  
  8. }else{  
  9.     //parent process  
  10.     wait(&childpid);  
  11.     printf("execle done\n\n");  
  12. }  


 

 

 输出:


 

 

3. fork() 和exec 函数与system()函数比较

     见到上面execvp函数的输出. 你会发现 exec函数只是系统调用, 它是不支持管线处理的

     而system()函数是支持的.   他的内部会自动fork() 1个子进程,但是效率没有fork() 和 exec配合使用好.

 

     但是exec 支持执行脚本.  所以不需要管线处理的命令或者脚本可以利用fork() 和 exec函数来执行.

 

 

4. 利用 fwrite() ,fork() 和exec 函数 替代system()函数.

 

     上面讲过了, 虽然exec函数不支持管线, 而且命令参数复杂, 但是它支持执行脚本啊, 所以我们可以使用fwrite将 有管线处理的命令写入1个脚本中, 然后利用exec函数来执行这个脚本.

     下面会编写1个base_exec(char *) 函数, 接收1个字符串参数,   然后执行它.

 

      这里只会大概写出这个函数的逻辑步骤:

      1. 利用getuid函数获得当前的pid,  然后利用pid获得当前唯一的文件名, 避免因为相同程序同时执行发生冲突!

      2.  利用fwrite函数在 /tmp/下面  建立1个上面文件名的脚本文件.     因为/tmp/ 任何用户都可以读写啊

     3.  把命令参数写入脚本

     4. 利用fork() 和 exec() 执行这个脚本

     5. 有需要的话当exec执行完, 记录日志.

 

     下面就是i代码:

头文件:

base_exec.h

 

[cpp] view plain copy
 
  1. #ifndef __BASE_EXEC_H_  
  2. #define __BASE_EXEC_H_  
  3.   
  4.     int base_exec(char *) ;  
  5.   
  6. #endif /* BASE_EXEC_H_ */  

源文件:

 

base_exec.c

 

[cpp] view plain copy
 
  1. #include "base_exec.h"  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4. #include <string.h>  
  5. #include <unistd.h>  
  6. #include <time.h>  
  7.   
  8. #define LOGFILE "/home/gateman/logs/c_exec.log"  
  9.   
  10. int base_exec(char * pcmd){  
  11.     FILE * pf;  
  12.     pid_t pid = getpid();  
  13.     char pfilename[20];  
  14.     sprintf(pfilename, "/tmp/base_exec%d.sh",pid);  
  15.   
  16.     pf=fopen(pfilename,"w"); //w is overwrite, a is add  
  17.     if (NULL == pf){  
  18.         printf("fail to open the file base_exec.sh!!!\n");  
  19.         return -1;  
  20.     }  
  21.   
  22.     fwrite("#!/bin/bash\n", 12, 1, pf);  
  23.     fwrite(pcmd, strlen(pcmd),1, pf);  
  24.     fwrite("\n", 1,1, pf);  
  25.   
  26.     fclose(pf);  
  27.   
  28.     if (fork() ==0 ){  
  29.         //child processj  
  30.         char * execv_str[] = {"bash", pfilename, NULL};  
  31.         if (execv("/bin/bash",execv_str) < 0){  
  32.             perror("fail to execv");  
  33.             exit(-1);  
  34.         }  
  35.     }else{  
  36.         //current process  
  37.         wait();  
  38.         pf=fopen(LOGFILE,"a");  
  39.   
  40.         if (NULL == pf){  
  41.             printf("fail to open the logfile !!!\n");  
  42.             return -1;  
  43.         }  
  44.         time_t t;  
  45.         struct tm * ptm;  
  46.         time(&t);  
  47.         ptm  = gmtime(&t);  
  48.         char cstr[24];  
  49.         sprintf (cstr, "time: %4d-%02d-%02d %02d:%02d:%02d\n", 1900+ptm->tm_year,ptm->tm_mon,ptm->tm_mday,ptm->tm_hour,ptm->tm_min,ptm->tm_sec);  
  50.         fwrite(cstr, strlen(cstr),1, pf);  
  51.   
  52.         int uid = getuid();  
  53.         sprintf(cstr, "uid: %d\ncommand:\n",uid);  
  54.         fwrite(cstr, strlen(cstr),1, pf);  
  55.   
  56.         fwrite(pcmd, strlen(pcmd),1, pf);  
  57.         fwrite("\n\n\n", 3,1, pf);  
  58.         fclose(pf);  
  59.         remove(pfilename);  
  60.         return 0;  
  61.     }  
  62.     return 0;  
  63. }  
posted on 2017-12-24 15:33  学习记录园  阅读(20482)  评论(2编辑  收藏  举报