linux c语言 fork() 和 exec 函数的简介和用法
假如我们在编写1个c程序时想调用1个shell脚本或者执行1段 bash shell命令, 应该如何实现呢?
其实在<stdlib.h> 这个头文件中包含了1个调用shell命令或者脚本的函数 system();直接把 shell命令作为参数传入 system函数就可以了, 的确很方便. 关于system 有一段这样的介绍: system 执行时内部会自动启用fork() 新建1个进程, 效率没有直接使用fork() 和 exec函数高.
那么这篇文章其实就是介绍一下fork() 和 exec函数的用法, 以及如何使用它们来替代system函数.
1. fork() 函数
1.1 fork() 函数的作用
一般来讲, 我们编写1个普通的c程序, 运行这个程序直到程序结束, 系统只会分配1个pid给这个程序, 也就就说, 系统里只会有一条关于这个程序的进程.
但是执行了fork() 这个函数就不同了.
fork 这个英文单词在英文里是"分叉"意思, fork() 这个函数作用也很符合这个意思. 它的作用是复制当前进程(包括进程在内存里的堆栈数据)为1个新的镜像. 然后这个新的镜像和旧的进程同时执行下去. 相当于本来1个进程, 遇到fork() 函数后就分叉成两个进程同时执行了. 而且这两个进程是互不影响
参考下面这个小程序:
- int fork_3(){
- printf("it's the main process step 1!!\n\n");
- fork();
- printf("step2 after fork() !!\n\n");
- int i; scanf("%d",&i); //prevent exiting
- return 0;
- }
在这个函数里, 共有两条printf语句, 但是执行执行时则打出了3行信息. 如下图:
为什么呢, 因为fork()函数将这个程序分叉了啊, 见下面的图解:
可以见到程序在fork()函数执行时都只有1条主进程, 所以 step 1 会被打印输出1次.
执行 fork()函数后, 程序分叉成为了两个进程, 1个是原来的主进程, 另1个是新的子进程, 它们都会执行fork() 函数后面的代码, 所以 step2 会被 两条进程分别打印输出各一次, 屏幕上就总共3条printf 语句了!
可以见到这个函数最后面我用了 scanf()函数来防止程序退出, 这时查看系统的进程, 就会发现两个相同名字的进程:
如上图, pid 8808 那个就是主进程了, 而 pid 8809那个就是子进程啊, 因为它的parent pid是 8808啊!
需要注意的是, 假如没有做特殊处理, 子进程会一直存在, 即使fork_3()函数被调用完成, 子进程会和主程序一样,返回调用fork_3() 函数的上一级函数继续执行, 直到整个程序退出.
可以看出, 假如fork_3() 被执行2次, 主程序就会分叉两次, 最终变成4个进程, 是不是有点危险. 所以上面所谓的特殊处理很重要啊!
1.2 区别分主程序和子程序.
实际应用中, 单纯让程序分叉意义不大, 我们新增一个子程序, 很可能是为了让子进程单独执行一段代码. 实现与主进程不同的功能.
要实现上面所说的功能, 实际上就是让子进程和主进程执行不同的代码啊.
所以fork() 实际上有返回值, 而且在两条进程中的返回值是不同的, 在主进程里 fork()函数会返回主进程的pid, 而在子进程里会返回0! 所以我们可以根据fork() 的返回值来判断进程到底是哪个进程, 就可以利用if 语句来执行不同的代码了!
如下面这个小程序fork_1():
- int fork_1(){
- int childpid;
- int i;
- if (fork() == 0){
- //child process
- for (i=1; i<=8; i++){
- printf("This is child process\n");
- }
- }else{
- //parent process
- for(i=1; i<=8; i++){
- printf("This is parent process\n");
- }
- }
- printf("step2 after fork() !!\n\n");
- }
我对fork() 函数的返回值进行了判断, 如果 返回值是0, 我就让认为它是子进程, 否则是主程序. 那么我就可以让这两条进程输出不同的信息了.
输出信息如下图:
可以见到 子程序和主程序分别输出了8条不同的信息, 但是它们并不是规则交替输出的, 因为它们两条进程是互相平行影响的, 谁的手快就在屏幕上先输出, 每次运行的结果都有可能不同哦.
下面是图解:
由图解知两条进程都对fork()返回值执行判断, 在if 判断语句中分别执行各自的代码. 但是if判断完成后, 还是会回各自执行接下来的代码. 所以 step2 还是输出了2次.
1.4 使用exit() 函数令子进程在if 判断内结束.
参考上面的函数, 虽然使用if 对 fork() 的返回值进行判断, 实现了子进程和 主进程在if判断的范围内执行了不同的代码, 但是就如上面的流程图, 一旦if执行完成, 他们还是会各自执行后面的代码.
通常这不是我们期望的, 我们更多时会希望子进程执行一段特别的代码后就让他结束, 后面的代码让主程序执行就行了.
这个实现起来很简单, 在子程序的if 条件内最后加上exit() 函数就ok了.
将上面的fork_1()函数修改一下, 加上exit语句:
- int fork_1(){
- int childpid;
- int i;
- if (fork() == 0){
- //child process
- for (i=1; i<=8; i++){
- printf("This is child process\n");
- }
- exit(0);
- }else{
- //parent process
- for(i=1; i<=8; i++){
- printf("This is parent process\n");
- }
- }
- printf("step2 after fork() !!\n\n");
- }
再看看输出:
可以见到, step2只输出1次了, 这是因为子程序在 if条件内结束了啊, 一旦 if 判断成, 就只剩下1个主进程执行下面的代码了, 这正是我们想要的!
注意: exit() 函数在 stdlib.h 头文件内
流程图:
1.4 使用wait() 函数主程序等子程序执行完成(退出)后再执行.
由上面例子得知, 主程序和子程序的执行次序是随机的, 但是实际情况下, 通常我们希望子进程执行后, 才继续执行主进程.
例如对于上面的fork_1()函数, 我想先输出子进程的8个 "This is child process" 然后再输出 8个 主进程"This is parent process", 改如何做?
wait()函数就提供了这个功能, 在if 条件内的 主进程呢部分内 加上wait() 函数, 就可以让主进程执行fork()函数时先hold 住, 等子进程退出后再执行, 通常会配合子进程的exit()函数一同使用.
我将fork_1()函数修改一下, 添加了wait()语句:
- int fork_1(){
- int childpid;
- int i;
- if (fork() == 0){
- //child process
- for (i=1; i<=8; i++){
- printf("This is child process\n");
- }
- exit(0);
- }else{
- //parent process
- wait();
- for(i=1; i<=8; i++){
- printf("This is parent process\n");
- }
- }
- printf("step2 after fork() !!\n\n");
- }
输出:
见到这时的屏幕输出就很有规律了!
其实wait() 函数还有1个功能, 就是可以接收1个 pid_t(在unistd.h内,其实就是Int啦) 指针类型参数, 给这个参数赋上子进程退出前的系统pid值
流程图:
2. exec 函数组
需要注意的是exec并不是1个函数, 其实它只是一组函数的统称, 它包括下面6个函数:
- #include <unistd.h>
- int execl(const char *path, const char *arg, ...);
- int execlp(const char *file, const char *arg, ...);
- int execle(const char *path, const char *arg, ..., char *const envp[]);
- int execv(const char *path, char *const argv[]);
- int execvp(const char *file, char *const argv[]);
- int execve(const char *path, char *const argv[], char *const envp[]);
可以见到这6个函数名字不同, 而且他们用于接受的参数也不同.
实际上他们的功能都是差不多的, 因为要用于接受不同的参数所以要用不同的名字区分它们, 毕竟c语言没有函数重载的功能嘛..
但是实际上它们的命名是有规律的:
exec[l or v][p][e]
exec函数里的参数可以分成3个部分, 执行文件部分, 命令参数部分, 环境变量部分.
例如我要执行1个命令 ls -l /home/gateman
执行文件部分就是 "/usr/bin/ls"
命令参赛部分就是 "ls","-l","/home/gateman",NULL 见到是以ls开头 每1个空格都必须分开成2个部分, 而且以NULL结尾的啊.
环境变量部分, 这是1个数组,最后的元素必须是NULL 例如 char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};
好了说下命名规则:
e后续, 参数必须带环境变量部分, 环境变零部分参数会成为执行exec函数期间的环境变量, 比较少用
l 后续, 命令参数部分必须以"," 相隔, 最后1个命令参数必须是NULL
v 后续, 命令参数部分必须是1个以NULL结尾的字符串指针数组的头部指针. 例如char * pstr就是1个字符串的指针, char * pstr[] 就是数组了, 分别指向各个字符串.
p后续, 执行文件部分可以不带路径, exec函数会在$PATH中找
还有1个注意的是, exec函数会取代执行它的进程, 也就是说, 一旦exec函数执行成功, 它就不会返回了, 进程结束. 但是如果exec函数执行失败, 它会返回失败的信息, 而且进程继续执行后面的代码!
通常exec会放在fork() 函数的子进程部分, 来替代子进程执行啦, 执行成功后子程序就会消失, 但是执行失败的话, 必须用exit()函数来让子进程退出!
下面是各个例子:
2.1 execv 函数
- int childpid;
- int i;
- if (fork() == 0){
- //child process
- char * execv_str[] = {"echo", "executed by execv",NULL};
- if (execv("/usr/bin/echo",execv_str) <0 ){
- perror("error on exec");
- exit(0);
- }
- }else{
- //parent process
- wait(&childpid);
- printf("execv done\n\n");
- }
2.2 execvp 函数
- if (fork() == 0){
- //child process
- char * execvp_str[] = {"echo", "executed by execvp",">>", "~/abc.txt",NULL};
- if (execvp("echo",execvp_str) <0 ){
- perror("error on exec");
- exit(0);
- }
- }else{
- //parent process
- wait(&childpid);
- printf("execvp done\n\n");
- }
2.3 execve 函数
- if (fork() == 0){
- //child process
- char * execve_str[] = {"env",NULL};
- char * env[] = {"PATH=/tmp", "USER=lei", "STATUS=testing", NULL};
- if (execve("/usr/bin/env",execve_str,env) <0 ){
- perror("error on exec");
- exit(0);
- }
- }else{
- //parent process
- wait(&childpid);
- printf("execve done\n\n");
- }
2.4 execl 函数
- if (fork() == 0){
- //child process
- if (execl("/usr/bin/echo","echo","executed by execl" ,NULL) <0 ){
- perror("error on exec");
- exit(0);
- }
- }else{
- //parent process
- wait(&childpid);
- printf("execv done\n\n");
- }
2.5 execlp 函数
- if (fork() == 0){
- //child process
- if (execlp("echo","echo","executed by execlp" ,NULL) <0 ){
- perror("error on exec");
- exit(0);
- }
- }else{
- //parent process
- wait(&childpid);
- printf("execlp done\n\n");
- }
2.6 execle 函数
- if (fork() == 0){
- //child process
- char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};
- if (execle("/usr/bin/env","env",NULL,env) <0){
- perror("error on exec");
- exit(0);
- }
- }else{
- //parent process
- wait(&childpid);
- printf("execle done\n\n");
- }
输出:
3. fork() 和exec 函数与system()函数比较
见到上面execvp函数的输出. 你会发现 exec函数只是系统调用, 它是不支持管线处理的
而system()函数是支持的. 他的内部会自动fork() 1个子进程,但是效率没有fork() 和 exec配合使用好.
但是exec 支持执行脚本. 所以不需要管线处理的命令或者脚本可以利用fork() 和 exec函数来执行.
4. 利用 fwrite() ,fork() 和exec 函数 替代system()函数.
上面讲过了, 虽然exec函数不支持管线, 而且命令参数复杂, 但是它支持执行脚本啊, 所以我们可以使用fwrite将 有管线处理的命令写入1个脚本中, 然后利用exec函数来执行这个脚本.
下面会编写1个base_exec(char *) 函数, 接收1个字符串参数, 然后执行它.
这里只会大概写出这个函数的逻辑步骤:
1. 利用getuid函数获得当前的pid, 然后利用pid获得当前唯一的文件名, 避免因为相同程序同时执行发生冲突!
2. 利用fwrite函数在 /tmp/下面 建立1个上面文件名的脚本文件. 因为/tmp/ 任何用户都可以读写啊
3. 把命令参数写入脚本
4. 利用fork() 和 exec() 执行这个脚本
5. 有需要的话当exec执行完, 记录日志.
下面就是i代码:
头文件:
base_exec.h
- #ifndef __BASE_EXEC_H_
- #define __BASE_EXEC_H_
- int base_exec(char *) ;
- #endif /* BASE_EXEC_H_ */
源文件:
base_exec.c
- #include "base_exec.h"
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
- #include <unistd.h>
- #include <time.h>
- #define LOGFILE "/home/gateman/logs/c_exec.log"
- int base_exec(char * pcmd){
- FILE * pf;
- pid_t pid = getpid();
- char pfilename[20];
- sprintf(pfilename, "/tmp/base_exec%d.sh",pid);
- pf=fopen(pfilename,"w"); //w is overwrite, a is add
- if (NULL == pf){
- printf("fail to open the file base_exec.sh!!!\n");
- return -1;
- }
- fwrite("#!/bin/bash\n", 12, 1, pf);
- fwrite(pcmd, strlen(pcmd),1, pf);
- fwrite("\n", 1,1, pf);
- fclose(pf);
- if (fork() ==0 ){
- //child processj
- char * execv_str[] = {"bash", pfilename, NULL};
- if (execv("/bin/bash",execv_str) < 0){
- perror("fail to execv");
- exit(-1);
- }
- }else{
- //current process
- wait();
- pf=fopen(LOGFILE,"a");
- if (NULL == pf){
- printf("fail to open the logfile !!!\n");
- return -1;
- }
- time_t t;
- struct tm * ptm;
- time(&t);
- ptm = gmtime(&t);
- char cstr[24];
- sprintf (cstr, "time: %4d-%02d-%02d %02d:%02d:%02d\n", 1900+ptm->tm_year,ptm->tm_mon,ptm->tm_mday,ptm->tm_hour,ptm->tm_min,ptm->tm_sec);
- fwrite(cstr, strlen(cstr),1, pf);
- int uid = getuid();
- sprintf(cstr, "uid: %d\ncommand:\n",uid);
- fwrite(cstr, strlen(cstr),1, pf);
- fwrite(pcmd, strlen(pcmd),1, pf);
- fwrite("\n\n\n", 3,1, pf);
- fclose(pf);
- remove(pfilename);
- return 0;
- }
- return 0;
- }