linux c语言 fork() 和 exec 函数的简介和用法

假如我们在编写1个c程序时想调用1个shell脚本或者执行1段 bash shell命令, 应该如何实现呢?

其实在<stdlib.h> 这个头文件中包含了1个调用shell命令或者脚本的函数 system();直接把 shell命令作为参数传入 system函数就可以了, 的确很方便. 关于system 有一段这样的介绍: system 执行时内部会自动启用fork() 新建1个进程, 效率没有直接使用fork() 和 exec函数高.

那么这篇文章其实就是介绍一下fork() 和 exec函数的用法, 以及如何使用它们来替代system函数.

1. fork() 函数

1.1 fork() 函数的作用

一般来讲, 我们编写1个普通的c程序, 运行这个程序直到程序结束, 系统只会分配1个pid给这个程序, 也就就说, 系统里只会有一条关于这个程序的进程.

但是执行了fork() 这个函数就不同了.

fork 这个英文单词在英文里是"分叉"意思, fork() 这个函数作用也很符合这个意思. 它的作用是复制当前进程(包括进程在内存里的堆栈数据)为1个新的镜像. 然后这个新的镜像和旧的进程同时执行下去. 相当于本来1个进程, 遇到fork() 函数后就分叉成两个进程同时执行了. 而且这两个进程是互不影响

参考下面这个小程序:

[cpp] view plain copy

int fork_3(){
printf("it's the main process step 1!!\n\n");
fork();
printf("step2 after fork() !!\n\n");
int i; scanf("%d",&i); //prevent exiting
return 0;
}

在这个函数里, 共有两条printf语句, 但是执行执行时则打出了3行信息. 如下图:

为什么呢, 因为fork()函数将这个程序分叉了啊, 见下面的图解:

可以见到程序在fork()函数执行时都只有1条主进程, 所以 step 1 会被打印输出1次.

执行 fork()函数后, 程序分叉成为了两个进程, 1个是原来的主进程, 另1个是新的子进程, 它们都会执行fork() 函数后面的代码, 所以 step2 会被两条进程分别打印输出各一次, 屏幕上就总共3条printf 语句了!

可以见到这个函数最后面我用了 scanf()函数来防止程序退出, 这时查看系统的进程, 就会发现两个相同名字的进程:

如上图, pid 8808 那个就是主进程了, 而 pid 8809那个就是子进程啊, 因为它的parent pid是 8808啊!

需要注意的是, 假如没有做特殊处理, 子进程会一直存在, 即使fork_3()函数被调用完成, 子进程会和主程序一样,返回调用fork_3() 函数的上一级函数继续执行, 直到整个程序退出.

可以看出, 假如fork_3() 被执行2次, 主程序就会分叉两次, 最终变成4个进程, 是不是有点危险. 所以上面所谓的特殊处理很重要啊!

1.2 区别分主程序和子程序.

实际应用中, 单纯让程序分叉意义不大, 我们新增一个子程序, 很可能是为了让子进程单独执行一段代码. 实现与主进程不同的功能.

要实现上面所说的功能, 实际上就是让子进程和主进程执行不同的代码啊.

所以fork() 实际上有返回值, 而且在两条进程中的返回值是不同的, 在主进程里 fork()函数会返回主进程的pid, 而在子进程里会返回0! 所以我们可以根据fork() 的返回值来判断进程到底是哪个进程, 就可以利用if 语句来执行不同的代码了!

如下面这个小程序fork_1():

[cpp] view plain copy

int fork_1(){
int childpid;
int i;
if (fork() == 0){
//child process
for (i=1; i<=8; i++){
printf("This is child process\n");
}
}else{
//parent process
for(i=1; i<=8; i++){
printf("This is parent process\n");
}
}
printf("step2 after fork() !!\n\n");
}

我对fork() 函数的返回值进行了判断, 如果返回值是0, 我就让认为它是子进程, 否则是主程序. 那么我就可以让这两条进程输出不同的信息了.

输出信息如下图:

可以见到子程序和主程序分别输出了8条不同的信息, 但是它们并不是规则交替输出的, 因为它们两条进程是互相平行影响的, 谁的手快就在屏幕上先输出, 每次运行的结果都有可能不同哦.

下面是图解:

由图解知两条进程都对fork()返回值执行判断, 在if 判断语句中分别执行各自的代码. 但是if判断完成后, 还是会回各自执行接下来的代码. 所以 step2 还是输出了2次.

1.4 使用exit() 函数令子进程在if 判断内结束.

参考上面的函数, 虽然使用if 对 fork() 的返回值进行判断, 实现了子进程和主进程在if判断的范围内执行了不同的代码, 但是就如上面的流程图, 一旦if执行完成, 他们还是会各自执行后面的代码.

通常这不是我们期望的, 我们更多时会希望子进程执行一段特别的代码后就让他结束, 后面的代码让主程序执行就行了.

这个实现起来很简单, 在子程序的if 条件内最后加上exit() 函数就ok了.

将上面的fork_1()函数修改一下, 加上exit语句:

[cpp] view plain copy

int fork_1(){
int childpid;
int i;
if (fork() == 0){
//child process
for (i=1; i<=8; i++){
printf("This is child process\n");
}
exit(0);
}else{
//parent process
for(i=1; i<=8; i++){
printf("This is parent process\n");
}
}
printf("step2 after fork() !!\n\n");
}

再看看输出:

可以见到, step2只输出1次了, 这是因为子程序在 if条件内结束了啊, 一旦 if 判断成, 就只剩下1个主进程执行下面的代码了, 这正是我们想要的!

注意: exit() 函数在 stdlib.h 头文件内

流程图:

1.4 使用wait() 函数主程序等子程序执行完成(退出)后再执行.

由上面例子得知, 主程序和子程序的执行次序是随机的, 但是实际情况下, 通常我们希望子进程执行后, 才继续执行主进程.

例如对于上面的fork_1()函数, 我想先输出子进程的8个 "This is child process" 然后再输出 8个主进程"This is parent process", 改如何做?

wait()函数就提供了这个功能, 在if 条件内的主进程呢部分内加上wait() 函数, 就可以让主进程执行fork()函数时先hold 住, 等子进程退出后再执行, 通常会配合子进程的exit()函数一同使用.

我将fork_1()函数修改一下, 添加了wait()语句:

[cpp] view plain copy

int fork_1(){
int childpid;
int i;
if (fork() == 0){
//child process
for (i=1; i<=8; i++){
printf("This is child process\n");
}
exit(0);
}else{
//parent process
wait();
for(i=1; i<=8; i++){
printf("This is parent process\n");
}
}
printf("step2 after fork() !!\n\n");
}

输出:

见到这时的屏幕输出就很有规律了!

其实wait() 函数还有1个功能, 就是可以接收1个 pid_t(在unistd.h内,其实就是Int啦) 指针类型参数, 给这个参数赋上子进程退出前的系统pid值

流程图:

2. exec 函数组

需要注意的是exec并不是1个函数, 其实它只是一组函数的统称, 它包括下面6个函数:

[cpp] view plain copy

#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

可以见到这6个函数名字不同, 而且他们用于接受的参数也不同.

实际上他们的功能都是差不多的, 因为要用于接受不同的参数所以要用不同的名字区分它们, 毕竟c语言没有函数重载的功能嘛..

但是实际上它们的命名是有规律的:

exec[l or v][p][e]

exec函数里的参数可以分成3个部分, 执行文件部分, 命令参数部分, 环境变量部分.

例如我要执行1个命令 ls -l /home/gateman

执行文件部分就是 "/usr/bin/ls"

命令参赛部分就是 "ls","-l","/home/gateman",NULL 见到是以ls开头每1个空格都必须分开成2个部分, 而且以NULL结尾的啊.

环境变量部分, 这是1个数组,最后的元素必须是NULL 例如 char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};

好了说下命名规则:

e后续, 参数必须带环境变量部分, 环境变零部分参数会成为执行exec函数期间的环境变量, 比较少用

l 后续, 命令参数部分必须以"," 相隔, 最后1个命令参数必须是NULL

v 后续, 命令参数部分必须是1个以NULL结尾的字符串指针数组的头部指针. 例如char * pstr就是1个字符串的指针, char * pstr[] 就是数组了, 分别指向各个字符串.

p后续, 执行文件部分可以不带路径, exec函数会在$PATH中找

还有1个注意的是, exec函数会取代执行它的进程, 也就是说, 一旦exec函数执行成功, 它就不会返回了, 进程结束. 但是如果exec函数执行失败, 它会返回失败的信息, 而且进程继续执行后面的代码!

通常exec会放在fork() 函数的子进程部分, 来替代子进程执行啦, 执行成功后子程序就会消失, 但是执行失败的话, 必须用exit()函数来让子进程退出!

下面是各个例子:

2.1 execv 函数

[cpp] view plain copy

int childpid;
int i;
if (fork() == 0){
//child process
char * execv_str[] = {"echo", "executed by execv",NULL};
if (execv("/usr/bin/echo",execv_str) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execv done\n\n");
}

注意字符串指针数组的定义和赋值

2.2 execvp 函数

[cpp] view plain copy

if (fork() == 0){
//child process
char * execvp_str[] = {"echo", "executed by execvp",">>", "~/abc.txt",NULL};
if (execvp("echo",execvp_str) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execvp done\n\n");
}

2.3 execve 函数

[cpp] view plain copy

if (fork() == 0){
//child process
char * execve_str[] = {"env",NULL};
char * env[] = {"PATH=/tmp", "USER=lei", "STATUS=testing", NULL};
if (execve("/usr/bin/env",execve_str,env) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execve done\n\n");
}

2.4 execl 函数

[cpp] view plain copy

if (fork() == 0){
//child process
if (execl("/usr/bin/echo","echo","executed by execl" ,NULL) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execv done\n\n");
}

2.5 execlp 函数

[cpp] view plain copy

if (fork() == 0){
//child process
if (execlp("echo","echo","executed by execlp" ,NULL) <0 ){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execlp done\n\n");
}

2.6 execle 函数

[cpp] view plain copy

if (fork() == 0){
//child process
char * env[] = {"PATH=/home/gateman", "USER=lei", "STATUS=testing", NULL};
if (execle("/usr/bin/env","env",NULL,env) <0){
perror("error on exec");
exit(0);
}
}else{
//parent process
wait(&childpid);
printf("execle done\n\n");
}

输出:

3. fork() 和exec 函数与system()函数比较

见到上面execvp函数的输出. 你会发现 exec函数只是系统调用, 它是不支持管线处理的

而system()函数是支持的. 他的内部会自动fork() 1个子进程,但是效率没有fork() 和 exec配合使用好.

但是exec 支持执行脚本. 所以不需要管线处理的命令或者脚本可以利用fork() 和 exec函数来执行.

4. 利用 fwrite() ,fork() 和exec 函数替代system()函数.

上面讲过了, 虽然exec函数不支持管线, 而且命令参数复杂, 但是它支持执行脚本啊, 所以我们可以使用fwrite将有管线处理的命令写入1个脚本中, 然后利用exec函数来执行这个脚本.

下面会编写1个base_exec(char *) 函数, 接收1个字符串参数, 然后执行它.

这里只会大概写出这个函数的逻辑步骤:

1. 利用getuid函数获得当前的pid, 然后利用pid获得当前唯一的文件名, 避免因为相同程序同时执行发生冲突!

2. 利用fwrite函数在 /tmp/下面建立1个上面文件名的脚本文件. 因为/tmp/ 任何用户都可以读写啊

3. 把命令参数写入脚本

4. 利用fork() 和 exec() 执行这个脚本

5. 有需要的话当exec执行完, 记录日志.

下面就是i代码:

头文件:

base_exec.h

[cpp] view plain copy

#ifndef __BASE_EXEC_H_
#define __BASE_EXEC_H_
int base_exec(char *) ;
#endif /* BASE_EXEC_H_ */

源文件:

base_exec.c

[cpp] view plain copy

#include "base_exec.h"
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <time.h>
#define LOGFILE "/home/gateman/logs/c_exec.log"
int base_exec(char * pcmd){
FILE * pf;
pid_t pid = getpid();
char pfilename[20];
sprintf(pfilename, "/tmp/base_exec%d.sh",pid);
pf=fopen(pfilename,"w"); //w is overwrite, a is add
if (NULL == pf){
printf("fail to open the file base_exec.sh!!!\n");
return -1;
}
fwrite("#!/bin/bash\n", 12, 1, pf);
fwrite(pcmd, strlen(pcmd),1, pf);
fwrite("\n", 1,1, pf);
fclose(pf);
if (fork() ==0 ){
//child processj
char * execv_str[] = {"bash", pfilename, NULL};
if (execv("/bin/bash",execv_str) < 0){
perror("fail to execv");
exit(-1);
}
}else{
//current process
wait();
pf=fopen(LOGFILE,"a");
if (NULL == pf){
printf("fail to open the logfile !!!\n");
return -1;
}
time_t t;
struct tm * ptm;
time(&t);
ptm = gmtime(&t);
char cstr[24];
sprintf (cstr, "time: %4d-%02d-%02d %02d:%02d:%02d\n", 1900+ptm->tm_year,ptm->tm_mon,ptm->tm_mday,ptm->tm_hour,ptm->tm_min,ptm->tm_sec);
fwrite(cstr, strlen(cstr),1, pf);
int uid = getuid();
sprintf(cstr, "uid: %d\ncommand:\n",uid);
fwrite(cstr, strlen(cstr),1, pf);
fwrite(pcmd, strlen(pcmd),1, pf);
fwrite("\n\n\n", 3,1, pf);
fclose(pf);
remove(pfilename);
return 0;
}
return 0;
}

posted on 2017-12-24 15:33 学习记录园阅读(20482) 评论(2) 编辑收藏举报

linux c语言 fork() 和 exec 函数的简介和用法

linux c语言 fork() 和 exec 函数的简介和用法

1. fork() 函数

1.1 fork() 函数的作用

1.2 区别分主程序和子程序.

1.4 使用exit() 函数令子进程在if 判断内结束.

1.4 使用wait() 函数主程序等子程序执行完成(退出)后再执行.

2. exec 函数组

2.1 execv 函数

2.2 execvp 函数

2.3 execve 函数

2.4 execl 函数

2.5 execlp 函数

2.6 execle 函数

3. fork() 和exec 函数与system()函数比较

4. 利用 fwrite() ,fork() 和exec 函数 替代system()函数.

4. 利用 fwrite() ,fork() 和exec 函数替代system()函数.