fork函数详解

首先了解什么是fork?

一个进程,包括代码、数据和分配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事。
一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中,只有少数值与原来的进程的值不同。

上面的话通俗理解就是: fork是复制进程的函数,程序一开始就会产生一个进程,当这个进程(代码)执行到fork()时,fork就会复制一份原来的进程即就是创建一个新进程,我们称子进程,而原来的进程我们称为父进程,此时父子进程是共存的,他们一起向下执行代码。

注意的一点:就是调用fork函数之后,一定是两个进程同时执行fork函数之后的代码,而之前的代码以及由父进程执行完毕。

fork的特点:
首先明白linux中:

PID表示的进程号,是唯一的,一个PID只标识一个进程

PCB:进程控制块,进程控制块是用一个结构体struct task_struct来实现

 

 

fork的返回值问题:

在父进程中,fork返回新创建子进程的进程ID;

在子进程中,fork返回0;

如果出现错误,fork返回一个负值;

getppid():得到一个进程的父进程的PID;

getpid():得到当前进程的PID;

*注意:在fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。

 

fork是把已有的进程复制一份,当然把PCB也复制了一份,然后申请一个PID

子进程的PID=父进程的PID+1;

 

 

下面举一个简单的例子:

第一次看的时候非常的奇怪,一个函数返回两次?是的,在调用fork后,fork函数后面的所有代码会执行两遍。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
/**
 *最基础的fork例子
 **/
int main(int argc, char const *argv[])
{
    pid_t pid;
    //判断1
    if ((pid=fork()) < 0)
    {
        perror("fork error");
    }
    //判断2
    else if (pid == 0)//子进程
    {
         printf("child getpid()=%d\n", getpid());
    }
    //判断3
    else if(pid > 0)//父进程
    {
        printf("parent getpid()=%d\n", getpid());
    }
 
    return 0;
}

结果如下:

parent getpid()=13725
child getpid()=13726

两个判断的代码都执行了,这是非常不可思议的,但fork函数确实实现了这样的功能。也就是在fork函数后面的代码都会执行2遍。 这就是为什么两个判断都会被执行的原因。
现在来梳理一下成功fork的执行流程
第一步: pid=fork(),如果成功那么pid就有一个非0正值。否则返回-1。
第二步: 因为pid>0,所以进入判断3。这是在父进程。
第三步: 父进程的代码执行完了,程序又会把fork后面的函数再执行一遍,此时pid的值变为0,所以进入判断2。

*注意:这里的pid_t类似一个类型,就像int型一样,int型定义的变量都是整型的,pid_t定义的类型都是进程号类型。这个语句的意思是定义了一个pid_t类型的变量pid,fork()函数返回一个进程号,这个进程号赋给了pid。pid_t在头文件types.h(sys/types.h)中定义

pid_t就是一个short类型变量,实际表示的是内核中的进程表的索引

试试判断下面代码:

#include<stdio.h>
#include<stdlib.h>
#include<unistd.h>

int main()
{
pid_t fpid;//fpid表示fork函数返回的值
int count=0;
fpid=fork();
if(fpid<0)
printf("error in fork!");
else if(fpid==0)
{
printf("我是子进程,id:%d\n",getpid());
count++;
}
else
{
printf("我是父进程,id:%d\n",getpid());
count++;
}
printf("统计结果是:%d\n",count);
exit(0);
}

 

 

父子进程的调用流程:
下面我们讲解一下fork调用的细节

int main(){
fork();//fork1
fork();//fork2
printf("love\n");
return 0;
}

上述代码打印了4次love,创建了4个进程(1一个父进程,3个子进程)

 

 

假设我们的main进程pid是1001,注意看左边的1,2,4进程其实都是main进程1001。进程3,6是同一个进程1002。所有一共有1001,1002,1003,1004四个进程。也就是只要数叶子节点就行了。其中1个是main进程,其它3个是子进程。有多少个进程就输出多少次hello字符串。也就是只有4,5,6,7执行了printf。

如果明白了上面的过程下面我给出四个例子和解释,可以自己先试着判断

eg1:

int main()
{
int n=2;
for(;i<n;i++)
{
fork();
printf("A\n");//遇到\n会自动刷新缓冲区
}
exit(0);
}

 

eg2:

int main()
{
int n=2;
for(;i<n;i++)
{
fork();
printf("-");//不会刷新缓冲区
}
exit(0);
}

  

eg3:

int main()
{
fork()||fork();
printf("A\n");
exit(0);
1)在父进程中,fork返回新创建子进程的进程ID;大于0的
2)在子进程中,fork返回0;
3)如果出现错误,fork返回一个负值;
}

结果打印3个A,共创建3个进程

fork()给子进程返回一个零值,而给父进程返回一个非零值

在main这个主进程中,首先执行 fork() || fork(), 左边的fork()返回一个非零值,根据||的短路原则,前面的表达式为真时,后面的表达式不执行,故包含main的这个主进程创建了一个子进程,

由于子进程会复制父进程,而且子进程会根据其返回值继续执行,就是说,在子进程中, fork() ||fork()这条语句 左边表达式的返回值是0, 所以||右边的表达式要执行,这时在子进程中又创建了一个进程,

即main进程->子进程->子进程,一共创建了3个进程。

 

 

eg4:

int main()
{
fork()&&fork();
printf("A\n");
exit(0);
}

结果输出3个A,创建3个进程

 

 

————————————————
版权声明:本文为CSDN博主「草东i」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_51609435/article/details/124849719

posted @ 2022-08-07 18:19  OFSqueque  阅读(3597)  评论(0编辑  收藏  举报