linux-进程创建-基于C语言

一、进程

UNIX中,进程既是一个独立拥有资源的基本单位,又是一个独立调度的基本单位。一个进程实体由若干个区(段)组成,包括程序区、数据区、栈区、共享存储区等。每个区又分为若干页,每个进程配置有唯一的进程控制块PCB,用于控制和管理进程。

PCB的数据结构如下:

  • 进程表项(Process Table Entry)。包括一些最常用的核心数据:

进程标识符PID、用户标识符UID、进程状态、事件描述符、进程和U区在内存或外存的地址、软中断信号、计时域、进程的大小、偏置值nice、指向就绪队列中下一个PCB的指针P_Link、指向U区进程正文、数据及栈在内存区域的指针。

  • U区(U Area)。用于存放进程表项的一些扩充信息。

每一个进程都有一个私用的U区,其中含有:进程表项指针、真正用户标识符u-ruid(read user ID)、有效用户标识符u-euid(effective user ID)、用户文件描述符表、计时器、内部I/O参数、限制字段、差错字段、返回值、信号处理数组。

由于UNIX系统采用段页式存储管理,为了把段的起始虚地址变换为段在系统中的物理地址,便于实现区的共享,所以还有:

  • 系统区表项。以存放各个段在物理存储器中的位置等信息。

系统把一个进程的虚地址空间划分为若干个连续的逻辑区,有正文区、数据区、栈区等。这些区是可被共享和保护的独立实体,多个进程可共享一个区。为了对区进行管理,核心中设置一个系统区表,各表项中记录了以下有关描述活动区的信息:

区的类型和大小、区的状态、区在物理存储器中的位置、引用计数、指向文件索引结点的指针

  • 进程区表

系统为每个进程配置了一张进程区表。表中,每一项记录一个区的起始虚地址及指向系统区表中对应的区表项。核心通过查找进程区表和系统区表,便可将区的逻辑地址变换为物理地址。

二、进程映像

UNIX系统中,进程是进程映像的执行过程,也就是正在执行的进程实体。它由三部分组成:

  • 用户级上、下文。主要成分是用户程序;
  • 寄存器上、下文。由CPU中的一些寄存器的内容组成,如PC,PSW,SP及通用寄存器等;
  • 系统级上、下文。包括OS为管理进程所用的信息,有静态和动态之分。

三、所涉及的系统调用

fork()函数

创建一个新进程。

系统调用格式:

pid=fork()

fork( )返回值意义如下:

  • 0:在子进程中,pid变量保存的fork( )返回值为0,表示当前进程是子进程。

  • >0:在父进程中,pid变量保存的fork( )返回值为子进程的id值(进程唯一标识符)。

  • -1:创建失败。

如果fork( )调用成功,它向父进程返回子进程的PID,并向子进程返回0,即fork( )被调用了一次,但返回了两次。此时OS在内存中建立一个新进程,所建的新进程是调用fork( )父进程(parent process)的副本,称为子进程(child process)。子进程继承了父进程的许多特性,并具有与父进程完全相同的用户级上下文。父进程与子进程并发执行。

核心为fork( )完成以下操作:

  • 为新进程分配一进程表项和进程标识符

进入fork( )后,核心检查系统是否有足够的资源来建立一个新进程。若资源不足,则fork( )系统调用失败;否则,核心为新进程分配一进程表项和唯一的进程标识符。

  • 检查同时运行的进程数目

超过预先规定的最大数目时,fork( )系统调用失败。

  • 拷贝进程表项中的数据

将父进程的当前目录和所有已打开的数据拷贝到子进程表项中,并置进程的状态为“创建”状态。

  • 子进程继承父进程的所有文件

对父进程当前目录和所有已打开的文件表项中的引用计数加1。

  • 为子进程创建进程上、下文

进程创建结束,设子进程状态为“内存中就绪”并返回子进程的标识符。

  • 子进程执行

虽然父进程与子进程程序完全相同,但每个进程都有自己的程序计数器PC(注意子进程的PC开始位置),然后根据pid变量保存的fork( )返回值的不同,执行了不同的分支语句。

四、参考程序

#include <stdio.h>

void main() {
    int p1, p2, i;
    while ((p1 = fork()) == -1);          /*创建子进程p1*/
    if (p1 == 0)
    for (i = 0; i < 10; i++)
        printf("daughter  %d\n", i);
    else
    {
        while ((p2 = fork()) == -1);   /*创建子进程p2*/
        if (p2 == 0)
        for (i = 0; i < 10; i++)
            printf("son  %d\n", i);
        else
        for (i = 0; i < 10; i++)
            printf("parent  %d\n", i);
    }
}

运行结果:

parent…
son…
daughter..
daughter..
或
parent…
son…
parent…
daughter…等

六、分析原因

除strace 外,也可用

ltrace -f -i  -S ./executable-file-name

查看以上程序执行过程。

  • 从进程并发执行来看,各种情况都有可能。上面的进程没有同步措施,所以父进程与子进程的输出内容会叠加在一起。输出次序带有随机性。
  • 由于函数printf( )在输出字符串时不会被中断,因此,字符串内部字符顺序输出不变。但由于进程并发执行的调度顺序和父子进程抢占处理机问题,输出字符串的顺序和先后随着执行的不同而发生变化。这与打印单字符的结果相同。

补充:进程树

在UNIX系统中,只有0进程是在系统引导时被创建的,在系统初启时由0进程创建1进程,以后0进程变成对换进程,1进程成为系统中的始祖进程。UNIX利用fork( )为每个终端创建一个子进程为用户服务,如等待用户登录、执行SHELL命令解释程序等,每个终端进程又可利用fork( )来创建其子进程,从而形成一棵进程树。可以说,系统中除0进程外的所有进程都是用fork( )创建的。

posted @ 2020-08-11 16:13  漫漫长夜何时休  阅读(502)  评论(0编辑  收藏  举报