第三章:Unix/Linux进程管理
多任务处理
- 多任务处理指的是同时进行几项独立活动的能力
- 逻辑并发性成为“并发”
- 多任务处理是所有操作系统的基础,也是并行编程的基础
进程的概念
- 进程是对映像的执行
- 操作系统内核将一系列执行视为使用系统资源的单一实体。系统资源包括内存空间、I/O设备以及最重要的CPU时间
- 在操作系统内核中,每个进程用一个独特的数据结构表示,叫做进程控制块(PCB)或任务控制块(TCB)等。我们直接称它为PROC结构体
- next是指向下一个PROC结构体的指针
- ksp保存的堆栈指针
- pid是一个进程的进程编号
- status是当前状态
- priority是进程调度优先级
- kstack是进程执行时的堆栈
多任务处理系统
type.h文件
- type.h文件定义了系统常数和表示进程的简单PROC结构体
#define FREE 0
#define READY 1
#define SLEEP 2
#define ZOMBIE 3
typedef struct proc
{
struct proc *next;
int *ksp;
int pid;
int ppid;
int status;
int priority;
int kstack[SSIZE];
}
ts.s文件
- ts.s文件在32位GCC汇编代码中可实现进程上下文切换
queue.c文件
- 可实现队列和链表操作函数
- enqueue()函数按优先级将PROC输入队列中。在优先级队列中,具有相同优先级的进程按照 FIFO的顺序排序
- dequeue()函数可返回从队列或链表中删除的第一个元素
- printList()函数可打印链表元素
t.c文件
- t.c文件定义MT系统数据结构、系统初始化代码和进程管理函数
进程同步
- 一个操作系统包含许多并发进程,这些进程可以彼此交互。进程同步是指控制和协调进程交互以确保其正确执行所需要的各项规则和机制。最简单的进程同步工具是休眠和唤醒
睡眠模式
- 当某进程需要某些当前没有的东西时,例如申请独占一个存储区域、等待用户通过标准输入来输入字符等,它就会在某个事件值上进入休眠状态,该事件值表示休眠的原因
- 由于休眠进程不在readyQueue中,所以它在被另一个进程唤醒之前不可运行。在让自己进入休眠状态之后,进程调用tswitch()来放弃使用CPU。
唤醒操作
- 多个进程可能会进入休眠状态等待同一个事件,这些进程可能都需要同一个资源,在这种情况下,所以这些进程都将休眠等待同一个事件值。当某个等待时间发生时,另一个执行实体将会调用kwakeup(event),唤醒正处于休眠状态等待该事件值的所有程序
- 被唤醒的进程可能不会立即执行。它只是被放入readyQueue中,排队等待运行
进程终止
- 正常终止:进程调用exit(value),发出_exit(value)系统调用来执行在操作系统内核中的kexit(value)
- 异常终止:进程因某个信号而异常终止
MT系统中的进程管理
Unix/Linux中的进程
进程来源
- 当操作系统启动时,操作系统内核的启动代码会强行创建一个PID=0的初始进程,初始化PROC内容,并让运行指向proc[0]
INIT和守护进程
- 当进程P1开始运行时,它将其执行映像更改为INIT程序。因此,P1通常被称为INIT进程,因为它的执行映像是init程序。P1 开始复刻出许多子进程
- P1的大部分子进程都是用来提供系统服务的。它们在后台运行,不与任何用户交互
登录进程
- P1复刻了许多LOGIN进程,每个终端上一个,用于用户登录
sh进程
- 当用户成功登录时,LOGIN进程会获取用户的gid和uid,从而称为用户的进程。他将目录更改为用户的主目录并执行列出的程序,通常是命令解释程序sh
进程的执行模式
- 在Unix/Linux中进程以两种不同的模式执行,即内核模式和用户模式,简称Kmode和Umode。在每种执行模式下,一个进程有一个执行映像
进程管理的系统调用
fork()
- fork()创建子进程并返回子进程的pid,如果fork()失败则返回-1
int pid = fork();
进程执行顺序
- 在folk()完成后,子进程与父进程和系统中所有其他进程竞争CPU运行时间。接下来运行哪个进程取决于他们的调度优先级,优先级呈动态变化
进程终止
- 正常终止:当内核中的某个进程终止时,他会将_exit(value)系统调用中的值记录为进程PROC结构体中的退出状态。并通知他的二父进程并使该进程成为僵尸进程。父进程课通过系统调用找到僵尸子进程,获得其pid和退出状态
pid=wait(int *status)
- 异常终止:当某进程遇到异常时,他会陷入操作系统内核。内核的异常处理程序将陷阱错位类型转换为一个幻数,称为信号,将信号传递给进程,时进程终止
用户可以使用命令kill -s signal_numeber pid
向通过pid识别的目标发送信号
等待子进程终止
- 在任何时候,一个进程都可以使用
int pid = wait(int *status)
系统调用,等待僵尸子进程。如果成功,则wait()会返回僵尸子进程的PID,而且status包含僵尸子进程的exitCode。此外,wait()还会释放僵尸子进程,以供重新使用。
exec():更改进程执行映像
- 进程可以使用exec()将Umode映像更改为不同的(可执行)文件
exec()库函数有几个成员:
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg,...);
int execle(const char *path, const char *arg,..., char * const envp[]);
int execv(const char *path, char *const argv[]);
环境变量
- 环境变量是为当前sh定义的变量,由子sh或进程继承。他们定义了后续程序的执行环境。各环境变量定义为:关键字=字符串
- 在sh会话中,用户可使用env或printenv命令查看环境变量
SHELL=/bin/bash
TERM=xterm
USER=kcw
PATH=/usr/1oca1/bin:/usr/bin:/bin:/usr/local/games:/usr/games:./
HOME= / home /kcw
- SHELL:指定将解释任何用户命令的sh
- TERM:指定运行sh时要模拟的终端类型
- USER:当前登录用户
- PATH:系统在查找命令时将检查的目录列表
- HOME:用户的主目录。在 Linux 中,所有用户主目录都在/home中
I/O重定向
I/O重定向原则
重定向标准输入
如果用一个新打开的文件来替换文件描述符0,那么输入将来自该文件而不是原始输入设备。
重定向标准输出
- 更改文件描述符1,指向打开的文件名,然后stdout的输出将会转到该文件而不是屏幕;同样也可以将stderr重定向到一个文件
管道
- 管道是用于进程交换数据的单向进程间通信通道
- 命名管道是不相关进程之间的FIFO通信通道
管道命令处理
cmd1 | cmd2
sh将通过一个进程运行cmd1,并通过另一个进程运行cmd2,他们通过一个管道连接在一起,因此cmd1的输出变为cmd2的输入
将管道写进程与管道读进程连接起来
- 当sh获取命令行cmd1|cmd2时,会复刻出一个子进程sh,并等待子进程sh照常终止
- 子进程sh:浏览命令行中是否有|符号。 在这种情况下cmd|cmd
- 然后,子进程执行代码段
命名管道
- 在sh中,通过mknod命令创建一个命令管道:
mknod mypipe p
- 或在c语言中发出mknod()系统调用:
int r = mknod("mypipe",S_IFIFO,0);
输入ls -l mypipe
显示为prw-r-r- 1 root root 0 time mypipe
- 进程可像访问普通文件一样发个文命名管道。
苏格拉底提问
遇到的问题
管道和命名管道的区别和联系
- 匿名管道(Anonymous Pipes):
只能在具有父子关系的进程之间使用。
是一种临时的通信方式,只存在于相关进程的生命周期内。
通过调用pipe()系统调用创建,不需要事先创建特定的文件。
只能用于单向通信,即数据只能单向流动。
使用简单,但功能相对有限,适用于简单的进程间通信需求。 - 命名管道(Named Pipes):
允许独立的进程连接,不受进程关系的限制。
是一种持久的通信方式,可以在不同的时间点连接或断开,并保留数据传输的状态。
通过调用mkfifo()函数或使用命令行工具mkfifo创建,需要事先创建一个特定的文件。
可以用于双向通信,即数据可以双向流动。
功能更加灵活,适用于需要多个进程之间进行复杂通信的场景。 - 管道和命名管道都是基于文件描述符的通信机制,允许进程之间通过读写文件描述符来进行数据的传输。它们在连接方式、生命周期和功能上有所区别,匿名管道适合父子进程间简单通信,而命名管道适用于多个进程间复杂通信的场景。