信息安全系统实现与设计第七周——《Unix/Linux系统编程》第三章自学
第三章 Unix/Linux进程管理
这一章主要介绍了进程管理的相关内容,包括多任务处理原则,进程的概念以及多任务处理、上下文切换和进程处理的各种原则与方法。
3.1多任务处理
多任务处理指的是同时进行几项独立活动的能力。
在计算机技术中,多任务处理指的是同时执行几个独立的任务。
在单处理器(单CPU)系统中,一次只能执行一个任务。
多任务处理是通过在不同任务之间多路复用CPU的执行时间来实现的,即将CPU执行操作从一个任务切换到另一个任务。不同任务之间的执行切换机制称为上下文切换,将一个任务的执行环境更改为另一个任务的执行环境。如果切换速度足够快,就会给人一种同时执行所有任务的错觉。这种逻辑并行性称为“并发”。在有多个 CPU 或处理器内核的多处理器系统中,可在不同CPU上实时、并行执行多项任务。此外,每个处理器也可以通过同时执行不同的任务来实现多任务处理。多任务处理是所有操作系统的基础。总体上说,它也是并行编程的基础。
3.2进程
在操作系统中,任务也称为进程,进程是对映像的执行。
操作系统内核将一系列执行视为使用系统资源的单一实体。系统资源包括内存空间、I/O设备以及最重要的CPU时间。PROC结构体包含了某个进程的所有信息。在操作系统内核中,每个进程用一个独特的数据结构表示,叫作进程控制块(PCB)或任务控制块(TCB)等。
3.3多任务处理系统
(1)type.h文件 定义了系统常熟和表示进程的简单PROC结构体
(2)ts.s文件 在32位GCC汇编代码中可实现上下文切换。
(3)queue.c文件 可实现队列和链表操作函数
1.enqueue()函数按优先级将PROC输入队列中。在优先级队列中,具有相同优先级的进程按照先进先出(FIFO)的顺序排序。
2.dequeue()函数可返回从队列或链表中删除的第一个元素。
3.printList()函数可打印链表元素。
(4)t.c文件 定义MT系统数据结构、系统初始化代码和进程管理函数
3.4进程同步
一个操作系统包含许多并发进程,这些进程可以彼此交互。进程同步是指控制和协调进程交互以确保其正确执行所需要的各项规则和机制。最简单的进程同步工具是休眠和唤醒。
(1)睡眠模式
当某进程需要某些当前没有的东西时,例如申请独占一个存储区域、等待用户通过标准输入来输入字符等,它就会在某个事件值上进入休眠状态,该事件值表示休眠的原因。
(2)唤醒模式
多个进程可能会进入休眠状态等待同一个事件,这些进程可能都需要同一个资源,例如一台当前正处于繁忙状态的打印机。在这种情况下,所以这些进程都将休眠等待同一个事件值。
3.5 进程终止
(1)正常终止:进程调用exit(value),发出_exit(value)系统调用来执行在操作系统内核中的kexit(value)。
(2)异常终止:进程因某个信号而异常终止
3.6 MT系统中的进程管理
这一节实现了MT系统的进程管理函数,集体来说为:
(1)用二叉树的形式实现进程家庭树
(2)实现ksleep()和kwakeup()进程同步函数
(3)实现kexit()和kwait进程管理函数
(4)添加“w”命令来测试和演示等待操作
3.7 Unix/Linux中的进程
(1)进程来源
操作系统内核会强行创建PID=0初始进程,然后,系统执行初始进程P0,然后,挂载一个跟文件系统,最后,P0复刻出一个子进程P1。
(2)INIT和守护进程
P1运行时,将执行映像更改为init程序,P1通常被称为init进程,P1的大部分子进程都是用来提供系统服务的,称为守护进程。
(3)sh进程
当用户成功登录时,LOGIN 进程会获取用户的 gid 和 uid,从而成为用户的进程。它将目录更改为用户的主目录并执行列出的程序,通常是命令解释程序 sh。现在,用户进程执行sh,因此用户进程通常称为 sh 进程。它提示用户执行命令。一些特殊命令,如cd(更改目录)、退出、注销等,由sh 自己直接执行。其他大多数命令是各种 bin 目录(如/bin、/sbin、/usr/bin、/usr/local/bin 等)中的可执行文件。对于每个(可执行文件)命令,sh 会复刻一个子进程,并等待子进程终止。子进程将其执行映像更改为命令文件并执行命令程序。子进程在终止时会唤醒父进程 sh,父进程会收集子进程终止状态、释放子进程 PROC 结构体并提示执行另一个命令等。除简单的命令之外,sh 还支持 I/O 重定向和通过管道连接的多个命令。
(4)进程的执行模式
1.中断😗*中断是外部设备发送给 CPU的信号,请求 CPU 服务。当在 Umode 下执行时,CPU 中断是启用的,因此它将响应任何中断。在中断发生时,CPU 将进入 Kmode 来处理中断,这将导致进程进人 Kmode。
2.陷阱:陷阱是错误条件,例如无效地址、非法指令、除以0等,这些错误条件被 CPU识别为异常,使得 CPU 进入 Kmode 来处理错误。在 Unix/Linux 中,内核陷阱处理程序将陷阱原因转换为信号编号,并将信号传递给进程。对于大多数信号,进程的默认操作是终止。
3.系统调用:系统调用(简称syscall)是一种允许 Umode 进程进入 Kmode 以执行内核函数的机制。当某进程执行完内核函数后,它将期望结果和一个返回值返回到 Umode,该值通常为0(表示成功)或-1(表示错误)。如果发生错误,外部全局变量errno(在 errno.h中)会包含一个 ERROR 代码,用于标识错误。
3.8进程管理的系统调用
(1)fork()
int pid = fork()
fork()创建子进程并返回子进程的pid,如果fork()失败则返回-1。
(2)进程执行顺序
在folk()完成后,子进程与父进程和系统中所有其他进程竞争CPU运行时间。接下来运行哪个进程取决于他们的调度优先级,优先级呈动态变化。
(3)进程终止
1.正常终止:当内核中的某个进程终止时,他会将_exit(value)系统调用中的值记录为进程PROC结构体中的退出状态。并通知他的二父进程并使该进程成为僵尸进程。父进程课通过系统调用找到僵尸子进程,获得其pid和退出状态
pid=wait(int *status)
它还会清空僵尸子进程PROC结构体,使该结构可被另一个进程重用。
2.异常终止:当某进程遇到异常时,他会陷入操作系统内核。内核的异常处理程序将陷阱错位类型转换为一个幻数,称为信号,将信号传递给进程,时进程终止。用户可以使用命令
kill -s signal_numeber pid
向通过pid识别的目标发送信号。
(4)等待子进程终止
在任何时候,一个进程都可以使用
int pid = wait(int *status);
系统调用,等待僵尸子进程。如果成功,则wait()会返回僵尸子进程的PID,而且status包含僵尸子进程的exitCode。此外,wait()还会释放僵尸子进程,以供重新使用。
(5)exec():更改进程执行映像
进程可以使用exec()将Umode映像更改为不同的(可执行)文件。exec()库函数有几个成员
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg,...);
int execle(const char *path, const char *arg,..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
(6)环境变量
环境变量是为当前sh定义的变量,由子sh或进程继承。他们定义了后续程序的执行环境。各环境变量定义为:关键字=字符串
在sh会话中,用户可使用env或printenv命令查看环境变量。重要环境变量:
SHELL=/bin/bash
TERM=xterm
USER=kcw
PATH=/usr/1oca1/bin:/usr/bin:/bin:/usr/local/games:/usr/games:./
HOME= / home /kcw
- SHELL:指定将解释任何用户命令的sh。
- TERM:指定运行sh时要模拟的终端类型。
- USER:当前登录用户。
- PATH:系统在查找命令时将检查的目录列表。
- HOME:用户的主目录。在 Linux 中,所有用户主目录都在/home中。
在sh会话中,可以将环境变量设置为新的(字符串)值,如:
HOME= / home / newhome
可通过EXPORT命令传递给后代sh,如:expoert HOME