操作系统第二章 进程与线程
第二章 进程与线程
2.1 进程与线程
2.1.1 进程的概念、组成和特征
(1) 进程的概念
打开任务管理器,首先看到的就是进程
- 程序:是静态的,就是个存放在磁盘里的可执行文件,就是一系列的指令集合。
- 进程(Process) :是动态的,是程序的一次执行过程(同一个程序多次执行会对应多个进程,比如打开多个QQ)
思考:操作系统是这些进程的管理者,它要怎么
区分
各个进程?
(2) 进程的组成
① PCB(进程控制块)
- 操作系统要记录PID、进程所属用户ID (UID)(基本的进程描述信息,可以让操作系统区分各个进程)
当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”—— PID (Process ID,进程ID)
- 还要记录给进程分配了哪些资源(如:分配了多少内存、正在使用哪些I/O设备、正在使用哪些文件)(可用于实现操作系统对资源的管理)
- 还要记录进程的运行情况(如:CPU使用时间、磁盘使用情况、网络流量使用情况等)(可用于实现操作系统对进程的控制、调度)
- 这些信息都被保存在一个数据结构
PCB
(Process Control Block)中,即进程控制块
; - 操作系统需要对各个并发运行的进程进行管理,
但凡管理时所需要的信息
,都会被放在PCB中
也就是说,不仅仅是PID等进程标识信息,包括硬件的使用情况都会被放在PCB中
记录内容 | 作用 |
---|---|
PID、进程所属用户ID (UID) | 基本的进程描述信息,可以让操作系统区分各个进程 |
记录给进程分配了哪些资源(如:分配了多少内存、正在使用哪些I/O设备、正在使用哪些文件) | 可用于实现操作系统对资源的管理 |
记录进程的运行情况(如:CPU使用时间、磁盘使用情况、网络流量使用情况等) | 可用于实现操作系统对进程的控制、调度 |
PCB是进程存在的唯一标志,当进程被创建时,操作系统为其创建PCB,当进程结束时,会回收其PCB。
linux的PCB结构如下,就是这个task_struct
② 程序单、数据段
- PCB是给操作系统用的。
- 程序段、数据段是给进程自己用的。
程序是如何运行的
- 一个进程实体(进程映像)由PCB、程序段、数据段组成。进程是动态的,进程实体(进程映像)是静态的。
- 进程实体反应了进程在某一时刻的状态(如:x++后,x=2)
- 进程实体可以看做进程在某一时刻的快照
更确切的说,应该是“进程实体(进程映像)的组成”
(3) 进程的特征
程序是静态的,进程是动态的,相比于程序,进程拥有以下特征:
特征 | 说明 | 补充 |
---|---|---|
动态性 | 进程是程序的一次执行过程,是动态地产生、变化和消亡的 | 动态性是进程最基本的特征 |
并发性 | 内存中有多个进程实体,各进程可并发执行 | |
独立性 | 进程是能独立运行、独立获得资源、独立接受调度的基本单位 | |
异步性 | 各进程按各自独立的、不可预知的速度向前推进,操作系统要提供"进程同步机制"来解决异步问题 | 异步性会导致并发程序执行结果的不确定性,因此需要进程同步 |
结构性 | 每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成 |
PCB是进程存在的唯一表示(不是PID),进程的管理者(操作系统)所需的数据都在PCB中
2.1.2 进程的状态与转换、组织方式
(1) 进程的状态
讲解进程的状态有哪些
① 创建态
- 创建态
- 进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程
分配资源
(比如分配内存空间)、初始化PCB
② 就绪态
- 就绪态
- 当进程创建完成后,便进入“就绪态”,处于就绪态的进程
已经具备运行条件
,但由于没有空闲CPU
,就暂时不能运行 - 系统中可能会有很多个进程都处于就绪态
③ 运行态
- 当CPU空闲时,操作系统就会选择一个就绪进程,让它上处理机运行
- 如果一个进程此时在CPU上运行,那么这个进程处于“运行态”。CPU会执行该进程对应的程序(执行指令序列)
④ 阻塞态
- 在进程运行的过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的响应)。
- 在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让它进入“
阻塞态
” - 当CPU空闲时,又会选择另一个“就绪态”进程上CPU运行
⑤ 终止态
- 一个进程可以执行
exit``系统调用
,请求操作系统终止该进程。 - 此时该进程会进入“终止态”,操作系统会让该进程
下CPU
,并回收内存空间等资源
,最后还要回收该进程的PCB。(此时还在内存中) - 当终止进程的工作完成之后,这个进程就彻底消失了(此时内存中也没有了)。
(2) 进程状态的转换
- 实际上,一个进程能够正常运行,需要的是
处理器
和其他资源,比如打印机
等- 二者缺一不可,只要缺少其他资源,那么就是
阻塞态
;如果只缺少处理机,那么就是就绪态
注意:
- 运行态→阻塞态 是一种进程自身做出的主动行为
- 阻塞态→就绪态是不是进程自身能控制的,是种被动行为
- 不能由阻塞态直接转换为运行态,也不能由就绪态直接转换为阻塞态(因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出这种请求)
- 运行态是可以转为就绪态的(时间片到,或者处理机被抢占)
- 进程的整个生命周期中,大部分时间都处于三种基本状态:运行态、就绪态、阻塞态
- 单CPU情况下,同一时刻只会有一个进程处于运行态,多核CPU情况下,可能有多个进程处于运行态
(3) 进程的组织
组织方式有个印象即可
- 进程PCB中,会有一个变量state来表示进程的当前状态。如:1表示创建态、2表示就绪态、3表示运行态
- 为了对同一个状态下的各个进程进行统一的管理,操作系统会将各个进程的
PCB组织
起来。
① 链接方式
- 通过指针将PCB按顺序链接起来(链接的是PCB)
② 索引方式
- 这里不再是链表了,而是一个索引表
2.1.3 进程控制
(1) 什么是进程控制
进程控制
的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程
、撤销已有进程
、实现进程状态转换
等功能。- 简化理解:反正进程控制就是要实现进程状态转换
前面仅仅是介绍了进程的状态转换逻辑、但是并没有介绍如何实现,本节就是介绍这个
(2) 如何实现进程控制
- 用原语实现
- (原语是操作系统内核的一部分)
- 原语是一种特殊的程序,它的执行具有原子性。也就是说,这段程序的运行必须一气呵成,不可中断
① 状态转换的要求(原子性)
思考:为何进程控制(状态转换)的过程要“一气呵成”?
举个例子:假设PCB中的变量state表示进程当前所处状态,1表示就绪态,2表示阻塞态...
假设此时进程2等待的事件发生,则操作系统中,负责进程控制的内核程序至少需要做这样两件事:
- 将PCB2的state设为1
- 将PCB2从阻塞队列放到就绪队列
完成了第一步后收到中断信号,那么PCB2的state=1,但是它却被放在阻塞队列里
也就是说:如果不能“一气呵成”,就有可能导致操作系统中的某些关键数据结构信息不统一的情况,这会影响操作系统进行别的管理工作
而原语如何实现
② 如何实现原语的原子性
原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。可以用“关中断指令
”和“开中断指令
”这两个特权指令实现原子性
也就是通过硬件来实现软件不能完成的任务
正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理
,如果有,则暂停运行当前这段程序,转而执行相应的中断处理程序。
- CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。
- 这样,关中断、开中断之间的这些指令序列就是不可被中断的,这就实现了“原子性”
思考:如果这两个特权指令(即开中断和关中断指令)允许用户程序便用的话,会发生什么情况?
那么某个用户在程序中加入这条指令,就会霸占CPU;因此这两个指令只能是特权指令
(3) 进程控制相关的原语
原语执行的步骤做什么,考试的时候是不会让默写这些东西的,理解即可
① 创建原语
功能
:操作系统创建一个进程时使用的原语
状态变化
:创建态 → 就绪态
步骤
:
- 申请空白PCB
- 为新进程分配所需资源
- 初始化PCB
- 将PCB插入就绪队列
引起进程创建的事件
事件 | 说明 |
---|---|
用户登录 | 分时系统中,用户登录成功,系统会建立为其建立一个新的进程 |
作业调度 | 多道批处理系统中,有新的作业放入内存时,会为其建立一个新的进程 |
提供服务 | 用户向操作系统提出某些请求时,会新建一个进程处理该请求 |
应用请求 | 由用户进程主动请求创建一个子进程 |
② 撤销原语
状态变化:
项目 | 说明 |
---|---|
状态变化 | 就绪态/阻塞态/运行态 → 终止太 → 无 |
步骤 | 1.从PCB集合中找到终止进程的PCB 2.若进程正在运行,立即剥夺CPU,将CPU分配给其他进程 3.终止其所有子进程(父进程在创建子进程的时候,会将原先分配给自己的资源分配给子进程,现在删除父进程的时候也需要删除子进程) 4.将该进程拥有的所有资源归还给父进程或操作系统 5.删除PCB |
引起进程终止的事件 | 1.正常结束:进程自己请求终止(exit系统调用) 2.异常结束:整数除以0、非法使用特权指令,然后被操作系统强行杀掉 3.外界干预:Ctrl+Alt+delete,用户选择杀掉进程 |
③ 阻塞原语和唤醒原语
因为进程的阻塞和唤醒一般是成对出现
的,因此放在一起
阻塞原语
状态变化
:运行态→阻塞态
步骤
:
- 找到要阻塞的进程对应的PCB
- 保护进程运行现场,将PCB状态信息设置为“阻塞态",暂时停止进程运行
- 将PCB插入相应事件的等待队列
引起进程阻塞的事件
:
- 需要等待系统分配某种资源
- 需要等待相互合作的其他进程完成工作
唤醒原语
状态变化
:阻塞态→就绪态(不可能由阻塞态变为运行态,不能直接跨越的)
步骤
:
- 在事件等待队列中找到PCB
- 将PCB从等待队列移除,设置进程为就绪态
- 将PCB插入就绪队列,等待被调度
引起进程唤醒的事件
:
- 等待的事件发生(因何事阻塞,就应由何事唤醒)
④ 切换原语
复习的时候可以再听一下
状态变化
:运行态→就绪态、就绪态→运行态
步骤
:
- 将运行环境信息(进程上下文信息)存入PCB
- PCB移入相应队列
- 选择另一个进程执行,并更新其PCB
- 根据PCB恢复新进程所需的运行环境
引起进程切换的事件
:
- 当前进程时间片到
- 有更高优先级的进程到达
- 当前进程主动阻塞
- 当前进程终止
运行环境信息:
- CPU中会设置很多“寄存器”用来存放程序运行过程中所需的某些数据。
这段再听得仔细一些,笔记做得详细一些
- 但是寄存器并不是某一进程独有的
- 思考:执行完指令3后,另一个进程开始上CPU运行。
- 注意:另一个进程在运行过程中也会使用各个寄存器
- 问题:之后还怎么切换回之前的进程? ? ? ?
- 解决办法:在进程切换时先在PCB中
保存这个进程的运行环境
(保存一些必要的寄存器信息)
- 当原来的进程再次投入运行时,可以通过PCB恢复它的运行环境
这个还和计组中恢复现场不一样,计组中恢复现场是将寄存器中的数据存入到栈中好像
总结
无论哪个进程控制原语,要做的无非三类事情
- 更新PCB中的信息
- 将PCB插入合适的队列
- 分配/回收资源
2.1.4 进程通信(IPC)
基本概念
① 什么是进程间通信IPC
进程间通信((Inter-Process Communication,IPC)是指两个进程之间产生数据交互。
如下,两个程序之间分享链接
② 为什么进程通信需要操作系统支持
- 进程是
分配系统资源的单位
(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。 - 为了保证安全,一个进程不能直接访问另一个进程的地址空间。
(1) 共享内存
- 即给两个进程分配共享的内存空间,两个进程使用这个空间进行通信
linux中如何实现共享内存
int shm_open(...); // 通过shm_open系统调用,申请一片共享内存区
void * mmap(...); // 通过mmap系统调用,将共享内存区映射到进程自己的地址空间
注:通过“增加页表项/段表项
”即可将同一片共享内存区映射到各个进程的地址空间中(第三章内容)
- 为避免出错,
各个进程对共享空间的访问应该是互斥的
。 - 各个进程可使用操作系统内核提供的同步互斥工具(如P、V操作)
分类
- 基于
数据结构
的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信
方式 - 基于
存储区
的共享:操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信
方式。
(2) 消息传递
进程间的数据交换以格式化的消息
(Message)为单位。进程通过操作系统提供的“发送消息/接收消息
”两个原语
进行数据交换。
即使是消息传递模式,也是不允许直接访问彼此的内存的
① 直接通信方式
进程P要给进程Q发送消息:
- 在内核的内存空间中维护着进程Q的PCB
- Q的PCB中含有进程Q的消息队列
- 进程P在自己的内存中生成消息msg
- 进程P通过发送原语
send(Q, msg)
将msg加入到进程Q的消息队列后面(是通过原语传递的) - 然后进程Q通过接受原语
receive(P, &msg)
将msg取出,接受的时候要指明是哪个进程发送的
发送和接受都需要指明进程,所以直接通行方式是点名通信的消息传递
② 间接通信方式
- 间接通信方式,以“
信箱
”作为中间实体进行消息传递。 - 在内核的内存中,维护者信箱
| | |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
发送消息和接受消息都不指明进程,而是通过信箱来作为中间实体
(3) 管道通信
- “管道”是一个特殊的
共享文件
,又名pipe文件。其实就是在内存
中开辟一个大小固定的内存缓冲区
管道可以看做是一个文件,但是本质上还是共享缓冲区
① 管道 & 共享内存的区别
- 共享内存可以在任意位置读和写
- 管道通信只能先进先出,更准确地说,管道是一个循环数组实现的队列
② 管道的注意事项
- 管道只能采用半双工通信,
某一时间段
内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
半双工和全双工是计网的概念。半双工就是可以从左到右,也能从右到左,但是不能同时两边进行。在这里理解为
管道只能单向通行
就行
- 各进程要互斥地访问管道(由操作系统实现)
- 当
管道写满
时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程。 - 当
管道读空
时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程。 - 管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此,通常有两种解决方案
- 一个管道允许多个写进程,一个读进程(标准答案,考试写这个)
- 允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据(Linux这样实现的)
- 写进程往管道写数据,即便管道没被写满,只要管道没空,读进程就可以从管道读数据
- 读进程从管道读数据,即便管道没被读空,只要管道没满,写进程就可以往管道写数据
- 这几个方法在底层都要用到操作系统实现
2.1.5 线程的介绍
(1) 为什么要引入线程
这个按照历史发展来说吧
- 还没引入进程之前,系统中各个程序只能串行执行。
- 引入进程之后,多个程序可以并发执行
- 进程是程序的一次执行,一个程序可能有多个功能,但这些功能显然不可能是由个程序顺序处理就能实现的
有的进程可能需要“同时”做很多事
,而传统的进程只能串行地执行一系列程序
。为此,引入了“线程”,来增加并发度
。
| 传统只有进程 | 引入了线程之后 |
| :----------------------------------------------------------: | :----------------------------------------------------------: |
| | |
| 传统的进程是程序执行流的最小单位 | 引入线程后,线程是程序执行流的最小单位 |
(2) 线程的定义
- 可以把线程理解为“轻量级进程”。
- 线程是一个
基本的CPU执行单元
,也是程序执行流的最小单位
。 - 引入线程之后,不仅是进程之间可以并发,
进程内的各线程之间也可以并发
,从而进一步提升了系统的并发度
,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件) - 引入线程后,
进程只作为除CPU之外的系统资源的分配单元
(如打印机、内存地址空间等都是分配给进程的,但是CPU不是分配单元,CPU的分配单元是进程)。
(3) 引入线程 VS 传统进程
指标 | 说明 |
---|---|
资源分配、调度 | 传统进程机制中 ,进程是资源分配、调度的基本单位 |
引入线程后 ,进程是资源分配的基本单位,线程是调度的基本单位(一般可以这么认为。但是CPU的分配单位不是进程) |
|
并发性 | 传统进程机制中 ,只能进程间并发 |
引入线程后 ,各线程间也能并发,提升了并发度 |
|
系统开销 | 传统的进程间并发 ,需要切换进程的运行环境,系统开销很大 |
引入线程后,并发所带来的系统开销减小 (线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小) |
系统开销类比:去图书馆看书。
- 切换进程运行环境:有一个不认识的人要用桌子,你需要你的书收走,他把自己的书放到桌上
- 同一进程内的线程切换=你的舍友要用这张书桌,可以不把桌子上的书收走
(4) 线程的属性
- 线程是处理机调度的单位
- 多CPU计篡机中,各个线程可占用不同的CPU
- 每个线程都有一个线程ID、线程控制块(
TCB
) - 线程也有就绪、阻塞、运行三种基本状态
- 线程几乎不拥有系统资源
- 同一进程的不同线程间共享进程的资源
- 由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
- 同一进程中的线程切换,不会引起进程切换
- 不同进程中的线程切换,会引起进程切换
- 切换同进程内的线程,系统开销很小
- 切换进程,系统开销较大
2.1.6 线程的实现方式
复习的时候可以再听一下
本节也是通过历史演进的方式来讲解
(1) 用户级线程
历史背景:早期的操作系统(如:早期Unix)只支持进程,不支持线程。当时的“线程”是由线程库
(库函数)实现的
虽然没有进程,但是一个程序仍然是有多个服务需要分开执行的,因此当时通过程序来实现线程(而不是内核)
// 进程1
int main() {
while (true) {
// 处理视频聊天的代码
}
}
// 进程2
int main() {
while (true) {
// 处理文字聊天的代码
}
}
// 进程3
int main() {
while (true) {
// 处理传输文件的代码
}
}
如果三个都实现的话,可以有下面的代码(当时老师是怎么说着来的?重听一下)
// QQ进程
int main() {
int i = 0;
while (true) {
if (i==0){处理视频聊禾的代码;}
if (i==1){处理文字聊天的代码;}
if (i==2){处理文件传输的代码;}
i = (i + 1) % 3; // i的值为0,1,2,0,1,2...
}
}
这个代码值得学习,当有多个程序需要轮流执行的时候,这样做
从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上
可以看作三个“线程”。while循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)
。
很多编程语言
提供了强大的线程库,可以实现线程的创建、销毁、调度等功能。(比如Java的Tread类,应该就是用户级线程)
也就是说现在用户级线程仍然在用呢,并不会因为内核级线程的出现而消失
- 线程的管理工作由谁来完成?
- 线程切换是否需要CPU变态?
- 操作系统是否能意识到用户级线程的存在?
- 这种线程的实现方式有什么优点和缺点?
Q:线程的管理工作由谁来完成?
A:用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)
Q:线程切换是否需要CPU变态?
A:用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
Q:操作系统是否能意识到用户级线程的存在?
A:在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程”
Q:这种线程的实现方式有什么优点和缺点?
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
CPU调度的基本单位仍然是进程,而不是线程
(2) 内核级线程
内核级线程(Kernel-Level Thread, KLT
,又称“内核支持的线程”) 由操作系统支持的线程
大多数现代操作系统
都实现了内核级线程,如Windows、Linux
Q:线程的管理工作由谁来完成?
A:内核级线程的管理工作由操作系统内核
完成。
Q:线程切换是否需要CPU变态?
A:线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
Q:操作系统是否能意识到用户级线程的存在?
A:操作系统会为每个内核级线程建立相应的TCB (Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”
Q:这种线程的实现方式有什么优点和缺点?
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
2.1.7 多线程模型
(1) 分类
在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系
,可以划分为几种多线程模型
一对一模型 | 多对一模型 | 多对多模型 | |
---|---|---|---|
图示 | |||
说明 | 一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。 | 多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。 | n用户级线程映射到m个内核级线程(n >= m) 。每个用户进程对应m个内核级线程。 |
优点 | 当一个线程被阻塞后,别的线程还可以继续执行,并发能力强 。多线程可在多核处理机上并行执行。 |
用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高 |
克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。 |
缺点 | 一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大 。 |
当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高 。多个线程不可在多核处理机上并行运行 |
(2) 处理器分配的基本单元
可以这么理解:
- 用户级线程是“
代码逻辑
”的载体 - 内核级线程是“
运行机会
”的载体
内核级线程才是处理机分配的单位。例如:多核CPU环境下,多对多模型左边这个进程最多能被分配两个核。
一段“代码逻辑”只有获得了“运行机会”才能被CPU执行
内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞
- 也就是说,如果某一个内核级线程运行的代码阻塞时,另一个内核级线程运行的代码不一定被阻塞,此时进程不会被阻塞
- 映射可以是任意的,如果一个内核级线程比较忙,用户级线程可以映射到另一个内核级线程(可以根据用户级线程使用的资源多少动态地映射到不同的内核级线程当中)
2.1.8 线程的状态转换、组织控制
本节为2022新增考点
其实和进程的一样
线程的组织与控制
TCB(线程控制块) | 线程表 |
---|---|
- 线程切换的时候,要保存和恢复的就那三项:PC、寄存器、堆栈指针等
(关于堆栈指针,这里可以再听听)
2.2 处理器调度
2.2.1 调度的基本概念
- 当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序
- 这就是“调度”研究的问题。
2.2.2 调度的三个层次
(1) 高级调度(作业调度)
作业后备队列
作业:一个具体的任务。用户向系统提交一个作业○用户让操作系统启动一个程序(来处理一个具体的任务)
- 高级调度(作业调度):按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。
- 每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB
简化理解:好几个程序需要启动,到底先
启动
哪个
(2) 低级调度(进程调度/处理机调度)
这个就是本节的内容,本章将的也就是进程,所以不讲其他两种
- 低级调度(进程调度/处理机调度)—―按照某种策略
从就绪队列中
选取一个进程,将处理机分配
给它。 - 进程调度是操作系统中
最基本的一种调度
,在一般的操作系统中都必须配置进程调度
。 - 进程调度的频率很高,一般几十毫秒一次。
(3) 中级调度(内存调度)
内存不够
时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存暂时调到外存等待的进程
状态为挂起状态
。被挂起的进程PCB会被组织成挂起队列
中级调度(内存调度)—— 按照某种策略决定将哪个处于挂起状态的进程重新调入内存
。
- 一个进程可能会被多次调出、调入内存,因此
中级调度发生的频率要比高级调度更高
。 - (有时候在切换进程的时候发现有点卡顿,可能的原因是切换到的进程的数据被CPU调出到外存了卡顿的过程就是将这些数据再次从外存调回内存)
- 这里要区分一点,中级调度仅仅是将进程从挂起队列调入内存
- 但是进程从内存调到外存并不是中级调度要做的,仅仅是内存不够的时候按照规则掉出去了,调回来是中级调度做的事情
三种调度的联系 & 对比
要做什么 | 调度发生在 | 发生频率 | 进程状态变化 | |
---|---|---|---|---|
高级调度(作业调度) | 按照某种规则,从后备队列中选择合适的作业将其调入内存,并为其创建进程 | 外存→内存(面向作业) | 最低 | 无→创建态→就绪态 |
中级调度(内存调度) | 按照某种规则,从挂起队列中选择合适的进程将其数据调回内存 | 外存→内存(面向进程) | 中等 | 挂起态→就绪态 (阻塞挂起→阻塞态) |
低级调度(进程调度) | 按照某种规则,从就绪队列中选择一个进程为其分配处理机 | 内存→CPU | 最高 | 就绪态→运行态 |
2.2.3 补充:进程的挂起态与七状态模型
- 暂时调到外存等待的进程状态为挂起状态(挂起态,suspend)
- 挂起态又可以进一步细分为
就绪挂起
、阻塞挂起
两种状态
注意“挂起”和“阻塞”的区别和联系
- 两种状态都是暂时不能获得CPU的服务,但挂起态是将进程映像调到外存去了,而阻塞态下进程映像还在内存中。
- 有的操作系统会把
就绪挂起、阻塞挂起分为两个挂起队列
,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列
。
2.2.4 进程调度的时机、切换与过程
本节只讲进程调度
(1) 进程调度的时机
也就是什么时候进程调度
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
- 当前运行的进程
主动放弃
处理机- 进程正常终止
- 运行过程中发生异常而终止
- 进程主动请求阻塞(如等待I/O)
有的系统中,只允许进程主动放弃处理机
- 当前运行的进程被动放弃处理机
- 分给进程的时间片用完
- 有更紧急的事需要处理(如I/O中断)
- 有更高优先级的进程进入就绪队列
有的系统中,进程可以主动放弃处理机,当有更紧急的任务需要处理时,也会强行剥夺处理机(被动放弃)
不能进行进程调度与切换的情况
- 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换。
- 进程在操作系统
内核程序临界区
中。 - 在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)
下面有一个例题
(2012年联考真题)进程处于临界区
时不能进行处理机调度 (×)
应该是:进程在操作系统内核程序临界区
中不能进行调度与切换
理由:
- 临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
- 临界区:访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)
如果还没退出临界区(还没解锁)就进行进程调度,但是进程调度相关的程序也需要访问就绪队列,但此时就绪队列被锁住了,因此又无法顺利进行进程调度
但是普通临界区不一定
在打印机打印完成之前,进程一直处于临界区内
,临界资源不会解锁
。但打印机又是慢速设备
,此时如果一直不允许进程调度的话就会导致CPU一直空闲
也就是该状态下,调用打印机的进程一直处于临界区(即内存指令的指针在这段代码中);但是处理机仍然可以调度其他进程
(2) 进程调度的方式
非剥夺调度方式
,又称非抢占方式
。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。剥夺调度方式
,又称抢占方式
。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。
比较
- 非剥夺调度方式:
实现简单,系统开销小
但是无法及时处理紧急任务
,适合于早期的批处理系统
- 剥夺调度方式:可以
优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能
(通过时钟中断)。适合于分时操作系统、实时操作系统
(3) 进程的切换与过程
内容不多,也不算是考试的重点
“狭义的进程调度”与“进程切换”的区别:
狭义的进程调度
指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)进程切换
是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度
包含了选择一个进程和进程切换
两个步骤。
进程切换的过程主要完成了
:
-
对原来运行进程各种数据的保存
-
对新的进程各种数据的恢复
(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。
2.2.5 调度程序和闲逛进程
(1) 调度器(调度程序)
① 功能
- ②③由调度程序引起,调度程序决定
- 让谁运行?――调度算法
- 运行多长时间?—―时间片大小
就是觉得线程什么时候结束,切换的时候选择哪个线程
② 调度时机
调度时机——什么事件会触发“调度程序”?
- 创建新进程
- 进程退出
- 运行进程阻塞
- I/O中断发生(可能唤醒某些阻塞进程)
- 非抢占式调度策略,
只有运行进程阻塞或退出
才触发调度程序工作 - 抢占式调度策略,
每个时钟中断或k个时钟中断
会触发调度程序工作
这里要注意非抢占式和抢占式的区别了
③ 调度单位
调度程序分为不支持内核级线程和支持内核级线程的
- 一个调度的是进程
- 一个调度的是内核级线程
(2) 闲逛进程
大概在选择题中考察
调度程序永远的备胎,没有其他就绪进程时,运行闲逛进程( idle)
- 闲逛进程都不属于一个用户给的进程,就是为了不让CPU中断的进程
闲逛进程的特性
- 优先级最低
- 可以是0地址指令,占一个完整的指令周期(指令周期末尾例行检查中断)
- 计组中学过,0地址指令不需要访存,也不需要访存CPU中的寄存器,因此能耗低
- 指令周期末尾例行检查中断:可以周期性地唤醒调度程序检查是否有其他就绪进程调度
- 能耗低
2.2.6 调度算法的评价指标
这个应该会常考计算题
(1) CPU利用率
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作
CPU利用率
:指CPU“忙碌”的时间
占总时间
的比例。
有的题目还会要求计算某种设备的利用率
Eg:某计算机只支持单道程序
,某个作业刚开始需要在CPU上运行5秒,再用打印机打印输出5秒,之后再执行5秒,才能结束。
在此过程中,CPU利用率
、打印机利用率
分别是多少?
通常会考察多道程序并发执行的情况,可以用“甘特图”来辅助计算
(2) 系统吞吐量
对于计算机来说,希望能用尽可能少的时间处理完尽可能多的作业
系统吞吐量:单位时间内完成作业的数量
Eg:某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为?
10/100=0.1道/秒
(3) 周转时间
对于计算机的用户来说,他很关心自己的作业从提交到完成花了多少时间。
周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
它包括四个部分:
- 作业在外存后备队列上等待作业调度(高级调度)的时间
- 进程在就绪队列上等待进程调度(低级调度)的时间
- 进程在CPU上执行的时间
- 进程等待/O操作完成的时间。
后三项在一个作业的整个处理过程中,可能发生多次。
(作业)周转时间=作业完成时间-作业提交时间(对于用户来说,更关心自己的单个作业的周转时间)
对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值
思考:有的作业运行时间短,有的作业运行时间长,因此在周转时间相同的情况下,运行时间不同的作业,给用户的感觉肯定是不一样的,所以要
设定新的指标
- 带权周转时间比较巧妙,因为作业实际运行的时间会给周转时间带来影响,因此就除以实际运行的时间,减小影响
-
带权周转时间必然≥1
-
带权周转时间与周转时间都是越小越好
-
对于
周转时间相同的两个作业
,实际运行时间长的作业在相同时间内被服务的时间更多
,带权周转时间更小,用户满意度更高。 -
对于
实际运行时间相同
的两个作业,周转时间短的带权周转时间更小,用户满意度更高
。
(4) 等待时间
计算机的用户希望自己的作业尽可能少的等待处理机
等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。
进程和作业的等待时间是不一样的,由上图可以看出,作业等待被服务是一个时间,进程等待被服务也是一个时间
- 对于
进程
来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/O完成的期间其实进程也是在被服务的,所以不计入等待时间
。 - 对于
作业
来说,不仅要考虑建立进程后的等待时间,还要加上
作业在外存后备队列中等待的时间。
一个作业总共需要被CPU服务多久,被l/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间
。
当然,与前面指标类似,也有“平均等待时间”来评价整体性能
(5) 响应时间
- 对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系统服务、回应。
- 响应时间,指从用户提交请求到
首次产生响应
所用的时间。
2.6.7 调度算法(批处理)
下面介绍的这三种算法只适用于批处理,在总结中会说道
每种方法要注意的几点:
- 算法思想
- 算法规则
- 这种调度算法是用于作业调度还是进程调度?
- 抢占式?非抢占式?
- 优点和缺点
- 是否会导致饥饿
饥饿:某进程/作业长期得不到服务
(1) 先来先服务FCFS
FCFS:first come first service
要点
要点 | 说明 |
---|---|
算法思想 | 主要从“公平”的角度考虑(类似于我们生活中排队买东西的例子) |
算法规则 | 按照作业/进程到达的先后顺序进行服务 |
用于作业/进程调度 | 用于作业调度 时,考虑的是哪个作业 先到达后备队列用于 进程调度 时,考虑的是哪个进程 先到达就绪队列 |
是否可抢占? | 非抢占式的算法 |
优缺点 | 优点 :公平、算法实现简单缺点 :排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法 对长作业有利,对短作业不利 |
是否会导致饥饿 | 不会(先来先得,即使是后来的也肯定能够运行) |
例题
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用先来先服务调度算法
,计算各进程的等待时间
、平均等待时间
、周转时间
、平均周转时间
、带权周转时间
、平均带权周转时间
。
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 7 |
P2 | 2 | 4 |
P3 | 4 | 1 |
P4 | 5 | 4 |
调度顺序分析
先来先服务调度算法:按照到达的先后顺序调度,事实上就是等待时间越久的越优先得到服务。
因此,调度顺序为:P1→P2→P3→P4
计算指标
指标 | P1 | P2 | P3 | P4 | 平均 |
---|---|---|---|---|---|
周转时间=完成时间-到达时间 | P1=7-0=7 |
P2=11-2=9 |
P3=12-4=8 |
P4=16-5=11 |
平均周转时间=(7+9+8+11)/4 =8.75 |
带权周转时间=周转时间/运行时间 | P1=7/7=1 |
P2=9/4=2.25 |
P3=8/1=8 |
P4=11/4=2.75 |
平均带权周转时间=(1+2.25+8+2.75)/4= 3.5 |
等待时间=周转时间-运行时间 | P1=7-7=0 |
P2=9-4=5 |
P3=8-1=7 |
P4=11-4=7 |
平均等待时间=(0+5+7+7)/4 = 4.75 |
- 注意:本例中的进程都是
纯计算型
(也就是说不使用其他资源如I/O)的进程,一个进程到达后要么在等待,要么在运行。- 如果是又有计算、又有I/O操作的进程,其
等待时间就是周转时间-运行时间-I/O操作的时间
(2) 短作业优先SJF
SJF:Shortest Job First
严格来说,用于进程调度应该称为
短进程优先
调度算法(SPF),但是逻辑是一样的
① 非抢占式
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用非抢占式
的短作业优先调度算法
(实际上就是短进程优先调度算法),计算各进程的等待时间
、平均等待时间
、周转时间
、平均周转时间
、带权周转时间
、平均带权周转时间
。
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 7 |
P2 | 2 | 4 |
P3 | 4 | 1 |
P4 | 5 | 4 |
分析调度顺序
- 计算指标
指标 | P1 | P3 | P2 | P4 | 平均 | FCFS的平均时间 |
---|---|---|---|---|---|---|
周转时间=完成时间-到达时间 | P1=7-0=7 |
P3=8-4=4 |
P2=12-2=10 |
P4=16-5=11 |
平均周转时间= (7+4+10+11)/4=8 |
8.75 |
带权周转时间=周转时间/运行时间 | P1=7/7=1 |
P3=4/1=4 |
P2=10/4=2.5 |
P4=11/4=2.75 |
平均带权周转时间=(1+4+2.5+2.75)/4= 2.56 |
3.5 |
等待时间=周转时间-运行时间 | P1=7-7=0 |
P3=4-1=3 |
P2=10-4=6 |
P4=11-4=7 |
平均等待时间=(0+3+6+7)/4 = 4 |
4.75 |
对比FCFS算法的结果,显然SPF算法的平均等待/周转/带权周转时间都要更低
② 抢占式SRTN
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用抢占式
的短作业优先调度算法
,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。
抢占式的短作业优先算法又称"
最短剩余时间优先
"算法(SRTN
)
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 7 |
P2 | 2 | 4 |
P3 | 4 | 1 |
P4 | 5 | 4 |
最短剩余时间优先算法:每当有进程加入就绪队列改变时就需要调度
,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机
,当前运行进程重新回到就绪队列
。另外,当一个进程完成时也需要调度
调度时机有两个:
- 新进程到来时
- 当前进程完成时
初次之外,当前进程运行的过程中都不会调度
- 确认调度顺序
需要注意的是,当有新进程到达时就绪队列就会改变,就要按照上述规则进行检查。以下Pn(m)农示当前Pn进程剩余时间为m。各个时刻的情况如下:
- 0时刻(P1到达):
P1(7)
(P1的剩余时间是7) - 2时刻(P2到达): P1(5)、
P2(4)
(P1的剩余时间是5,P2的剩余时间是4) - 4时刻(P3到达):P1(5) 、P2(2)、
P3(1)
- 5时刻(P3完成且P4刚好到达):P1(5)、
P2(2)
、P4(4) - 7时刻(P2完成): P1(5) 、
P4(4)
- 11时刻(P4完成):
P1(5)
指标 | P1 | P2 | P3 | P4 | 平均 | 非抢占式的平均时间 |
---|---|---|---|---|---|---|
周转时间=完成时间-到达时间 | P1=16-0=16 |
P2=7-2=5 |
P3=5-4=1 |
P4=11-5=6 |
平均周转时间=(16+5+1+6)/4=7 |
8 |
带权周转时间=周转时间/运行时间 | P1=16/7=2.28 |
P2=5/4=1.25 |
P3=1/1=1 |
P4=6/4=1.5 |
平均带权周转时间=(2.28+1.25+1+1.5)/4 = 1.50 |
2.56 |
等待时间=周转时间-运行时间 | P1=16-7=9 |
P2=5-4=1 |
P3=1-1=0 |
P4=6-4=2 |
平均等待时间=(9+1+0+2)/4= 3 |
4 |
对比非抢占式的短作业优先算法,显然抢占式的这几个指标又要更低
细节
-
如果题目中未特别说明,所提到的“短作业/进程优先算法”
默认是非抢占式
的(抢占式的算法是SRTN,最短剩余时间优先算法) -
很多书上都会说“
SJF 调度算法的平均等待时间、平均周转时间最少
”严格来说,这个表述是错误的,不严谨的。之前的例子表明,
最短剩余时间优先算法
得到的平均等待时间、平均周转时间还要更少应该加上一个条件“
在所有进程同时可运行时,采用SJF调度算法的平均等待时间、平均周转时间最少
”;或者说“
在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少
";如果不加上述前提条件,则应该说“
抢占式的短作业/进程优先调度算法(最短剩余时间优先, SRNT算法)的平均等待时间、平均周转时间最少
” -
虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但
相比于其他算法(如FCFS) ,SJF依然可以获得较少的平均等待时间、平均周转时间
-
如果选择题中遇到“SJF算法的平均等待时间、平均周转时间最少”的选项
,那最好判断其他选项是不是有很明显的错误,如果没有更合适的选项,那也应该选择该选项
要点
要点 | 说明 |
---|---|
算法思想 | 追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间 |
算法规则 | 最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短) |
用于作业/进程调度 | 即可用于作业调度,也可用于进程调度。 用于进程调度时称为“短进程优先(SPF, Shortest Process First)算法” |
是否可抢占? | SJF和SPF是非抢占式的算法。但是也有抢占式的版本――最短剩余时间优先算法(SRTN, Shortest Remaining Time Next) |
优缺点 | 优点:“最短的”平均等待时间、平均周转时间 缺点:不公平。 对短作业有利,对长作业不利 。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先 |
是否会导致饥饿 | 会。如果源源不断地有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。如果一直得不到服务,则称为“饿死” |
FCFS VS SJF
FCFS算法
是在每次调度的时候选择一个等待时间最长的作业(进程)为其服务
。但是没有考虑到作业的运行时间
,因此导致了对短作业不友好
的问题SJF算法
是选择一个执行时间最短的作业为其服务
。但是又完全不考虑各个作业的等待时间
,因此导致了对长作业不友好
的问题,甚至还会造成
饥饿问题
问:能不能设计一个算法,即考虑到各个作业的等待时间,也能兼顾运行时间呢?
就是在等待的时候要
综合考虑等待时间和运行时间
,因此选择的指标需要是二者结合的内容
(3) 高响应比优先HRRN
HRRN:Highest Response Ratio Next
要点
例题
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用高响应比优先调度算法,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 7 |
P2 | 2 | 4 |
P3 | 4 | 1 |
P4 | 5 | 4 |
高响应比优先算法:非抢占式的调度算法,只有当前运行的进程主动放弃CPU时(正常/异常完成,或主动阻塞),才需要进行调度,调度时计算所有就绪进程的响应比,选响应比最高的进程上处理机。
这个响应比综合考虑了等待时间和运行时间:
- 等待时间越大,服务顺序优先:响应比越大
- 要求服务时间越大,服务顺序越小:响应比越小
总之按照两种指标的大小要求设计的这个方式
- 分析调度顺序
- 0时刻:只有P1到达就绪队列,P1上处理机
- 7时刻(
P1主动放弃CPU
):就绪队列中有P2(响应比=(5+4)/4=2.25)、P3((3+1)/1=4)
、P4(2+4)/4=1.5) (P2和P4要求服务时间一样,但P2等待时间长,所以必然是P2响应比更大
,这个响应比实际上就是解决这样的问题而设计的) - 8时刻(
P3完成
):P2(2.5)
、P4(1.75) - 12时刻(P2完成):就绪队列中只剩下
P4
对于非抢占式的算法,考虑的时刻只有进程完成时的时刻
要点 | 说明 |
---|---|
算法思想 | 要综合考虑作业/进程的等待时间和要求服务的时间 |
算法规则 | 在每次调度时先计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务 |
用于作业/进程调度 | 即可用于作业调度,也可用于进程调度 |
是否可抢占? | 非抢占式 的算法。因此只有当前运行的作业/进程主动放弃处理机时,才需要调度,才需要计算响应比 |
优缺点 | 综合考虑了等待时间和运行时间(要求服务时间) 等待时间相同时,要求服务时间短的优先(SJF的优点) 要求服务时间相同时,等待时间长的优先(FCFS的优点) 对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题 |
是否会导致饥饿 | 不会 |
比较 & 总结
算法 | 是否可抢占 | 优点 | 缺点 | 考虑指标 | 是否会导致饥饿 |
---|---|---|---|---|---|
FCFS | 非抢占式 | 公平;实现简单 | 对短作业不利 | 等待时间√ 运行时间× |
不会 |
SJF/SPF | 默认为非抢占式,也有SJF的抢占式版本最短剩余时间优先算法(SRTN) | “最短的”平均等待/周转时间; | 对长作业不利,可能导致饥饿; 难以做到真正的短作业优先(用户可能造假) |
等待时间× 运行时间√ |
会 |
HRRN | 非抢占式 | 上述两种算法的权衡折中,综合考虑的等待时间和运行时间 | 等待时间√ 运行时间√ |
不会 |
- 注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是
不关心“响应时间”
,也并不区分任务的紧急程度
,因此对于用户来说,交互性很糟糕
。 - 因此这三种算法一般
适合用于早期的批处理系统
,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色。
提示:一定要动手做课后习题!这些算法特性容易考小题,算法的使用常结合调度算法的评价指标在大题中考察。
2.6.8 调度算法(交互式系统)
Tips:各种调度算法的学习思路
- 算法思想
- 算法规则
- 这种调度算法是用于作业调度还是进程调度?
- 抢占式?非抢占式?
- 优点和缺点
- 是否会导致饥饿
(1) 时间片轮转RR
RR:Round-Robin
要点
要点 | 说明 |
---|---|
算法思想 | 公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应 |
算法规则 | 按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms) 。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。 |
用于作业/进程调度 | 用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片) |
是否可抢占? | 若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式 的算法。由时钟装置发出时钟中断 来通知CPU时间片已到 |
优缺点 | 优点:公平;响应快,适用于分时操作系统; 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。 |
是否会导致饥饿 | 不会 |
补充 | 时间片太大或太小分别有什么影响?(选择题常考,在本节例题的最下面) |
例题
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用时间片轮转调度算法,分析时间片大小分别是2、5
时的进程运行情况。
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 5 |
P2 | 2 | 4 |
P3 | 4 | 1 |
P4 | 5 | 6 |
时间片轮转调度算法:轮流让就绪队列中的进程依次执行个时间片
(每次选择的都是排在就绪队列队头的进程)
常用于
分时操作系统
,更注重“响应时间”,因而此处不计算周转时间
- 响应时间:提交到第一次响应的时间
- 周转时间:提交到完成的时间
实际上还是先到先得,按照队列排序,只是根据时间片来轮流做,避免了纯粹的FCFS大作业占太多时间的问题
- 分析调度顺序(时间片为2,时间片为5的在下面)
时间片大小为2(注:以下括号内表示当前时刻就绪队列中的进程、进程的剩余运行时间)
-
0时刻(
P1(5)
):0时刻只有P1到达就绪队列,让P1上处理机运行一个时间片 -
2时刻(
P2(4)
→P1(3)):2时刻P2到达就绪队列,P1运行完一个时间片,被剥夺处理机,重新放到队尾。此时P2排在队头,因此让P2上处理机。(注意:2时刻,P1下处理机,同一时刻新进程P2到达,如果在题目中遇到这种情况,
默认新到达的进程先进入就绪队列
) -
4时刻(
P1(3)
→ P3(1)→P2(2):4时刻,P3到达,先插到就绪队尾,紧接着,P2下处理机也插到队尾 -
5时刻(
P3(1)
→ P2(2)→P4(6)):5时刻,P4到达插到就绪队尾(注意:由于P1的时间片还没用完
,因此暂时不调度。另外,此时P1处于运行态,并不在就绪队列中
,注意这里,P1不在队列中) -
6时刻(
P3(1)
→ P2(2)→P4(6)→P1(1)): 6时刻,P1时间片用完,下处理机,重新放回就绪队尾,发生调度 -
7时刻(
P2(2)
→P4(6)→P1(1)):虽然P3的时间片没用完,但是由于P3只需运行1个单位的时间,运行完了会主动放弃处理机
,因此也会发生调度。队头进程P2上处理机。 -
9时刻(
P4(6)
→ P1(1)):进程P2时间片用完,并刚好运行完,发生调度,P4上处理机 -
11时刻(P1(1)→P4(4) ) :P4时间片用完,重新回到就绪队列。P1上处理机
-
12时刻(
P4(4)
) :P1运行完,主动放弃处理机,此时就绪队列中只剩P4,P4上处理机 -
14时刻()︰
就绪队列为空
,因此让P4接着运行一个时间片。 -
16时刻:所有进程运行结束
整个流程关注的时间点:
- 时间片到达的时间(更换调度任务)
- 任务完成的时间(更换调度任务)
- 任务到来的时间(修改就绪队列)
还是做了一个表格
时刻 | 就绪队列 | 说明 |
---|---|---|
0时刻 | P1(5) |
0时刻只有P1到达就绪队列,让P1上处理机运行一个时间片 |
2时刻 | P2(4) →P1(3) |
2时刻P2到达就绪队列,P1运行完一个时间片,被剥夺处理机,重新放到队尾。 此时P2排在队头,因此让P2上处理机。(注意:2时刻,P1下处理机,同一时刻新进程P2到达,如果在题目中遇到这种情况, 默认新到达的进程先进入就绪队列 ) |
4时刻 | P1(3) → P3(1)→P2(2) |
4时刻,P3到达,先插到就绪队尾,紧接着,P2下处理机也插到队尾 |
5时刻 | P3(1) → P2(2)→P4(6) |
5时刻,P4到达插到就绪队尾(注意:由于P1的时间片还没用完 ,因此暂时不调度。另外,此时P1处于运行态,并不在就绪队列中 ,注意这里,P1不在队列中) |
6时刻 | P3(1) → P2(2)→P4(6)→P1(1) |
6时刻,P1时间片用完,下处理机,重新放回就绪队尾,发生调度 |
7时刻 | P2(2) →P4(6)→P1(1) |
虽然P3的时间片没用完,但是由于P3只需运行1个单位的时间,运行完了会主动放弃处理机 ,因此也会发生调度。队头进程P2上处理机。 |
9时刻 | P4(6) → P1(1) |
进程P2时间片用完,并刚好运行完,发生调度,P4上处理机 |
11时刻 | P1(1)→P4(4) | P4时间片用完,重新回到就绪队列。P1上处理机 |
12时刻 | P4(4) | P1运行完,主动放弃处理机,此时就绪队列中只剩P4,P4上处理机 |
14时刻 | 空 | 就绪队列为空 ,因此让P4接着运行一个时间片。 |
16时刻 | 所有进程运行结束 |
- 分析调度顺序(时间片为5)
- 0时刻(
P1(5)
) :只有P1到达,P1上处理机。 - 2时刻(P2(4)) :P2到达,但P1时间片尚未结束,因此暂不调度
- 4时刻(
P2(4)
→P3(1)):P3到达,但P1时间片尚未结束,因此暂不调度 - 5时刻(
P2(4)
→ P3(1)→ P4(6)) :P4到达,同时,P1运行结束。发生调度,P2上处理机。 - 9时刻(
P3(1)
→P4(6)):P2运行结束,虽然时间片没用完,但是会主动放弃处理机。发生调度。 - 10时刻(
P4(6)
):P3运行结束,虽然时间片没用完,但是会主动放弃处理机。发生调度。 - 15时刻()∶P4时间片用完,但就绪队列为空,因此会让P4继续执行一个时间片。
- 16时刻( ) :P4运行完,主动放弃处理机。所有进程运行完。
观察这个时间片,如果按照先来先得算法呢?
综合考量
- 如果
时间片太大
,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来先服务调度算法
,并且会增大进程响应时间
。因此时间片不能太大。
增大进程响应时间:比如,系统中有10个进程在并发执行,如果时间片为1秒,则一个进程被响应可能需要等9秒...也就是说,如果用户在自己进程的时间片外通过键盘发出调试命令,可能需要等待9秒才能被系统响应
- 另一方面,是程调度、切换是有时间代价的(保存、恢复运行环境),因此如果
时间片太小
会导致进程切换过于频繁
,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。可见时间片也不能太小
。
一般来说,设计时间片时要让切换进程的开销占比不超过1%(这个了解即可)
(2) 优先级调度算法
要点
要点 | 说明 |
---|---|
算法思想 | 随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序 |
算法规则 | 调度时选择优先级最高的作业/进程 |
用于作业/进程调度 | 既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的I/O调度中 |
是否可抢占? | 抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。 |
优缺点 | 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度。 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿 |
是否会导致饥饿 | 会 |
① 非抢占式
例题:各进程到达就绪队列的时间、需要的运行时间、进程优先数如下表所示。使用非抢占式
的优先级调度算法
,分析进程运行情况。(注:优先数越大,优先级越高)
进程 | 到达时间 | 运行时间 | 优先数 |
---|---|---|---|
P1 | 0 | 7 | 1 |
P2 | 2 | 4 | 2 |
P3 | 4 | 1 | 3 |
P4 | 5 | 4 | 2 |
非抢占式的优先级调度算法:每次调度时选择当前已到达且优先级最高的进程
。当前进程主动放弃处理机时发生调度
。
只观察任务完成的时刻
- 分析调度顺序
注:以下括号内表示当前处于就绪队列的进程
- 0时刻(
P1
):只有P1到达,P1上处理机。 - 7时刻(P2、
P3
、P4):P1运行完成主动放弃处理机,其余进程都已到达,P3优先级最高,P3上处理机 - 8时刻(
P2
、P4) :P3完成,P2、P4优先级相同,由于P2先到达,因此P2优先上处理机 - 12时刻(
P4
) :P2完成,就绪队列只剩P4,P4上处理机。 - 16时刻( ) : P4完成,所有进程都结束
② 抢占式
例题:各进程到达就绪队列的时间、需要的运行时间、进程优先数如下表所示。使用抢占式
的优先级调度算法,分析进程运行情况。(注:优先数越大,优先级越高)
进程 | 到达时间 | 运行时间 | 优先数 |
---|---|---|---|
P1 | 0 | 7 | 1 |
P2 | 2 | 4 | 2 |
P3 | 4 | 1 | 3 |
P4 | 5 | 4 | 2 |
注:以下括号内表示当前处于就绪队列的进程
- 0时刻(
P1
) :只有P1到达,P1上处理机。 - 2时刻(
P2
):P2到达就绪队列,优先级比P1更高,发生抢占。P1回到就绪队列,P2上处理机。 - 4时刻(P1、
P3
):P3到达,优先级比P2更高,P2回到就绪队列,P3抢占处理机。 - 5时刻(P1、
P2
、P4):P3完成,主动释放处理机,同时,P4也到达,由于P2比P4更先进入就绪队列,因此选择P2上处理机 - 7时刻(P1、
P4
) :P2完成,就绪队列只剩P1、P4,P4上处理机。 - 11时刻(
P1
) :P4完成,P1上处理机
观察的时刻:
- 任务完成的时刻
- 任务到达的时刻
补充
- 就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以
把优先级高的进程排在更靠近队头的位置
- 根据优先级是否可以动态改变,可将优先级分为
静态优先级
和动态优先级
两种。- 静态优先级:创建进程时确定,之后一直不变。
- 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。
如何合理地设置进程的优先级
-
通常:
系统进程优先级
高于用户进程
,``前台进程优先级高于
后台进程`操作系统更偏好l/O型进程(或称l/O繁忙型进程)
I/O设备和CPU可以并行工作。如果优先让I/O繁忙型进程优先运行的话,则越有可能让I/O设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升
- 注:与
I/O型进程
相对的是计算型进程
(或称CPU繁忙型进程
)
如果采用的是动态优先级,什么时候应该调整?
可以从追求公平
、提升资源利用率
等角度考虑
- 如果某进程在就绪队列中等待了很长时间,则可以适当提升其优先级
- 如果某进程占用处理机运行了很长时间,则可适当降低其优先级
- 如果发现一个进程频繁地进行I/o操作,则可适当提升其优先级
比较前几种算法
FCFS算法
的优点是公平SJF算法
的优点是能尽快处理完短作业,平均等待/周转时间等参数很优秀时间片轮转调度算法
可以让各个进程得到及时的响应优先级调度算法
可以灵活地调整各种进程被服务的机会- 能否对其他算法做个折中权衡?得到一个综合表现优秀平衡的算法呢?
多级反馈队列调度算法
(3) 多级反馈队列调度算法
要点
要点 | 说明 |
---|---|
算法思想 | 对其他调度算法的折中权衡 |
算法规则 | 1.设置多级就绪队列,各级队列优先级从高到低,时间片从小到大 2.新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾如果此时已经是在最下级的队列,则重新放回该队列队尾 3.只有第k级队列为空时,才会为k+1级队头的进程分配时间片 |
用于作业/进程调度 | 用于进程调度(不能是作业调度) |
是否可抢占? | 抢占式 的算法。在 k级队列的进程运行过程中,若更上级的队列( 1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾。 |
优缺点 | 对各类型进程相对公平(FCFS的优点 )每个新到达的进程都可以很快就得到响应( RR的优点 )短进程只用较少的时间就可完成( SPF的优点 )不必实现估计进程的运行时间( 避免用户作假 )可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级) |
是否会导致饥饿 | 会(如果一直有新进程到第一级的话,那么后面级队列的任务就一直无法执行) |
例题
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用多级反馈队列调度算法,分析进程运行的过程。
进程 | 到达时间 | 运行时间 |
---|---|---|
P1 | 0 | 8 |
P2 | 1 | 4 |
P3 | 5 | 1 |
- 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大(优先级越高的时间片越短、反之)
- 新进程到达时先进入第1级队列,按
FCFS原则
排队等待被分配时间片。若用完时间片
进程还未结束,则进程进入下一级队列队尾。如果此时已经在最下级的队列,则重新放回最下级队列队尾 - 只有第k级队列为空时,才会为k+1级队头的进程分配时间片
- 被抢占处理机的进程重新放回原队列队尾
最终的执行顺序为 P1(1)一>P2(1)—>P1(2)一>P2(1)一>P3(1)一>P2(2)——>P1(4)——>P1(1)
实际案例
当然这也是简单地举例,实际上比这复杂,队列数也更多
队列之间可采取固定优先级,或时间片划分
- 固定优先级:高优先级空时低优先级进程才能被调度
- 时间片划分:如三个队列分配时间50%、40%、10%
各队列可采用不同的调度策略,如
- 系统进程队列采用优先级调度
- 交互式队列采用RR
- 批处理队列采用FCFS
比较 & 总结
算法 | 是否可抢占 | 优点 | 缺点 | 考虑指标 | 是否会导致饥饿 |
---|---|---|---|---|---|
时间片轮转 | 抢占式 | 公平,适用于分时系统 | 频繁切换有开销,不区分优先级 | 不会 | 时间片太大或太小有何影响? |
优先级调度 | 有抢占式的,也有非抢占式的。注意做题时的区别 | 区分优先级,适用于实时系统 | 可能导致饥饿 | 会 | 动态/静态优先级。 各类型进程如何设置优先级?如何调整优先级? |
多级反馈队列 | 抢占式 | 平衡优秀 | 一般不说它有缺点,不过可能导致饥饿 | 会 |
- 注:比起早期的批处理操作系统来说,由于计算机造价大幅降低,因此之后出现的交互式操作系统(包括分时操作系统、实时操作系统等)更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此
这三种算法适合用于交互式系统
。(比如UNIx使用的就是多级反馈队列调度算法)
2.3 同步与互斥
2.3.1 基本概念
(1) 进程同步
知识点回顾:进程具有异步性的特征。异步性
是指,各并发执行的进程以各自独立的、不可预知的速度向前推进。
看一个例子:管道通信
- 读进程和写进程并发地运行,
由于并发必然导致异步性
,因此"写数据”和“读数据”两个操作执行的先后顺序是不确定的。而实际应用中,又必须按照“写数据→读数据
”的顺序来执行的。如何解决这种异步问题,就是“进程同步”所讨论的内容。
同步亦称直接制约关系
,它是指为完成某种任务而建立的两个或多个进程
,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系
。进程间的直接制约关系就是源于它们之间的相互合作。
(2) 进程互斥
① 分类和定义
进程的“并发”需要“共享”的支持。各个并发执行的进程不可避免的需要共享一些系统资源(比如内存,又比如打印机、摄像头这样的I/O设备)
- 互斥共享方式:系统中的某些资源,虽然可以提供给多个进程使用,但一个时间段内只允许一个进程访问该资源
- 同时共享方式:系统中的某些资源,允许一个时间段内由多个进程“同时”对它们进行访问
- 我们把
一个时间段内只允许一个进程使用
的资源称为临界资源
。许多物理设备(比如摄像头、打印机)都属于临界资源。此外还有许多变量、数据、内存缓冲区
等都属于临界资源。 - 对临界资源的访问,必须互斥地进行。
互斥,亦称间接制约关系
。进程互斥指当一个进程访问某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后,另一个进程才能去访问临界资源。
② 组成部分
对临界资源的互斥访问,可以在逻辑上分为如下四个部分:
do {
entry section; // 进入区
critical section; // 临界区
exit section; // 退出区
remainder section; // 剩余区
}
区域 | 说明 |
---|---|
进入区 | 负责检查是否可进入临界区,若可进入,则应设置正在访问临界资源的标志(可理解为“上锁”),以阻止其他进程同时进入临界区 |
临界区 | 访问临界资源的那段代码 |
退出区 | 负责解除正在访问临界资源的标志(可理解为“解锁”) |
剩余区 | 做其他处理 |
注意:
- 临界区是进程中访问临界资源的代码段。
- 进入区和退出区是负责实现互斥的代码段。临界区也可称为“临界段”。
如果一个进程暂时不能进入临界区,那么该进程是否应该一直占着处理机? 该进程有没有可能一直进不了临界区?
③ 原则
后面设计互斥算法的时候,都需要考虑这些原则
为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:
空闲让进
。临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;忙则等待
。当已有进程进入临界区时,其他试图进入临界区的进程必须等待;有限等待
。对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿) ;让权等待
。当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。
如果没有实现进程互斥的话
进程A
{
其他代码;
使用打印机;
其他代码
}
进程B
{
其他代码;
使用打印机;
其他代码
}
- 先调度A上处理机运行
- 当A在使用打印机的过程中,分配给它的时间片用完了,接下来操作系统调度B让它上处理机运行进程B也在使用打印机
- 结局:A、B的打印内容混在一起了
2.3.2 进程互斥的软件实现方法
这个的考察频率是比较高的,大题也会考
学习提示:
- 理解各个算法的思想、原理
- 结合上小节学习的“实现互斥的四个逻辑部分”,重点理解各算法在进入区、退出区都做了什么
- 分析各算法存在的缺陷(结合“实现互斥要遵循的四个原则”进行分析)
(1) 单标志法
- 算法思想:两个进程在
访问完临界区后
会把使用临界区的权限转交给另一个进程。 - 也就是说每个进程进入临界区的权限只能被另一个进程赋予
int turn = 0; //turn表示当前允许进入临界区的进程号
// P0进程:
while (turn != 0); ① // 进入区
critical section; ② // 临界区
turn = 1; ③ // 退出区
remainder section; ④ // 剩余区
// P1进程:
while (turn != 1); ⑤ // 进入区
critical section; ⑥ // 临界区
turn = 0; ⑦ // 退出区
remainder section; ⑧ // 剩余区
- turn的初值为0,即刚开始只允许0号进程进入临界区。
- 若P1先上处理机运行,则会一直卡在⑤。直到P1的时间片用完,发生调度,切换P0上处理机运行。
- 代码①不会卡住P0,P0可以正常访问临界区,在P0访问临界区期间即时切换回P1,P1依然会卡在⑤
- 只有PO在退出区将turn改为1后,P1才能进入临界区。
因此,该算法可以实现“同一时刻最多只允许一个进程访问临界区”
用现实的逻辑理解一下turn的含义,即谦让,0号进程用完之后将资源谦让给1号进程
问题:只能按P0→P1→P0→P1→.……..这样轮流访问。
这种必须“轮流访问”带来的问题是,如果此时允许进入临界区的进程是P0,而P0一直不访问临界区,那么虽然此时临界区空闲,但是并不允许P1访问。
- 因此,
单标志法存在的主要问题是,违背“空闲让进”原则。
(临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;)
(2) 双标志先检查法
算法思想:
- 设置一个布尔型数组 flag[],数组中各个元素用来
标记各进程想进入临界区的意愿
,比如“flag[0] = ture”意味着0号进程P0现在想要进入临界区。 - 每个进程在
进入临界区之前
先检查当前有没有别的进程想进入临界区
,如果没有
,则把自身对应的标志flag[i]设为true,之后开始访问临界区。
bool flag[2]; // 表示进入临界区意愿的数组
flag[0] = false;
flag[1] = false; // 刚开始设置为两个进程都不想进入临界区
// P0进程:
while (flag[1]); ① // 进入区, 检查flag[1],也就是是否P1想要进入临界区,如果flag[1]=false,那么进入
flag[0] = true; ② // 也是进入区,表明自己的意愿,0进程想要进入临界区
critical section; ③ // 临界区
flag[0] = false; ④ // 退出区
remainder section; // 剩余区
// P1进程:
while (flag[0]); ⑤ // 进入区, 如果flag[0] = true,即P0想要进入临界区,P1就得一直循环等待
flag[1] = true; ⑥ // 标记P1进入临界区
critical section; ⑦ // 临界区
flag[1] = false; ⑧ // 退出区
remainder section; // 剩余区
理解flag的含义,表达意愿,表达某个进程访问临界资源的意愿
问题:
- 若按照①⑤②⑥③⑦....的顺序执行,P0和P1将会同时访问临界区。
- 因此,双标志先检查法的主要问题是:
违反“忙则等待”原则
。(当已有进程进入临界区时,其他试图进入临界区的进程必须等待;) - 原因在于,
进入区
的“检查”和“上锁”两个处理不是一气呵成的
。 - “检查”后,“上锁”前可能发生进程切换。
(3) 双标志后检查法
算法思想:双标志先检查法的改版。前一个算法的问题是先“检查”后“上锁”,但是这两个操作又无法一气呵成
,因此导致了两个进程同时进入临界区的问题。
因此,人们又想到先“上锁”后“检查”的方法,来避免上述问题。
bool flag[2]; // 表示进入临界区意愿的数组
flag[0] = false;
flag[1] = false; // 刚开始设置为两个进程都不想进入临界区
// P0进程:
flag[0] = true; ① // 进入区, 检查flag[1],也就是是否P1想要进入临界区,如果flag[1]=false,那么进入
while (flag[1]); ② // 也是进入区,表明自己的意愿,0进程想要进入临界区
critical section; ③ // 临界区
flag[0] = false; ④ // 退出区
remainder section; // 剩余区
// P1进程:
flag[1] = true; ⑤ // 进入区, 标记P1进入临界区
while (flag[0]); ⑥ // 如果flag[0] = true,即P0想要进入临界区,P1就得一直循环等待
critical section; ⑦ // 临界区
flag[1] = false; ⑧ // 退出区
remainder section; // 剩余区
- 若按照①⑤②⑥....的顺序执行,PO和P1将都无法进入临界区
- 因此,双标志后检查法虽然解决了“忙则等待”的问题,但是又违背了“空闲让进”和“有限等待”原则,会因各进程都长期无法访问临界资源而
产生“饥饿”现象
。 - 两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。
(4) Peterson算法
算法思想:结合双标志法、单标志法的思想。如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”(谦让)。做一个有礼貌的进程。
也就是
谦让
和表达意愿
一起使用
bool flag[2]; // 表示进入临界区意愿的数组,初始值都是false,表达意愿
int trun = 0; // turn表示优先让那个进程进入临界区,表达谦让
// P0进程:
flag[0] = true; ① // 进入区
trun = 1; ② // 表示先让1进入临界区
while (flag[1] && turn == 1); ③ // 如果flag[1]要进入临界区并且谦让给1,就一直让渡给1,自己一直等待
critical section; ④ // 临界区
flag[0] = false; ⑤ // 退出区
remainder section; // 剩余区
// P1进程:
flag[1] = true; ⑥ // 进入区, 标记P1进入临界区
trun = 0; ⑦
while (flag[0] && turn == 0); ⑧ // 如果flag[0] = true,即P0想要进入临界区,P1就得一直循环等待
critical section; ⑨ // 临界区
flag[1] = false; ⑩ // 退出区
remainder section; // 剩余区
- 虽然两个都谦让了,但是后谦让的会起效果
问题:
- Peterson算法用软件方法解决了进程互斥问题,遵循了空闲让进、忙则等待、有限等待三个原则,但是依然
未遵循让权等待
的原则。 让权等待
:如果此时进不了临界区
,那么就立即释放处理器资源
,可是这个算法会一直卡在while循环哪里不会释放资源- Peterson算法相较于之前三种软件解决方案来说,是最好的,但依然不够好。
总结
方法 | 思路 | 问题 |
---|---|---|
单标志法 | 在进入区只做“检查",不"上锁” 在退出区把临界区的使用权转交给另一个进程(相当于在退出区既给另一进程“解锁",又给自己“上锁") |
不遵循“空闲让进"原则 |
双标志先检查 | 在进入区先“检查"后"上锁",退出区“解锁” | 不遵循“忙则等待"原则 |
双标志先检查 | 在进入区先“加锁"后“检查",退出区“解锁” | 不遵循“空闲让进、有限等待"原则,可能导致“饥饿” |
Peterson算法 | 在进入区“主动争取—主动谦让—检查对方是否想进、己方是否谦让” | 不遵循“让权等待"原则,会发生“忙等” |
双标志先检查法的问题在于检查和上锁不能一气呵成如果可以做到的话,那么这个算法是没有问题的。下面可以用硬件的方法实现
2.3.3 进程互斥的硬件实现方法
学习提示:
- 理解各方法的原理
- 了解各方法的优缺点
(1) 中断屏蔽方法
- 利用“开/关中断指令”实现(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)
...
关中断; // 关中断后即不允许当前进程被中断,也必然不会发生进程切换
临界区;
开中断; // 直到当前进程访问完临界区,再执行开中断指令,才秀可能有别的进程上处理机并访问临界区
...
- 优点:简单、高效
- 缺点
- 不适用于多处理机;(因为开关中断只能适用于一个处理机如果另一个处理机允许访问临界区就发生冲突了)
- 只适用于操作系统内核进程,不适用于用户进程(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)
(2) TestAndSet指令
- 简称TS指令,也有地方称为
TestAndSetLock指令
,或TSL指令
- TSL指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。以下是用c语言描述的逻辑
// 布尔型共享变量lock表示当前临界区是否被加锁
// true 表示已加锁,false表示未加锁
// 这是硬件实现的原语,函数必定一气呵成
bool TestAndSet (bool *lock){
bool old;
old = *lock; // old用来存放lock原来的值
*lock = true;//无论之前是否已加锁,都将lock设为true
return old;//返回Lock原来的值
}
我的理解:
- 无论是否加锁,TS指令都会上锁
- 返回值是之前是否上锁了
//以下是使用TSL指令实现互斥的算法逻辑
while (TestAndSet (&lock)); //"上锁"并“检查
临界区代码段...
lock = false; //“解锁”
剩余区代码段...
- 若刚开始lock是false,则TSL返回的old值为false,while循环条件不满足,直接跳过循环,进入临界区。若刚开始lock是 true,则执行TLS后old返回的值为true,while循环条件满足,会一直循环,直到当前访问临界区的进程在退出区进行“解锁”。
- 相比软件实现方法,TSL指令把“上锁”和“检查”操作用硬件的方式变成了一气呵成的原子操作。
- 优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境
- 缺点:
不满足“让权等待”原则
,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等
”。
(3) swap指令
- 有的地方也叫Exchange指令,或简称XCHG指令。
- Swap指令
是用硬件实现的
,执行的过程不允许被中断
,只能一气呵成。以下是用c语言描述的逻辑
// Swap指令的作用是交换两个变量的值
Swap (bool *a,bool *b) {
bool temp;
temp = *a;
*a= *b;
*b = temp;
}
逻辑上和TS差不多
//以下是用Swap指令实现互斥的算法逻辑
// lock表示当前临界区是否被加锁
bool old = true;
while (old == true)
Swap (&lock,&old);
临界区代码段...
lock = false;
剩余区代码段...
- 逻辑上来看Swap和TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在old变量上),再将上锁标记lock设置为true,最后检查old,如果 old 为 false则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。
- 优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境
- 缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
2.3.4 互斥锁
- 解决临界区最简单的工具就是
互斥锁(mutex lock)
。一个进程在进入临界区时应获得锁;在退出临界区时释放锁。函数acquire()获得锁
,而函数release()释放锁
。 - 每个互斥锁有一个布尔变量 available,表示锁是否可用。如果锁是可用的,调用acqiure()会成功,且锁不再可用。当一个进程试图获取不可用的锁时,会被阻塞,直到锁被释放。
acquire (){
while (!available); // 忙等待
available = false; // 获得锁
}
release(){
available = true; //释放锁
}
- acquire()或release()的执行必须是原子操作,因此互斥锁通常采用硬件机制来实现。
- 互斥锁的
主要缺点是忙等待
,当有一个进程在临界区中,任何其他进程在进入连续循环调用acquire()。当多个进程共享同一CPU时,就浪费了CPU周期
。 - 因此,
互斥锁用于多处理器系统
,一个线程可以在一个处理器上等待,不影响其他线程的执行
。 - 需要
连续循环忙等的互斥锁
,都可称为自旋锁(spin lock):如TSL指令、swap指令、单标志法
特性:
- 需忙等,进程时间片用完才下处理机,违反“
让权等待
” - 优点:等待期间不用切换进程上下文,多处理器系统中,若上锁的时间短,则等待代价很低
- 常用于多处理器系统,一个核忙等,其他核照常工作,并快速释放临界区
- 不太适用于单处理机系统,忙等的过程中不可能解锁
在
do {
entry section; // 进入区
critical section; // 临界区
exit section; // 退出区
remainder section; // 剩余区
}
中,acquire()
相当于进入区,release()
相当于退出区
2.3.5 信号量
复习回顾+思考:之前学习的这些进程互斥的解决方案分别存在哪些问题?
- 进程互斥的四种软件实现方式(单标志法、双标志先检查、双标志后检查、Peterson算法)
- 进程互斥的三种硬件实现方式(中断屏蔽方法、TS/TSL指令、Swap/XCHG指令)
- 在
双标志先检查法
中,进入区的“检查”、“上锁”操作无法一气呵成,从而导致了两个进程有可能同时进入临界区
的问题 - 所有的解决方案都无法实现“让权等待
1965年,荷兰学者Dijkstra提出了一种卓有成效的实现进程互斥、同步的方法――信号量机制
- 用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。
信号量
其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量
,比如:系统中只有一台打印机,就可以设置一个初值为1的信号量原语
是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的
。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,使这些操作能“一气呵成”就能避免问题。一对原语
:wait(S)
原语和signal(S)
原语,可以把原语理解为我们自己写的函数,函数名分别为wait和 signal,括号里的信号量s其实就是函数调用时传入的一个参数。- wait、signal原语常
简称为P、V操作
(来自荷兰语proberen和verhogen)。因此,做题的时候常把wait(S)、signal(S)两个操作分别写为P(S)、v(S)
(1) 整型信号量
用一个整数型的变量
作为信号量,用来表示系统中某种资源的数量
。
整型信号量与普通整数变量的区别:对信号量的操作只有三种,即
初始化
、P操作
、V操作
- Eg :某计算机系统中有一台打印机
int S = 1; // 初始化整型信号量S,表示当前系统中可用的打印机资源数
void wait (int s) { // wait原语,相当于“进入区”,“检查”和“上锁”一气呵成,避免了并发、异步导致的问题
while (S <= 0) ; //如果资源数不够,就一直循环等待
S=S-1; //如果资源数够,则占用一个资源
}
void signal (int S) { // signal原语,相当于“退出区”
S=S+1; //使用完资源后,在退出区释放资源
}
每个进程的任务
// 进程Pn:
wait(S); // 进入区,申请资源
使用打印机资源... //临界区,访问资源
signal(S); //退出区,释放资源
...
存在的问题,wait
函数里面的while
循环,不满足“让权等待
”原则,会发生“忙等”
只要存在循环,就会出现让权等待问题
(2) 记录型信号量
整型信号量的缺陷是存在“忙等”问题
,因此人们又提出了“记录型信号量
”,即用记录型数据结构
表示的信号量。
typedef struct {
int value; // 剩余资源数
struct process *L; // 等待队列
} semaphore;
后面一定要理解,这个信号量不仅仅有value,还有一个队列
/*某进程需要使用资源时,通过wait原语申请*/
void wait (semaphore S) {
S.value--;
if (S.value < 0) {
block(S.L); // 将本进程阻塞(到阻塞态,让出处理器),并添加到S的队列中
}
}
如果剩余资源数不够,使用block原语使进程从运行态进入阻塞态
,并把挂到信号量S的等待队列(即阻塞队列)中
void signal (semaphore S) {
S.value++;
if (S.value <= 0) { // S.value++之后S.value <= 0 说明有进程在等待,此时wakeup唤醒
wakeup(S.L);
}
}
释放资源后,若还有别的进程在等待这种资源,则使用wakeup原语唤醒等待队列中的一个进程,该进程从阻塞态为就绪态
举例:某计算机系统中有2台打印机...,则可在初始化信号量S时将S.value的值设为2,队列S.L设置为空
- 在考研题目中 wait(S)、signal(S)也可以记为P(S)、V(s),这对原语可用于实现系统资源的“申请”和“释放”。
- S.value 的初值表示系统中某种资源的数目。
对信号量s的一次P操作
意味着进程请求一个单位的该类资源,因此需要执行S.value--,表示资源数减1,当S.value <0时表示该类资源已分配完毕
,因此进程应调用block原语进行自我阻塞(当前运行的进程从运行态→>阻塞态),主动放弃处理机
,并插入该类资源的等待队列S.L
中。可见,该机制遵循了“让权等待”原则,不会出现“忙等”现象。对信号量s的一次V操作
意味着进程释放一个单位的该类资源,因此需要执行S.value++,表示资源数加1,若加1后仍是S.value <=0,表示依然有进程在等待该类资源,因此应调用wakeup原语唤醒等待队列中的第一个进程(被唤醒进程从阻塞态→就绪态)。
注:若考试中出现P(S)、V(S)的操作,除非特别说明,否则默认S为记录型信号量
2.3.6 用信号量实现进程同步、互斥、前驱
Tips:不要一头钻到代码里,要注意理解信号量背后的含义,一个信号量对应一种资源
信号量的值=这种资源的剩余数量
(信号量的值如果小于0,说明此时有进程在等待这种资源
- P(S)——申请一个资源S,如果资源不够就阻塞等待
- V(S)——释放一个资源S,如果有进程在等待该资源,则唤醒一个进程
(1) 信号量机制实现进程互斥
步骤:
- 分析并发进程的关键活动,划定临界区(如:对临界资源打印机的访问就应放在临界区)
- 设置互斥信号量mutex,初值为1(互斥变量mutex的初值一定是1,因为临界区只有1个)
- 在进入区P(mutex)——申请资源
- 在退出区 V(mutex)-一释放资源
typedef struct {
int value; // 剩余资源数
struct process *L; // 等待队列
} semaphore;
使用P、V操作
semaphore mutex = 1; // 初始化信号量
P1(){
// ...
P(mutex); // 使用邻接资源前需要加锁
临界区代码段...;
V(mutex); //使用临界资源后需要解锁
...;
}
P2(){
P(mutex);
临界区代码段...;
V(mutex);
...
}
- 注意:对
不同的临界资源需要设置不同的互斥信号量
。 - P、V操作必须成对出现。
缺少P(mutex)
就不能保证临界资源的互斥访问
。缺少V(mutex)
会导致资源永不被释放,等待进程永不被唤醒
。
(2) 信号量机制实现进程同步
进程同步:要让各并发进程按要求有序地推进。
P1() {
代码1;
代码2;
代码3;
}
P2() {
代码4;
代码5;
代码6;
}
- 比如,P1、P2并发执行,由于存在异步性,因此二者交替推进的次序是不确定的。
- 若P2的
“代码4”要基于P1的“代码1”和“代码2”的运行结果
才能执行,那么我们就必须保证“代码4”一定是在“代码2”之后才会执行
。 - 这就是进程同步问题,让本来异步并发的进程互相配合,有序推进。
步骤,用信号量实现进程同步:
- 分析什么地方需要实现“同步关系”,即必须保证“一前一后”执行的两个操作(或两句代码)
- 设置同步信号量S,
初始为0
- 在“前操作”之后执行v(S)
- 在“后操作”之前执行P(S)
口诀:前V后P,也就是先后顺序,前面是V,后面是P
/*信号量机制实现同步*/
semaphore S = 0; // 初始化同步信号量,初始值为-
P1() {
代码1;
代码2;
V(S); //相当于给了P2执行的资源
代码3;
}
P2() {
P(V);
代码4;
代码5;
代码6;
}
这句话解释的很到位
理解
semaphore S = 0;
:信号量S代表“某种资源”,刚开始是没有这种资源的。P2需要使用这种资源,而又只能由P1产生这种资源
- 若先执行到v(S)操作,则S++后S=1。之后当执行到P(S)操作时,由于S=1,表示有可用资源,会执行S--,S的值变回0,P2进程不会执行block原语,而是继续往下执行代码4。
- 若先执行到P(S)操作,由于S=0,S--后S=-1,表示此时没有可用资源,因此P操作中会执行block原语,主动请求阻塞。之后当执行完代码2,继而执行V(S)操作,S++,使s变回0,由于此时有进程在该信号量对应的阻塞队列中,因此会在V操作中执行wakeup原语,唤醒P2进程。这样P2就可以继续执行代码4了
(3) 信号量机制实现前驱关系
进程P1中有句代码S1,P2中有句代码S2,P3中有句代码s3 ...P6中有句代码S6。
这些代码要求按如下前驱图所示的顺序来执行:
其实每一对前驱关系
都是一个进程同步问题
(需要保证一前一后的操作)因此,
- 要为
每一对前驱关系各设置一个同步信号量
- 在“前操作”之后对相应的同步信号量执行v操作
- 在“后操作”之前对相应的同步信号量执行Р操作
每个箭头都对应一个前驱(同步)关系,在
箭头起点执行V操作,箭头终点执行P操作
则PV的位置如下
分析(主要分析P6)
- 到了
P(e)
,那么必须等到V(e),也就是S4结束,否则就会阻塞 - 不用担心到了
P(f)
然后P(e)
出问题了,因为过不了P(e)就到不了P(f)
2.3.7 经典同步问题
PV操作题目分析步骤:
- 关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
- 整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
- 设置信号量。并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
(1) 生产者消费者问题
- 系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注:这里的“产品”理解为某种数据)
- 生产者、消费者共享一个初始为空、大小为n的缓冲区。
- 只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。
- 只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。
同步、互斥关系分析
:
- 进程互斥问题:多个生产者写的时候需要互斥,否则可能会覆盖
- 进程同步问题
- 生产者、消费者共享一个初始为空、大小为n的缓冲区。
- 只有
缓冲区没满
时,生产者才能把产品放入缓冲区,否则必须等待只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。 - 缓冲区是临界资源,各进程必须互斥地访问。
有以下同步问题
这是
两对一前一后的同步关系
(实际上信号量实现同步的时候,一个信号量只能完成一个一前一后的关系
,这里有两个,因此需要两个信号量)
整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
设置信号量。并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
semaphore mutex = 1; // 互斥信号量,实现对缓冲区的互斥访问
semaphore empty = n; // 同步信号量,表示空闲缓冲区的数量
semaphore full = 0; // 同步信号量,表示产品的数量,也即非空缓冲区的数量
empty和full仅仅只有数值上的关系吧,但是操作起来没有任何联系,而知管理的是两个无关的同步关系
写代码
- 首先写出基本的逻辑,找到临界区在哪
producer () {
while(1) {
生产一个产品; // 不属于临界区,不占用邻接资源
把产品放入缓冲区; // 临界区
}
}
consumer () {
while(1) {
把产品放入缓冲区; // 临界区
使用产品; // 不使用缓冲区,不是临界区
}
}
把产品放入缓冲区
和使用产品
这两个操作放在临界区会增加临界区的代码量降低性能,因此不放在临界区
先实现同步功能
按照先V后P的顺序写
producer () {
while(1) {
生产一个产品; // 不属于临界区,不占用邻接资源
把产品放入缓冲区; // 临界区
V(full);
}
}
consumer () {
while(1) {
P(full);
从缓冲区取出一个产品; // 临界区
使用产品; // 不使用缓冲区,不是临界区
}
}
producer () {
while(1) {
生产一个产品; // 不属于临界区,不占用邻接资源
P(empty);
把产品放入缓冲区; // 临界区
V(full);
}
}
consumer () {
while(1) {
P(full);
从缓冲区取出一个产品; // 临界区
V(empty)
使用产品; // 不使用缓冲区,不是临界区
}
}
- 然后实现互斥功能
producer () {
while(1) {
生产一个产品; // 不属于临界区,不占用邻接资源
P(empty);
P(mutex);
把产品放入缓冲区; // 临界区
V(mutex);
V(full);
}
}
consumer () {
while(1) {
P(full);
P(mutex);
从缓冲区取出一个产品; // 临界区
V(mutex);
V(empty)
使用产品; // 不使用缓冲区,不是临界区
}
}
同步与互斥PV的顺序
上述中,是先P(empty),然后P(mutex),如果更换顺序呢?
producer () {
while(1) {
生产一个产品; // 不属于临界区,不占用邻接资源
P(mutex); // mutex操作在前 1
P(empty); // 2
把产品放入缓冲区; // 临界区
V(mutex);
V(full);
}
}
consumer () {
while(1) {
P(mutex); // 3
P(full); // 4
从缓冲区取出一个产品; // 临界区
V(mutex);
V(empty)
使用产品; // 不使用缓冲区,不是临界区
}
}
- 若此时缓冲区内已经放满产品,则empty=0,full=n。
- 则生产者进程执行 ①使mutex变为0,再执行②,由于已没有空闲缓冲区,因此生产者被阻塞由于生产者阻塞,因此切换回消费者进程。消费者进程执行③,由于mutex为o,即生产者还释放对临界资源的“锁”,因此消费者也被阻塞。
- 这就造成了
生产者等待消费者释放空闲缓冲区,而消费者又等待生产者释放临界区
的情况,!产者和消费者循环等待被对方唤醒,出现“死锁”
。 - 同样的,若缓冲区中没有产品,即full=0,empty=n。按③④①的顺序执行就会发生死锁。
- 因此,
实现互斥的P操作一定要在实现同步的P操作之后
。 - V操作不会导致进程阻塞,因此
两个v操作顺序可以交换
。v操作不会导致进程阻塞
总之记住,对于临界区资源的PV操作要紧贴临界区
回顾
- 生产者消费者问题是一个互斥、同步的综合问题。
- 对于初学者来说最难的是
发现题目中隐含的两对同步关系
。(是两队) - 有时候是消费者需要等待生产者生产,有时候是生产者要等待消费者消费,这是
两个不同的“一前一后问题”
,因此也需要设置两个同步信号量
。 - 易错点:实现互斥和实现同步的两个P操作的先后顺序(死锁问题)
(2) 多生产者、多消费者问题
桌子上有一只盘子,每次只能向其中放入一个水果。
- 爸爸专向盘子中放苹果,妈妈专向盘子中放橘子
- 儿子专等着吃盘子中的橘子,女儿专等着吃盘子中的苹果。
只有盘子空时,爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时,儿子或女儿可以从盘子中取出水果。
用PV操作实现上述过程。
这里的多,不仅仅是多个,而是多类
关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
-
互斥关系:对缓冲区(盘子)的访问要互斥地进行
-
同步关系(一前一后):
- 父亲将苹果放入盘子后,女儿才能取苹果
- 母亲将橘子放入盘子后,儿子才能取橘子
- 只有
盘子为空
时,父亲或母亲才能放入水果
“
盘子为空
”这个事件可以由儿子或女儿触发并且女儿和儿子是没有区别的,事件发生后才允许父亲或母亲放水果
- 整理思路。根据各进程的操作流程确定P、V操作的大致顺序。(每条线都是前V后P)
设置信号量。并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
semaphore mutex = 1; //实现互斥访问盘子(缓冲区)
semaphore apple = 0; //盘子中有几个苹果(初始值为0)
semaphore orange = 0; //盘子中有几个橘子(初始值为0)
semaphore plate = 1; //盘子中还可以放多少个水果(初始值为1)
-
写代码
-
首先确定临界区
dad () {
while(1) {
准备一个苹果; // 非临界区
把苹果放入盘子; // 临界区
}
}
mom () {
while(1) {
准备一个橘子; // 非临界区
把橘子放入盘子; // 临界区
}
}
daughter () {
while(1) {
从盘中取出苹果; // 临界区
吃掉苹果; // 非临界区
}
}
son () {
while(1) {
从盘中取出橘子; // 临界区
吃掉橘子; // 非临界区
}
}
- 然后确定同步关系(一对同步一对同步地来)
dad () {
while(1) {
准备一个苹果; // 非临界区
P(plate);
把苹果放入盘子; // 临界区
V(apple);
}
}
mom () {
while(1) {
准备一个橘子; // 非临界区
P(plate);
把橘子放入盘子; // 临界区
V(orange);
}
}
daughter () {
while(1) {
P(apple);
从盘中取出苹果; // 临界区
V(plate);
吃掉苹果; // 非临界区
}
}
son () {
while(1) {
P(orange);
从盘中取出橘子; // 临界区
V(plate);
吃掉橘子; // 非临界区
}
}
是否需要设置互斥变量
- 然后是互斥关系(分析一下,本题中需要互斥关系吗?)
分析:
- 刚开始,儿子、女儿进程即使上处理机运行也会被阻塞。
- 如果刚开始是父亲进程先上处理机运行,则:父亲P(plate),可以访问盘子→母亲P(plate),阻塞等待盘子→父亲放入苹果V(apple),女儿进程被唤醒,其他进程即使运行也都会阻塞,暂时不可能访问临界资源(盘子)→女儿P(apple),访问盘子,V(plate),等待盘子的母亲进程被唤醒→母亲进程访问盘子(其他进程暂时都无法进入临界区)>....
结论:即使不设置专门的互斥变量mutex,也不会出现多个进程同时访问盘子的现象
原因在于:本题中的缓冲区大小为1,在任何时刻,apple、orange、plate三个同步信号量中最多只有一个是1
。因此在任何时刻,最多只有一个进程的P操作不会被阻塞,并顺利地进入临界区
...
但是如果盘子的容量为2呢?即plate=2;
父亲P(plate),可以访问盘子→母亲P(plate),可以访问盘子→父亲在往盘子里放苹果,同时母亲也可以往盘子里放橘子。于是就出现了两个进程同时访问缓冲区
的情况,有可能导致两个进程写入缓冲区的数据相互覆盖的情况因此,如果缓冲区大小大于1,
就必须专门设置一个互斥信号量mutex来保证互斥访问缓冲区
-
总结:在生产者-消费者问题中,如果
缓冲区大小为1
,那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能
。当然,这不是绝对的,要具体问题具体分析。
-
建议:在考试中如果来不及仔细分析,可以加上互斥信号量,保证各进程一定会互斥地访问缓冲区。但需要注意的是,实现互斥的P操作一定要在实现同步的P操作之后,否则可能引起“死锁”。
解决“多生产者-多消费者问题”的关键在于理清复杂的同步关系
。
- 在分析同步问题(一前一后问题)的时候不能从单个进程行为的角度来分析,要把“一前一后”发生的事看做是
两种“事件”
的前后关系。 - 比如,如果从单个进程行为的角度来考虑的话,我们会有以下结论:
- 如果盘子里装有苹果,那么一定要女儿取走苹果后父亲或母亲才能再放入水果
- 如果盘子里装有橘子,那么一定要儿子取走橘子后父亲或母亲才能再放入水果
- 这么看是否就意味着要设置四个同步信号量分别实现这四个“一前一后”的关系了?
- 正确的分析方法应该
从“事件”的角度
来考虑,我们可以把上述四对“进程行为的前后关系”抽象为一对“事件的前后关系” - 盘子变空事件→放入水果事件。“盘子变空事件”既可由儿子引发,也可由女儿引发;“放水果事件”既可能是父亲执行,也可能是母亲执行。这样的话,就可以用一个同步信号量解决问题了
这里可以再听一遍
(3) 吸烟者问题
假设一个系统有三个抽烟者进程和一个供应者进程。
- 每个抽烟者不停地卷烟并抽掉它,但是要卷起并抽掉一支烟,抽烟者需要有三种材料:烟草、纸和胶水。
- 三个抽烟者中:第一个拥有烟草,第二个拥有纸、第三个拥有胶水。(各自的资源是用不完的)
- 供应者进程无限地提供三种材料,供应者每次将
两种材料
放桌子上,拥有剩下那种材料的抽烟者卷一根烟并抽掉它
,并给供应者进程一个信号告诉完成了,供应者就会放另外两种材料再桌上,这个过程一直重复(让三个抽烟者轮流地抽烟)
本质上这题也属于“生产者-消费者
”问题,更详细的说应该是“可生产多种产品的单生产者-多消费者
”。
关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
- 互斥关系:桌子可以抽象为容量为1的缓冲区,要互斥访问
- 同步关系:
这里要注意的点,就是将生产者放下的两种东西看做一种组合
- 组合一:纸+胶水
- 组合二:烟草+胶水
- 组合三:烟草+纸
注意:缓冲器大小是1因为每次放的东西不能看做是两个东西,而应该是一组东西
- 同步关系(从事件的角度来分析)
- 桌上有组合一→第一个抽烟者取走东西
- 桌上有组合二→第二个抽烟者取走东西
- 桌上有组合三→第三个抽烟者取走东西
- 发出完成信号→供应者将下一个组合放到桌上
整理思路。根据各进程的操作流程确定P、V操作的大致顺序
semaphore offer1 = 0; //桌上组合一的数量
semaphore offer2 = 0; //桌上组合二的数量
semaphore offer3 = 0; //桌上组合三的数量
semaphore finish = 0; // 抽烟是否完成,互斥信号量
int i =0; //用于实现”三个抽烟者轮流抽烟"
- 可以注意一下这里信号量的命名
- 由于只有一个缓冲区,并且四个同步信号量至多有1个的值为1,则不用mutex了
写代码
- 首先写基础代码,确定临界区
provider() {
while (1) {
if (i == 0) {
将组合1放桌上; // 临界区
}
if (i == 1) {
将组合2放桌上; // 临界区
}
if (i == 2) {
将组合3放桌上; // 临界区
}
i = (i + 1) % 3;
}
}
smoker1 (){
while (1){
从桌上拿走组合一;卷烟;抽掉; // 临界区
}
}
smoker2 (){
while (1){
从桌上拿走组合二;卷烟;抽掉; // 临界区
}
}
smoker3 (){
while (1){
从桌上拿走组合三;卷烟;抽掉; // 临界区
}
}
- 然后写同步关系
provider() {
while (1) {
if (i == 0) {
将组合1放桌上; // 临界区
V(offer1);
}
if (i == 1) {
将组合2放桌上; // 临界区
V(offer2);
}
if (i == 2) {
将组合3放桌上; // 临界区
V(offer3);
}
i = (i + 1) % 3;
P(finish); // 一定注意这个的位置,放在后面,因为一开始finish=0
}
}
smoker1 (){
while (1){
P(offer1);
从桌上拿走组合一;卷烟;抽掉; // 临界区
V(finish);
}
}
smoker2 (){
while (1){
P(offer2);
从桌上拿走组合二;卷烟;抽掉; // 临界区
V(finish);
}
}
smoker3 (){
while (1){
P(offer3);
从桌上拿走组合三;卷烟;抽掉; // 临界区
V(finish);
}
}
总结:
吸烟者问题可以为我们解决“可以生产多个产品的单生产者”问题提供一个思路。
- 值得吸取的精华是:“轮流让各个吸烟者吸烟”必然需要“轮流的在桌上放上组合一、一、二”,
- 注意体会
这里是如何用一个整型变量i实现这个“轮流”过程的
。 - 如果题目改为“每次随机地让一个吸烟者吸烟”,我们有应该如何用代码写出这个逻辑呢(就用一个随机数)
- 若一个生产者要生产多种产品(或者说会引发多种前驱事件),那么各个V操作应该放在各自对应的“事件”发生之后的位置。
(4) 读者、写者问题
有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用
,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时则可能导致数据不一致的错误
。因此要求:
- 允许多个读者可以同时对文件执行读操作
- 只允许一个写者往文件中写信息
- 任一写者在完成写操作之前不允许其他读者或写者工作
- 写者执行写操作前,应让已有的读者和写者全部退出。
也就是说,写者操作的时候,不允许其他任何人操作
- 读进程与写进程同时共享数据,可能导致读出的数据不一致的问题
- 两个写进程同时共享数据,可能导致数据错误覆盖的问题
这里要注意读者和消费者的区别
- 与消费者进程不同,读者进程在读数据后并不会将数据清空,并不会改变数据。因此多个读者可同时访问共享数据
- 消费者可能会拿走数据,但是读者不会,仅仅是读
关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
- 两类进程:读进程、写进程
- 互斥关系:写进程——写进程、读进程——写进程。读进程与读进程不存在互斥问题。
这里并没有同步关系:和生产者消费者问题不一样,消费者在消费之前必须生产者内容,因此有同步关系;但是这里并没有这样的限制,因此不会有同步关系
整理思路。根据各进程的操作流程确定P、V操作的大致顺序
(只有互斥操作就比较简单)
设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
semaphore rw = 1;
写代码
- 首先写基础代码,找到临界区
semaphore rw = 1; // 只对一个缓冲区有互斥,因此只要一个互斥信号量即可互斥信号量的初值一般就是1,不会变
writer () {
while(1) {
写文件..; // 临界区
}
}
reader () {
while(1) {
读文件..; // 临界区
}
}
- 然后互斥变量
writer () {
while(1) {
P(rw); // 写之前加锁
写文件..; // 临界区
V(rw); // 鞋之后解锁
}
}
reader () {
while(1) {
P(rw);
读文件..; // 临界区
V(rw);
}
}
- 但是出现问题了,读进程此时只能允许一个读进程读
读进程是要和写进程互斥的,但是读进程不能和读进程互斥,解决思路:
- 将所有的读进程看做一个整体,使用一个count计数,共同来操作这个rw(也就是只有第一个执行P,最后一个执行V)
semaphore rw = 1;
int count = 0;
reader () {
while(1) {
if(count == 0) // 表明是第一个读者
P(rw);
count++;
读文件..; // 临界区
count--;
if(count == 0)
V(rw);
}
}
- 在P(rw)之前先判断是否是第一个,如果是第一个才P(rw),也就是请求锁
- 如果不是第一个就直接读,不用在P操作中等待了
- 在V(rw)之前先判断是否是最后一个,如果是最后一个再释放锁
就是将所有读者看做一个整体
但是还是出了问题
思考:若两个读进程并发执行,则count=0时两个进程也许都能满足if条件,都会执行P(rw),从而使第二个读进程阻塞的情况。
如何解决:出现上述问题的原因在于对count变量的检查和赋值无法一气呵成,因此可以设置另一个互斥信号量来保证各读进程对count的访问是互斥的。
简而言之:读者一执行了if之后,在执行P操作之前,时间片给了读者二,读者二进行了P操作,但是
读者一就会卡在P操作了
问题还是 if 和 PV操作无法一气呵成,采用的方式就是互斥锁
如果想要多个操作一气呵成,即实现原子性,就用互斥锁
semaphore mutex = 1;
reader () {
while(1) {
P(mutex);
if(count == 0) // 表明是第一个读者
P(rw);
V(mutex);
count++;
读文件..; // 临界区
count--;
P(mutex);
if(count == 0)
V(rw);
V(mutex);
}
}
- 现在同步互斥问题解决了,但是还有问题
潜在的问题:只要有读进程还在读,进程就要一直阻塞等待,可能“饿死因此,这种算法中,读进程是优先的
要解决的不仅仅是同步互斥问题,还有有限度问题
semaphore rw = 1;
int count = 0; // 为了实现多个读者同时访问
semaphore mutex = 1; // 用于实现读进程的 if PV操作的原子性,也就是对count的互斥访问
semaphore w = 1; // 用于实现写优先
writer () {
while(1) {
P(w); // 如果写者先来,写者先排队
P(rw);
写文件..;
V(rw);
V(w);
}
}
reader () {
while(1) {
P(w); // 如果读者后来,那么读者堵塞
P(mutex);
if(count == 0)
P(rw);
V(mutex);
count++;
V(w);
读文件..;
count--;
P(mutex);
if(count == 0)
V(rw);
V(mutex);
}
}
- 这明显是一个互斥变量,互斥变量也能实现优先级问题,即先来先得问题
- 不要忘了信号量不仅仅有数值,还有队列,因此设计互斥信号量可以让先来的人先排队
可以分析以下并发执行P(w)的情况:
- 读者1→读者2
- 写者1→写者2
- 写者1→读者1
- 读者1→写者1→读者2
- 写者1→读者1→写者2
有了rw,那么读者1在读的时候,写者就会被rw阻塞
但是有了w,那么写者在阻塞的时候,读者2也会被阻塞
,就是用w来保证写者的优先权
互斥信号量除了表示资源数目之外,还起到了排队的功能就是通过这个排队的功能,保证了先来的写者能够排在前面
结论:
- 在这种算法中,连续进入的多个读者可以同时读文件
- 写者和其他进程不能同时访问文件;写者不会饥饿,但也并不是真正的“写优先”,而是相对公平的先.来先服务原则。
- 有的书上把这种算法称为“
读写公平法
”。
回顾:
互斥信号量实现两个任务:
- 多个操作的原子性问题
- 优先级问题,先来的先排队,后来的等再后面
还有就是多个读者问题:
- 其核心思想在于设置了一个计数器coun用来记录当前正在访问共享文件的读进程数。
- 我们可以用count的值来判断当前进入的进程是否是第一个/最后一个读进程,从而做出不同的处理。
就是利用count将所有的读者连成一个整体
另外,对count变量的检查和赋值不能一气呵成导致了一些错误,如果需要实现“一气呵成”,自然应该想到用互斥信号量。
最后,还要认真体会我们是如何解决“写进程饥饿”问题的。
绝大多数的考研PV操作大题都可以用之前介绍的几种
生产者-消费者问题
的思想来解决,如果遇到更复杂的问题,可以想想能否用读者写者问题的这几个思想来解决。
(5) 哲学家进餐问题
一张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。
- 只有当哲学家饥饿时才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。
- 饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。
- 关系分析。系统中有5个哲学家进程,
5位哲学家与左右邻居对其中间筷子的访问是互斥关系
。 - 整理思路。这个问题中只有互斥关系,但与之前遇到的问题不同的事,
每个哲学家进程需要同时持有两个临界资源才能开始吃饭
。如何避免临界资源分配不当造成的死锁现象,是哲学家问题的精髓
。就是每个哲学家都拿一只筷子,那就死锁了,没人能吃饭 - 信号量设置。定义互斥信号量数组 chopstick[5]={1,1,1,1,1}用于实现对5个筷子的互斥访问。并对哲学家按0~4编号,
哲学家i左边的筷子编号为i,右边的筷子编号为(i+1)%5
写代码
- 首先是基础代码
semaphore chopstick[5] = {1, 1, 1, 1, 1}; // 就是5个互斥信号量
Pi () {
while (1) {
吃饭...; // 临界区
思考...;
}
}
- 然后是拿起筷子,需要访问资源
Pi () {
while (1) {
P(chopstick[i]); // 拿左边的筷子
P(chopstick[(i+1)%5]); // 拿右边的筷子
吃饭...; // 临界区
V(chopstick[i]); // 放下左边的筷子
V(chopstick[(i+1)%5]); // 放下右边的筷子
思考...;
}
}
- 但是现在出问题了,如果5个哲学家并发地拿起了左手边的筷子
每位哲学家循环等待右边的人放下筷子(阻塞),发生“死锁
”
- 我最开始想到的,就是保证拿起两个筷子的原子性,使用互斥信号了保证
先看看其他的方法
- 可以对哲学家进程施加一些限制条件,比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的
- 要求奇数号哲学家先拿左边的筷子,然后再拿右边的筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。
还是用自己的解决思路
semaphore chopstick[5] = {1, 1, 1, 1, 1}; // 就是5个互斥信号量
semaphore mutex = 1; 互斥地取筷子
Pi () {
while (1) {
P(mutex);
P(chopstick[i]);
P(chopstick[(i+1)%5]);
V(mutex);
吃饭...; // 临界区
V(chopstick[i]);
V(chopstick[(i+1)%5]);
思考...;
}
}
这里有一些取舍,就是有好处也有坏处:
- 坏处:如果一个哲学家拿到一根筷子,但是另一根筷子拿不到,那么他就会霸占这根筷子,另一个哲学家也拿不到了
- 好处:保证了优先级了
具体选哪个,看需求吧
因此这种方法并不能保证只有两边的筷子都可用时,才允许哲学家拿起筷子。
- 更准确的说法应该是:各哲学家拿筷子这件事必须互斥的执行。这就保证了即使一个哲学家在拿筷子拿到一半时被阻塞,也不会有别的哲学家会继续尝试拿筷子。这样的话,当前正在吃饭的哲学家放下筷子后,被阻塞的哲学家就可以获得等待的筷子了。
哲学家进餐问题的关键在于解决进程死锁。
- 这些进程之间只存在互斥关系,但是与之前接触到的互斥关系不同的是,每个进程都需要同时持有两个临界资源,因此就有“死锁”问题的隐患。
多个临界资源的获取需要原子性,这是一个思路,但是总共有三种思路,另外两种可以学习
如果在考试中遇到了
一个进程需要同时持有多个临界资源的情况
,应该参考哲学家问题
的思想,分析题中给出的进程之间是否会发生循环等待,是否会发生死锁。可以参考哲学家就餐问题解决死锁的三种思路。
2.3.8 管程
(1) 为什么要引入管程
信号量机制存在的问题:编写程序困难、易出错
看下面情况
producer () {
while(1) {
生成一个产品;
P(mutex);
P(empty);
把产品放入缓冲区;
V(mutex);
V(full);
}
}
consumter () {
while(1) {
P(mutex);
P(full);
把产品放入缓冲区;
V(mutex);
V(empty);
使用产品;
}
}
- 这样互斥的P操作在同步的P操作之前,会出现死锁问题
- 像这样的问题还有很多
能不能设计一种机制,让程序员写程序时不需要再关注复杂的PV操作,让写代码更轻松呢
?
这里体现出了编程的思想,就是尽可能多地将业务以外的代码封装起来,让程序员将精力投入到业务当中去,既节省了代码量(不用写一个业务却要写很多无用的代码),也可以提高开发效率,可维护性等
1973年,Brinch Hansen首次在程序设计语言(Pascal)中引入了“管程”成分——一种高级同步机制
(2) 管程的定义和基本特征
管程是一种特殊的软件模块,有这些部分组成:
- 局部于管程的
共享数据结构说明
; - 对该数据结构进行操作的一组过程;
- 对局部于管程的共享数据设置初始值的语句
- 管程有一个名字。
这里可以体现出面向对象的思想,管程就可以理解为一个class
管程的基本特征
:
- 局部于管程的数据只能被局部于管程的过程所访问;
- 一个进程只有通过调用管程内的过程才能进入管程访问共享数据;
每次仅允许一个进程在管程内执行某个内部过程
。
(3) 拓展一:管程解解生产者消费者问题
管程设计如下
monitor ProducerConsumer
// 管程内部设置条件变全和等待/唤醒操作,以解决同步问题
condition full, empty; // 条件变量用来实现同步(排队)
int count = 0; // 缓冲区中的产品数
void insert (Item item) { // 把产品item放入缓冲区
if (count == N)
wait(full);
count++;
insert_item(item);
if (count == 1)
signal(empty); // 唤醒等待在empty队列中的变量
}
Item remove() { // 从缓冲区中取出一个产品
if (count == 0)
wait(empty);
count--;
if (count == N-1)
signal(full);
return remove_item();
}
end monitor;
由编译器负责实现各进程互斥地进入管程中的过程
使用如下
// 生产者进程
producer() {
while(1) {
item = 生产一个产品;
ProdecerConsumer.insert(item);
}
}
// 消费者进程
consumer() {
while(1) {
item = ProdecerConsumer.remove();
消费产品item;
}
}
这样程序员仅仅调用函数就行,关于同步互斥问题在函数里面处理好了
小结
引入管程的目的
无非就是要更方便地实现进程互斥和同步
。
- 需要在管程中定义共享数据(如生产者消费者问题的缓冲区)
- 需要在管程中定义用于访问这些共享数据的“入口”——其实就是一些函数(如生产者消费者问题中,可以定义一个函数用于将产品放入缓冲区,再定义一个函数用于从缓冲区取出产品)
- 只有通过这些特定的“入口”才能访问共享数据
- 管程中有很多“入口”,但是每次只能开放其中一个“入口”,并且只能让一个进程或线程进入(如生产者消费者问题中,各进程需要互斥地访问共享缓冲区。管程的这种特性即可保证一个时间段内最多只会有一个进程在访问缓冲区。注意:这种互斥特性是由编译器负责实现的,程序员不用关心)
- 可在管程中设置条件变量及等待/唤醒操作以解决同步问题。可以让一个进程或线程在条件变量上等待(此时,该进程应先释放管程的使用权,也就是让出“入口”)﹔可以通过唤醒操作将等待在条件变量上的进程或线程唤醒。
- 程序员可以用某种特殊的语法定义一个管程(比如: monitor ProducerConsumer. .....end monitor;) ,之后其他程序员就可以使用这个管程提供的特定“入口”很方便地使用实现进程同步/互斥了。
入口
体现了封装的思想
(4) Java中类似于管程的机制
Java中,如果用关键字synchronized
来描述一个函数,那么这个函数同一时间段内只能被一个线程调用
static class monitor {
private Item buffer[] = new Item[N];
private int count = 0;
// synchronized:每次只能有一个线程进入insert函数,如果多个线程同时调用insert函数,则后来者需要排队等待
public synchronized void insert(Item item) {
......
}
}
synchronized关键字说明的函数,就是在编译器中已经完成了同步互斥的功能
知识回顾与重要考点
2.4 死锁
2.4.1 死锁的概念
(1) 什么是死锁
哲学家进餐问题中,如果5位哲学家进程并发执行,都拿起了左手边的筷子...
每位哲学家都在等待自己右边的人放下筷子,这些哲学家进程都因等待筷子资源而被阻塞。即发生“死锁”
有一首歌的歌词:我爱你,你爱他,他爱她,她爱我....这世界每个人都爱别人.我们从资源占有的角度来分析,这段关系为什么看起来那么纠结...
每个人都占有一个资源,同时又在等待另一个人手里的资源。发生“死锁”
在并发环境
下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象
,就是“死锁
”。
发生死锁后若无外力干涉,这些进程都将无法向前推进。
(2) 死锁、饥饿、死循环
- 死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
- 饥饿:由于
长期得不到想要的资源,某进程无法向前推进的现象
。比如:在短进程优先(SPF算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程“饥饿”) - 死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑bug导致的,有时是程序员故意设计的。
死循环是程序员的问题,不是操作系统的问题
共同点:都是进程无法顺利向前推进的现象(故意设计的死循环除外)
类型 | 区别 |
---|---|
死锁 | 死锁一定是“循环等待对方手里的资源 ”导致的,因此如果有死锁现象,那至少有两个或两个以上的进程同时发生死锁 。另外,发生死锁的进程一定处于阻塞态 。 |
饥饿 | 可能只有一个进程发生饥饿 。发生饥饿的进程既可能是阻塞态 (如长期得不到需要的I/O设备),也可能是就绪态 (长期得不到处理机) |
死循环 | 可能只有一个进程发生死循环。死循环的进程可以上处理机运行(可以是运行态),只不过无法像期待的那样顺利推进。 死锁和饥饿问题是由于操作系统分配资源的策略不合理导致的,而死循环是由代码逻辑的错误导致的。 死锁和饥饿是管理者(操作系统)的问题,死循环是被管理者的问题。 |
2.4.2 死锁的产生
(1) 死锁产生的必要条件
产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生
。
条件 | 说明 |
---|---|
互斥条件 | 只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。 |
不剥夺条件 | 进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。 |
请求和保持条件 | 进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。 |
循环等待条件 | 存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。 |
注意:发生死锁时一定有循环等待
,但是发生循环等待时未必死锁
(循环等待是死锁的必要不充分条件)
比如3号哲学家在参与循环的过程中还在请求循环以外的资源,如果请求到就能继续正常进行下去
- 如果同类资源数大于1,则即使有循环等待,也未必发生死锁。
但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件了
。
(2) 什么时候发生死锁
- 对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
- 进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
- 信号量的使用不当也会造成死锁。如生产者-消费者问题中,如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)
总之,对不可剥夺资源的不合理分配,可能导致死锁。
2.4.3 死锁的处理策略
- 预防死锁。破坏死锁产生的四个必要条件中的一个或几个。
- 避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
- 死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
(1) 静态策略:预防死锁
知识回顾:死锁的产生必须满足四个必要条件,只要其中一个或者几个条件不满足,死锁就不会发生。
① 破坏互斥条件
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁。
- 如果把
只能互斥使用的资源改造为允许共享使用
,则系统不会进入死锁状态。 - 比如:
SPOOLing
技术。操作系统可以采用SPooLing 技术把独占设备在逻辑上改造成共享设备
。 - 比如,用SPOoLing技术将打印机改造为共享设备...
传统方式 | SPOOLing技术(图1) | SPOOLing技术(图2) |
---|---|---|
使用了SPOOLing技术后,在各进程看来,自己对打印机资源的使用请求立即就被接收处理了,不需要再阻塞等待
缺点
:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
所以破坏互斥策略使用范围并不广
② 破坏不剥夺条件
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
破坏不剥夺条件:
- 方案一:当某个进程
请求新的资源得不到满足
时,它必须立即释放保持的所有资源
,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。 - 方案二:当
某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺
。这种方式一般需要考虑各进程的优先级
(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
该策略的缺点
:
- 实现起来比较复杂。
- 释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般
只适用于易保存和恢复状态的资源
,如CPU。 - 反复地申请和释放资源会增加系统开销,降低系统吞吐量。
- 若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
③ 破坏请求和保持条件
- 请求和保持条件:进程已经
保持了至少一个资源
,但又提出了新的资源请求
,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。 - 可以采用
静态分配方法
,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行
。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了。
该策略实现起来简单
,但也有明显的缺点
:
- 有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。
- 另外,该策略也有可能导致某些进程饥饿。
如图,如果A类进程和B类进程源源不断地进来那么C类进程就会一直无法同时获得资源1和资源2,这样就会导致C类资源饥饿
我的想法是:要保证先来先得,就是C类先来了就先让C类获得资源1,然后等待资源2但是这样又回到了请求和保持条件,不会饥饿,但是会死锁
④ 破坏循环等待条件
循环等待条件
:存在一种进程资源的循环等待链
,链中的每一个进程已获得的资源同时被下一个进程所请求。
- 可采用
顺序资源分配法
:首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源
,同类资源(即编号相同的资源)一次申请完。 - 原理分析:一个进程
只有已占有小编号的资源时,才有资格申请更大编号的资源
。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。 - 假设系统中共有10个资源,编号为1,2,.......10
比如P3占有7号的资源,那么就不会往回申请6号资源,就不会出现循环,同时P3占有7号资源,那么8-10号的资源只有P3有资格申请。资源形成一个邮箱的队列
该策略的缺点
:
- 不方便增加新的设备,因为可能需要重新分配所有的编号;
- 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;
- 必须按规定次序申请资源,用户编程麻烦。
知识回顾与考试重点
这个多在选择题中考察,不用死记硬背,理解即可但是每种的解决方法还是得知道的
(2) 动态策略:避免死锁
① 什么是安全序列
你是一位成功的银行家,手里掌握着100个亿的资金..
有三个企业想找你贷款,分别是企业B、企业A、企业T,为描述方便,简称BAT。
- B表示:“大哥,我最多会跟你借70亿..”
- A表示:“大哥,我最多会跟你借40亿...”
- T表示:“大哥,我最多会跟你借50亿..”
然而...江湖中有个不成文的规矩:如果你借给企业的钱总数达不到企业提出的最大要求,那么不管你之前给企业借了多少钱,那些钱都拿不回来了
...(反之,如果达到了最大要求,可以认为这些钱都能拿回来)
刚开始,BAT三个企业分别从你这儿借了20、10、30亿 ...
最大需求 | 已借走 | 最多还会借 | |
---|---|---|---|
B | 70 | 20 | 50 |
A | 40 | 10 | 30 |
T | 50 | 30 | 20 |
现在手里还剩40亿,此时的问题就是,剩下该给谁先借款
(只有全部借出去了才会收到还款,从而再次借出)
假设:
此时...B还想借30亿,你敢借吗?假如答应了B的请求...
最大需求 | 已借走 | 最多还会借 | |
---|---|---|---|
B | 70 | 20 + 30 = 50 | 50 - 30 = 20 |
A | 40 | 10 | 30 |
T | 50 | 30 | 20 |
手里还剩10亿,只剩下10亿,如果BAT都提出再借20亿的请求,那么任何一个企业的需求都得不到满足
经过检查,借给B30亿是不靠谱的
此时...A还想借20亿,你敢借吗?假如答应了A的请求.......
最大需求 | 已借走 | 最多还会借 | |
---|---|---|---|
B | 70 | 20 | 50 |
A | 40 | 10 + 20 = 30 | 30 - 20 = 10 |
T | 50 | 30 | 20 |
手里还有:20亿
- 可以先把20亿全部借给T,等T把钱全部还回来了,手里就会有20+30=50亿,再把这些钱全借给B,B还钱后总共有50+20=70亿,最后再借给A
- 或者,先借给A10亿,等A还钱了手里就有20+30=50亿,再给T20亿,等T还钱了就有50+30=80亿,最后再给B借..
经过三百六十度无死角检查,给A借20亿是安全的:因为按照T→B→A,A→T→B的顺序给他们借钱是可行的...
② 安全序列、不安全状态和死锁的联系
最大需求 | 已借走 | 最多还会借 | |
---|---|---|---|
B | 70 | 20 + 30 = 50 | 50 - 30 = 20 |
A | 40 | 10 | 30 |
T | 50 | 30 | 20 |
给B借30亿是不安全的...之后手里只剩10亿,如果BAT都提出再借20亿的请求,那么任何一个企业的需求都得不到满足...
最大需求 | 已借走 | 最多还会借 | |
---|---|---|---|
B | 70 | 20 | 50 |
A | 40 | 10 + 20 = 30 | 30 - 20 = 10 |
T | 50 | 30 | 20 |
给A借20亿是安全的,因为存在
T→B→A这样的安全序列。
- 所谓
安全序列
,就是指如果系统按照这种序列分配资源
,则每个进程都能顺利完成
。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个。 - 如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了
不安全状态
。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态.不讨我们在分配咨源之前总是要老虑到最坏的情况
安全序列是操作的
序列
,不安全状态是一种状态
- 如果系统处于安全状态,就一定不会发生死锁。
- 如果系统进入不安全状态,就
可能
发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态
)
进入不安全状态不一定死锁(比如不安全状态下,没有人找你借钱,那么就不会死锁),但是如果进入了死锁,那么一定不安全状态
因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态
,以此决定是否答应资源分配请求。这也是“银行家算法
”的核心思想。
- 所谓动态,就是在分配资源之前动态地判断
进程运行的资源实际上就相当于这里的钱,一个进程只有充分得到资源,才能运行完,才能归还资源。当然也可以提前全部归还
,但是可能之前做的事情都成了无用功,而且这只是理想情况,设置方案的时候要考虑最坏的情况
③ 银行家算法
- 银行家算法是荷兰学者Dijikstra为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。
后来该算法被用在操作系统中,用于避免死锁。
- 核心思想:在
进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态
。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待
。
- 思考:BAT的例子中,只有一种类型的资源——钱,但是在计算机系统中会有多种多样的资源,应该怎么
把算法拓展为多种资源的情况呢
? - 可以
把单维的数字拓展为多维的向量
。比如:系统中有5个进程P0~P4,3种资源R0~R2,初始数量为(10,5,7),则某一时刻的情况可表示如下:
这个思维可以学习,将数字变成向量
进程 | 最大需求 | 已分配 | 最多还需要 |
---|---|---|---|
P0 | (7,5,3) | (0,1,0) | (7,4,3) |
P1 | (3,2,2) | (2,0,0) | (1,2,2) |
P2 | (9,0,2) | (3,0,2) | (6,0,0) |
P3 | (2,2,2) | (2,1,1) | (0,1,1) |
P4 | (4,3,3) | (0,0,2) | (4,3,1) |
此时总共已分配(7,2,5),还剩余(3,3,2)可把最大需求、已分配的数据看作矩阵,两矩阵相减,就可算出各进程最多还需要多少资源了
此时系统是否处于安全状态?
思路:尝试找出一个安全序列——依次检查剩余可用资源(3,3,2)是否能满足各进程的需求
可满足P1需求,将P1加入安全序列,并更新剩余可用资源值为(5,3,2)
依次检查剩余可用资源(5,3,2)是否能满足剩余进程(不包括已加入安全序列的进程)的需求
可满足P3需求,将P3加入安全序列,并更新剩余可用资源值为(7,4,3)
依次检查剩余可用资源(7,4,3)是否能满足剩余进程(不包括已加入安全序列的进程)的需求.....……
以此类推,共五次循环检查即可将5个进程都加入安全序列中,最终可得一个安全序列。
该算法称为安全性算法
。可以很方便地用代码实现以上流程,每一轮检查都从编号较小的进程开始检查。
实际做题时可以更快速的得到安全序列
。
- 经对比发现,(3,3,2)可满足P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的,因此P1、P3一定可以顺利的执行完,并归还资源。可把P1、P3先加入安全序列。
- (2,0, 0)+(2,1,1)+(3,3,2)= (7,4,3)
- 剩下的P0、P2、P4都可被满足。同理,这些进程都可以加入安全序列。
- 于是,5个进程全部加入安全序列,说明此时系统处于安全状态,暂不可能发生死锁。
再看一个找不到安全序列的例子:
- 经对比发现,(3,3,2)可满足P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的,因此P1、P3一定可以顺利的执行完,并归还资源。可把P1、P3先加入安全序列。
- (2,0,0)+(2,1,1)+(3,3,2)= (7,4,3)
- 剩下的P0需要(8,4,3),P2需要(6,5,0),P4需要(4,3,4)任何一个进程都不能被完全满足
- 于是,无法找到任何一个安全序列,说明此时系统处于不安全状态,有可能发生死锁。
银行家算法(这是一种计算机实现的算法)
假设系统中有n个进程,m种资源
- 每个进程
在运行前先声明对各种资源的最大需求数
,则可用一个n*m
的矩阵(可用二维数组实现)表示所有进程对各种资源的最大需求数。 - 不妨称为
最大需求矩阵Max
,Max[i, j]=K表示进程Pi最多需要K个资源Rj
。 - 同理,系统可以用一个
n*m
的分配矩阵Allocation表示对所有进程的资源分配情况。 - Max - Allocation =Need矩阵,表示各进程最多还需要多少各类资源。
- 另外,还要用一个
长度为m的一维数组Available表示当前系统中还有多少可用资源
。 - 某进程Pi向系统申请资源,可用一个长度为m的一维数组 Requesti表示本次申请的各种资源量。
可用银行家算法预判本次分配是否会导致系统进入不安全状态:
- ①如果Requesti[j] ≤ Need[i, j] (0≤j≤m) 便转向②;否则认为出错(因为它所需要的资源数己超过它所宣布的最大值。)
- ②如果Requesti[j] < Available[i] (0<j<m),便转向③;否则表示尚无足够资源,Pi必须等待。
- ③系统试探着把资源分配给进程Pi,并修改相应的数据(
并非真的分配,修改数值只是为了做预判
):- Available = Available - Requesti;
- Allocation[i, j] = Allocation[i, j] + Requesti[j];
- ④操作系统执行安全性算法,检查此次资源分配后,系统是否处于安全状态。若安全,才正式分配;否则,恢复相应数据,让进程阻塞等待。
知识回顾与重要考点
数据结构
:
- 长度为m的一维数组Available表示还有多少可用资源
- n*m矩阵Max表示各进程对资源的最大需求数
- n*m矩阵Allocation表示已经给各进程分配了多少资源
- Max - Allocation = Need矩阵表示各进程最多还需要多少资源
- 用长度为m的一位数组Request表示进程此次申请的各种资源数
银行家算法步骤
:
- ①检查此次申请是否超过了之前声明的最大需求数
- ②检查此时系统剩余的可用资源是否还能满足这次请求
- ③试探着分配,更改各数据结构
- ④用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法步骤
:
- 检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。
- 不断重复上述过程,看最终是否能让所有进程都加入安全序列。
系统处于不安全状态未必死锁,但死锁时一定处于不安全状态。系统处于安全状态一定不会死锁。
(3) 死锁的检测和解除
这个策略允许死锁发生,但是要求发生后能够检测出来并解除
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
- ①死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁。
- ②死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
① 死锁的检测
为了能对系统是否已发生了死锁进行检测,必须:
- ①用
某种数据结构
来保存资源的请求和分配信息
; - ②提供
一种算法
,利用上述信息来检测系统是否已进入死锁状态
。
所以接下来就是分别讲数据结构和算法了
数据结构
这就是一种图结构,然后图的边和指向表示不同含义节点是有类型的
-
如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去。
-
如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源的进程被激活,并顺利地执行下去。
-
相应的,这些被激活的进程执行完了之后又会归还一些资源,这样可能又会激活另外一些阻塞的进程..
| | |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| | | -
如果按上述过程分析,
最终能消除所有边
,就称这个图是可完全简化的
。此时一定没有发生死锁(相当于能找到一个安全序列)
- 如果
最终不能消除所有边,那么此时就是发生了死锁
- 最终还连着边的那些进程就是处于死锁状态的进程。
可以考虑一下出现了死锁发生的必要条件的哪几个
检测死锁的算法
:
-
在资源分配图中,找出
既不阻塞又不是孤点
的进程Pi(即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。如下图中,R1没有空闲资源,R2有一个空闲资源。若所有的连接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。
消去它所有的请求边和分配变,使之称为孤立的结点。在下图中,P1是满足这一条件的进程结点,于是将P1的所有边消去。
| | |
| ------------------------------------------------------------ | ------------------------------------------------------------ | -
进程Pi所释放的资源,可以
唤醒某些因等待这些资源而阻塞的进程
,原来的阻塞进程可能变为非阻塞进程
。在下图中,P2就满足这样的条件。根据1中的方法进行一系列简化后,若能消去途中所有的边,则称该图是可完全简化的。
| | |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁
② 死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁。
补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
解除死锁的主要方法有:
方法 | 说明 |
---|---|
资源剥夺法 | 挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。 |
撤销进程法(或称终止进程法) | 强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。 这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,己经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。 |
进程回退法 | 让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。(不太容易实现) |
如何决定对谁动手?
- 进程优先级(对进程优先级低的下手)
- 已执行多长时间(执行时间越长,则撤销或者回退的代价更大,所以对执行时间短的下手)
- 还要多久能完成(让快完成的优先获得资源)
- 进程己经使用了多少资源(如果进程拥有的资源很多,那么剥夺这个进程的资源能够很快地让死锁接触)
- 进程是交互式的还是批处理式的(处理交互式地对用户的体验很差,而批处理式就是数据计算,对用户的体验不大)
复习的时候听一下考点