二、操作系统之进程与线程管理
一、进程与线程
1.1 进程概念与特征
1.1.1 进程的概念
程序:就是一个指令序列(早起的计算机只支持单道程序)。引入多道程序技术之后,为了方便操作系统的管理,完成各程序的并发执行,引入了进程、进程实体的概念。
程序段、数据段、PCB(Process Control Block)三部分组成了进程实体(进程映象)。一般情况下,我们把进程实体就简称为进程,例如,所谓的创建进程,实质是创建进程实体中的PCB;而销毁进程,实质上就是撤销进程实体中的PCB。(PCB是进程存在的唯一标志)
引入进程实体的概念后,可把进程定义为
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
注:严格来讲,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。
区别进程和程序
动与静:进程是动态的,程序是静态的,;程序是有序代码的集合,进程是程序的执行。
永久与暂时:进程是暂时的程序是长久的 ;进程是一个状态变化的过程,程序可以长久保存。
结构:进程的组成包括程序、数据和进程控制块(进程各种控制信息)。
进程与程序的对应关系:都可1对n,通过多次执行,一个程序可以对应多个进程;都可调用关系,一个进程可包括多个程序。
1.1.2 进程的组成
1.1.3 进程的组织
在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来
注:进程的组成讨论的是一个进程内部由那些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题
进程的组织—链接方式
进程的组织–索引方式
1.1.4 进程的特征
1、动态性(动态性是进程最基本的特征):进程是程序的一层执行过程,是动态地产、变化和消亡的
2、并发性:多个进程实体同时存在于内存中,在一段时间内同时并发执行。有PCB的进程才能并发
3、独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位(进程是资源分配、接受调度的基本单位)
4、异步性:各进程按各自独立的、不可预知的速度向前推进,操作系统要提供"进程的同步机制"来解决异步问题(异步性会导致并发程序执行结果的不确定性。具体会在进程同步相关小节中进行学习)
5、结构性:每个进程都会配置一个PCB。结构上看,进程由进程段、数据段、PCB组成(PCB包含进程的管理者(操作系统)对当前进程进行管理所需的各种信息)
1.2 进程的状态与转换
进程是程序的一次执行。在这个执行过程中,有时进程正在被CPU处理,有时又需要等待CPU服务,可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。
1.2.1 进程的三种基本特性
就绪状态:进程获得除CPU之外的所有必须资源,一旦得到CPU控制权,可立即执行
运行状态:进程已获得所有运行必需的资源,正在处理机上执行
阻塞状态:正在执行的进程由于发生某事件(请求I/O、申请缓冲、时间片到)而暂时无法执行时,便放弃CPU后暂停
1.2.2 进程的另外两种状态:
创建态(新建态):进程正在被创建,操作系统为进程分配资源,初始化PCB
终止态(结束态):进程正在从系统中撤销,操作系统会回收进程所拥有的资源,撤销PCB
1.2.3 总结
1.3 进程控制
1.3.1 什么是进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建进程、撤销已有进程、实现进程状态转换等功能(简单理解:进程控制就是要实现进程状态的转换)。
1.3.2 如何实现进程控制
用原语实现进程控制。原语的特点是执行期间不允许中断,只能一-气呵成。这种不可被中断的操作即原子操作。
原语采用“关中断指令”和“开中断指令”实现
显然,关/开中断指令的权限非常大,必然是只允许在核心态下执行的特权指令
1.3.3 进程控制相关的原语
进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:
- 更新PCB中的信息(如修改进程状态的标志,将运行环境保存到PCB,从PCB中恢复运行环境)
- 所有的进程控制原语一定会修改进程状态标志
- 剥夺当前运行进程的CPU使用权必然需要保存其运行环境
- 某进程开始运行前必然要恢复期运行环境
- 将PCB插入合适的队列
- 分配/回收资源
1.3.4 总结
1.4 进程通信
1.4.1 什么是进程通信
进程通信是指进程之间的信息交换。
进程是分配系统资源的单位(包括内存地址空间),因此各个进程拥有内存地址空间相互独立。
1.4.2 进程间通信方式(4种)
为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法:
共享内存:非亲缘关系,对共享空间的访问必须是互斥的
管道通信:亲缘关系
消息队列:亲缘关系
信号量:开销小
套接字:稳定
- 共享存储通信
- 管道通信
- 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
- 各进程要互斥地访问管道。
- 数据以字符流的形式写入管道,当管道写满时,写进程的 write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
- 如果没写满,就不允许读。如果没读空,就不允许写。
- 数据一旦被读岀,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况
- 消息传递通信
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
1.4.3 总结
1.5 线程概念与多线程模型
1.5.1 什么是线程
线程是一个基本的CPU执行单元,也是程序执行流的最小单位。
引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内可以并发处理各种任务,
引入线程之后,进程只作为除CPU之外的系统资源的分配单元。而线程则作为处理机的分配单元。
1.5.2 引入线程机制后,有什么变化
1.5.3 线程的属性
1.5.4 线程的实现方式
用户级线程(User-Level Thread, ULT):
用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)
用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)
可以这样理解,“用户级线程” 就是“从用户视角看能看到的线程”
内核级线程( Kernel-Level Thread, KLT, 又称“内核支持的线程”):
内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
可以这样理解,“内核级线程” 就是“从操作系统内核视角看能看到的线程”
1.5.5 多线程模型
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。
1.5.6 总结
二、处理机调度
2.1 处理机调度的概念、层次
2.1.1 调度的基本概念
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理,这就需确定某种规划来决定处理这些任务的顺序,这就是"调度"研究的问题
在多道程序系统中,进程的数量往往是多余处理机的个数的,这样不可能同时冰箱处理各个进程。
处理机调度,就是从就绪队列中按照一定的算法选择一个进程并将处理机分配给他运行,以实现进程的并发执行
2.1.2 调度的三个层次
由于内存空间有限,有时无法将用户提交的作业全部放入内存,因此就需要确定某种规则来决定将作业调入内存的顺序。
高级调度(作业调度)。按一定的原则从外存上处于后备队列的作业中挑选-一个(或多个)作业,给他们分配内存等必要资源,并建立相应的进程(建立PCB),以使它(们)获得竞争处理机的权利。
高级调度是辅存(外存)与内存之间的调度。每个作业只调入一次,调出一-次。作业调入时会建立相应的PCB,作业调出时才撤销PCB。高级调度主要是指调入的问题,因为只有调入的时机需要操作系统来确定,但调出的时机必然是作业运行结束才调出。
引入了虚拟存储技术之后,可将暂时不能运行的进程调至外存等待。等它重新具备了运行条件且内存又稍有空闲时,再重新调入内存。
这么做的目的是为了提高内存利用率和系统吞吐量。
暂时调到外存等待的进程状态为挂起状态。值得注意的是,PCB并不会一起调到外存,而是会常驻内存。PCB中会记录进程数据在外存中的存放位置,进程状态等信息,操作系统通过内存中的PCB来保持对各个进程的监控、管理。被挂起的进程PCB会被放到的挂起队列中。
中级调度(内存调度),就是要决定将哪个处于挂起状态的进程重新调入内存。
.一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高。
低级调度(进程调度),其主要任务是按照某种方法和策略从就绪队列中选取-一个进程,将处理机分配给它。
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。
进程调度的频率很高,-般几十毫秒一次。
2.1.3 总结
2.2 进程调度
2.2.1 进程调度的时机
2.2.2 进程调度的方式
2.2.3 进程的切换过程
“狭义的进程调度”与“进程切换”的区别:
狭义的进程调度指的是从就绪队列中选中-个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:
- 对原来运行进程各种数据的保存.
- 对新的进程各种数据的恢复
(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息- -般保存在进程控制块)
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。
2.2.4 总结
2.3 调度算法的评价指标
2.3.1 CPU利用率
cpu利用率 = 忙碌时间/总时间
2.3.2 系统吞吐量
系统吞吐量 = 总共完成了多少道作业/总共花费了多长时间
2.3.3 周转时间
-
周转时间、平均周转时间
周转时间:作业完成时间-作业提交时间
平均周转时间:各作业周转时间之和/作业数
-
带权周转时间、平均带权周转时间
带权周转时间:作业周转时间/作业实际运行时间
平均带权周转时间:各作业带权周转时间之和/作业数
2.3.4 等待时间
2.3.5 响应时间
2.3.6 总结
2.4 调度算法一
2.4.1 先来先服务(FCFS)
2.4.2 短作业优先(SJF)
注意几个小细节:
-
如果题目中未特别说明,所提到的“短作业/进程优先算法”默认是非抢占式的
-
很多书上都会说“SJF 调度算法的平均等待时间、平均周转时间最少”
严格来说,这个表述是错误的,不严谨的。之前的例子表明,最短剩余时间优先算法得到的平均等待时间、平均周转时间还要更少
应该加上一个条件“在所有进程同时可运行时,采用SJF调度算法的平均等待时间、平均周转时间最少”;
或者说“在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少”;如果不加_上述前提条件,则应该说“抢占式的短作业/进程优先调度算法(最短剩余时间优先, SRNT算法)的平均等待时间、平均周转时间最少”
-
虽然严格来说,SJF的平均等待时间、平均周转时间并不一-定最少,但相比于其他算法(如FCFS) ,SJF依然可以获得较少的平均等待时间、平均周转时间
-
如果选择题中遇到“SJF算法的平均等待时间、平均周转时间最少”的选项,那最好判断其他选项是不是有很明显的错误,如果没有更合适的选项,那也应该选择该选项
2.4.3 高响应比优先(HRRN)
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用高响应比优先调度算法,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。
2.4.4 总结
注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色。而适合用于交互式系统的调度算法将在下个小节介绍…
提示:一定要动手做课后习题!这些算法特性容易考小题,算法的使用常结合调度算法的评价指标在大题中考察。
2.4 调度算法二
2.4.1 时间片轮转(RR)
2.5.2 优先级调度算法
2.5.3 多级反馈队列调度算法
2.5.4 总结
三、进程的同步与互斥
3.1 什么是进程的同步与互斥
3.1.1 什么是进程同步
3.1.2 什么是进程互斥
3.1.3 总结
3.2 进程互斥的软件实现办法
3.2.1 单标志法
turn表示当前允许进入临界区的进程号,而只有当前允许进入临界区的进程在访问了临界区之后,才会修改turn的值。也就是说,对于临界区的访问,- -定是按P0→P1→P0→P1 …这样轮流访问。这种必须“轮流访问”带来的问题是,如果此时允许进入临界区的进程是PO,而PO一直不访问临界区,那么虽然此时临界区空闲,但是并不允许P1访问。
因此,单标志法存在的主要问题是:违背“空闲让进”原则。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AmspBcZx-1574659716668)(操作系统—进程管理.assets/image-20190520062023491.png)]
3.2.2 双标志先检查法
算法思想:设置一个布尔型数组flag[], 数组中各个元素用来标记各进程想进入临界区的意愿,比如“flag[0] =ture”意味着0号进程PO现在想要进入临界区。每个进程在进入临界区之前先检查当前有没有别的进程想进入临界区,如果没有,则把自身对应的标志flag[i]设为true,之后开始访问临界区。
若按照①⑤②⑥③⑦…的顺序执行,PO 和P1将会同时访问临界区。
因此,双标志先检查法的主要问题是:违反“忙则等待”原则。
原因在于,进入区的“检查”和“上锁”两个处理不是一气呵成的。“检查” 后,“上锁”前可能发生进程切换。
3.2.3 双标志后检查法
算法思想:双标志先检查法的改版。前-一个算法的问题是先“检查”后“上锁”,但是这两个操作又无法一气呵成,因此导致了两个进程同时进入临界区的问题。因此,人们又想到先“上锁"后“检查"的方法,来避免.上述问题。
若按照①⑤②⑥…的顺序执行,PO和P1将都无法进入临界区
因此,双标志后检查法虽然解决了“忙则等待”的问题,但是又违背了“空闲让进”和“有限等待”原则,会因各进程都长期无法访问临界资源而产生“饥饿”现象。
两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。
3.2.4 Peterson算法
算法思想:双标志后检查法中,两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。Gary L. Peterson想到了一种方法,如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”,主动让对方先使用临界区。
3.2.5 总结
3.3 进程互斥的硬件实现办法
3.3.1 中断屏蔽方法
利用“开/关中断指令”实现(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)
优点:简单、高效
缺点:不适用于多处理机;只适用于操作系统内核进程,不适用于用户进程(因为开/关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)
3.3.2 TestAndSet指令
简称TS指令,也有地方称为TestAndSetLock 指令,或TSL指令
TSL指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。以下是用C语言描述的逻辑
若刚开始lock 是false,则TSL返回的old值为false,while 循环条件不满足,直接跳过循环,进入临界区。若刚开始lock是true,则执行TLS后old返回的值为true,while 循环条件满足,会一直循环,直到当前访问临界区的进程在退出区进行“解锁”
相比软件实现方法,TSL 指令把“上锁”和“检查”操作用硬件的方式变成了一气呵成的原子操作。优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境
缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
3.3.3 Swap指令
有的地方也叫Exchange 指令,或简称XCHG指令。
Swap指令是用硬件实现的,执行的过程不允许被中断,只能- - 气呵成。以下是用C语言描述的逻辑
逻辑_上来看Swap和TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在old 变量上),再将上锁标记lock设置为true,最后检查old,如果old为false则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。
优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等”。
3.3.4 总结
3.4 信号量机制
3.4.1 什么是
用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。
信号量其实就是一一个变量(可以是- 一个整数,也可以是更复杂的记录型变量),可以用一一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置-一个初值为1的信号量。
原语是一种特殊的程序段,其执行只能- 气呵成,不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,使这些操作能“一气呵成”就能避免问题。
一对原语: wait(S) 原语和signal(S) 原语,可以把原语理解为我们自己写的函数,函数名分别为wait和signal,括号里的信号量S其实就是函数调用时传入的一个参数。
wait、signal 原语常简称为P、V操作(来自荷兰语proberen 和verhogen)。因此,做题的时候常把wait(S)、signal(S) 两个操作分别写为P(S)、V(S)
3.4.2 分类
3.4.3 总结
3.5 用信号量机制实现进程的同步、互斥和前驱关系
3.5.1 信号量机制实现互斥
3.5.2 信号量机制实现同步
3.5.3 信号量机制实现前驱关系
3.5.4 总结
3.6 生产者-消费者 问题
3.6.1 问题描述
系统中有- -组生产者进程和一组消费者进程,生产者进程每次生产-一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注: 这里的“产品”理解为某种数据)
生产者、消费者共享-个初始为空、大小为n的缓冲区。
只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。
只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。
缓冲区是临界资源,各进程必须互斥地访问。
3.6.2 问题分析
3.6.3 实现
3.6.4 思考:能否改变相邻P、V操作的顺序?
若此时缓冲区内已经放满产品,则empty=0, full=n。
则生产者进程执行①使mutex变为0,再执行②,由于已没有空闲缓冲区,因此生产者被阻塞。由于生产者阻塞,因此切换回消费者进程。消费者进程执行③,由于mutex为0,即生产者还没释放对临界资源的“锁”,因此消费者也被阻塞。
这就造成了生产者等待消费者释放空闲缓冲区,而消费者又等待生产者释放临界区的情况,生产者和消费者循环等待被对方唤醒,出现“死锁”。
同样的,若缓冲区中没有产品,即full=0, empty=n。 按③④①的顺序执行就会发生死锁。因此,实现互斥的P操作一定要在实现同步的P操作之后。
V操作不会导致进程阻塞,因此两个V操作顺序可以交换。
3.6.5 总结
PV操作题目的解题思路:
1.关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
2. 整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
3. 设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。 (互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
生产者消费者问题是-一个互斥、同步的综合问题。
对于初学者来说最难的是发现题目中隐含的两对同步关系。
有时候是消费者需要等待生产者生产,有时候是生产者要等待消费者消费,这是两个不同的“一前一后问题”,因此也需要设置两个同步信号量。
3.7 多生产多消费的问题
3.7.1 问题描述
桌子上有一只盘子,每次只能向其中放入一个水果。爸爸专向盘子中放苹果,妈妈专向盘子中放橘子,儿子专等着吃盘子中的橘子,女儿专等着吃盘子中的苹果。只有盘子空时,爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时,儿子或女儿可以从盘子中取出水果。用PV操作实现上述过程。
3.7.2 问题分析
3.7.3 如何实现
父亲P(plate),可以访问盘子→母亲P(plate), 可以访问盘子>父亲在往盘子里放苹果,同时母亲也可以往盘子里放橘子。于是就出现了两个进程同时访问缓冲区的情况,有可能导致两个进程写入缓冲区的数据相互覆盖的情况。
父亲P(plate),可以访问盘子>母亲P(plate),可以访问盘子>父亲在往盘子里放苹果,同时母亲也可以往盘子里放橘子。于是就出现了两个进程同时访问缓冲区的情况,有可能导致两个进程写入缓冲区的数据相互覆盖的情况。因此,如果缓冲区大小大于1,就必须专门设置- -个互斥信号量mutex 来保证互斥访问缓冲区。
3.7.4 总结
总结:在生产者-消费者问题中,如果缓冲区大小为1,那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。当然,这不是绝对的,要具体问题具体分析。
建议:在考试中如果来不及仔细分析,可以加上互斥信号量,保证各进程一-定会互斥地访问缓冲区。但需要注意的是,实现互斥的P操作一定要在实现同步的P操作之后,否则可能引起“死锁”,
PV操作题目的解题思路:
- 关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
- 整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
- 设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。 (互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
解决“多生产者-多消费者问题”的关键在于理清复杂的同步关系。
在分析同步问题(一前一后问题)的时候不能从单个进程行为的角度来分析,要把“一前一后”发生的事看做是两种“事件”的前后关系。
比如,如果从单个进程行为的角度来考虑的话,我们会有以下结论:
如果盘子里装有苹果,那么一定要女儿取走苹果后父亲或母亲才能再放入水果
如果盘子里装有橘子,那么一定要儿子取走橘子后父亲或母亲才能再放入水果
这么看是否就意味着要设置四个同步信号量分别实现这四个“一前一后”的关系了?
正确的分析方法应该从“事件”的角度来考虑,我们可以把.上述四对“ 进程行为的前后关系”抽象为–对“事件的前后关系”
盘子变空事件->放入水果事件。“ 盘子变空事件”既可由儿子引发,也可由女儿引发;“ 放水果事件”既可能是父亲执行,也可能是母亲执行。这样的话,就可以用一个同步信号量解决问题了
3.8 吸烟者的问题
3.8.1 问题描述
假设-一个系统有三个抽烟者进程和一个供应者进程。每个抽烟者不停地卷烟并抽掉它,但是要卷起并抽掉一支烟, 抽烟者需要有三种材料:烟草、纸和胶水。三个抽烟者中,第-一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料,供应者每次将两种材料放桌子上,拥有剩"下那种材料的抽烟者卷一根烟并抽掉它,并给供应者进程-一个信号告诉完成了,供应者就会放另外两种材料再桌上,这个过程一直重复(让三个抽烟者轮流地抽烟)
3.8.2 问题分析
本质.上这题也属于“生产者-消费者”问题,更详细的说应该是“可生产多种产品的单生产者-多消费者”。
- 关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
- 整理思路。根据各进程的操作流程确定P、V操作的大致顺序
- 设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。 (互斥信号量初值- -般为1,同步信号量的初始值要看对应资源的初始值是多少)
3.8.3 如何实现
3.8.4 总结
吸烟者问题可以为我们解决“可以生产多个产品的单生产者”问题提供一个思路。
值得吸取的精华是:“ 轮流让各个吸烟者吸烟”必然需要“轮流的在桌上放上组合一、二、三”,注意体会我们是如何用-一个整型变量i实现这个“轮流”过程的。
如果题目改为“每次随机地让一个吸烟者吸烟”,我们有应该如何用代码写出这个逻辑呢?
若一个生产者要生产多种产品(或者说会引发多种前驱事件),那么各个V操作应该放在各自对应的“事件”发生之后的位置。
3.9 读者与写者的问题
3.9.1 问题描述
有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时则可能导致数据不一-致的错误。因此要求:①允许多个读者可以同时对文件执行读操作;②只允许一个写者往文件中写信息;③任- -写者在完成写操作之前不允许其他读者或写者工作;④写者执行写操作前,应让已有的读者和写者全部退出。
3.9.2 问题分析
1.关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
2.整理思路。根据各进程的操作流程确定P、V操作的大致顺序
3. 设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。 (互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)
两类进程:写进程、读进程
互斥关系:写进程一写进程、写进程一读进程。读进程与读进程不存在互斥问题。
写者进程和任何进程都互斥,设置一个互斥信号量rw,在写者访问共享文件前后分别执行P、V操作。读者进程和写者进程也要互斥,因此读者访问共享文件前后也要对rw 执行P、V操作。
如果所有读者进程在访问共享文件之前都执行P(rw) 操作,那么会导致各个读进程之间也无法同时访问文件。Key:读者写者问题的核心思想一–怎么处理该问题呢?
P(rw)和V(rw)其实就是对共享文件的“加锁"和“解锁"。既然各个读进程需要同时访问,而读进程与写进程又必须互斥访问,那么我们可以让第- -个访问文件的读进程“加锁”,让最后一个访问完文件的读进程“解锁”。可以设置-一个整数变量count 来记录当前有几个读进程在访问文件。
3.9.3 如何实现
3.9.4 总结
读者-写者问题为我们解决复杂的互斥问题提供了-个参考思路。
其核心思想在于设置了一个计数器count用来记录当前正在访问共享文件的读进程数。我们可以用count的值来判断当前进入的进程是否是第-一个/最后一个读进程,从而做出不同的处理。
另外,对count变量的检查和赋值不能一–气呵成导致了一些错误,如果需要实现“一气呵成”,自然应该想到用互斥信号量。
最后,还要认真体会我们是如何解决“写进程饥饿”问题的。
绝大多数的考研PV操作大题都可以用之前介绍的几种生产者消费者问题的思想来解决,如果遇到更复杂的问题,可以想想能否用读者写者问题的这几个思想来解决。
3.10 哲学家进餐的问题
3.10.1 问题描述
一-张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。
3.10.2 问题分析
3.10.3 如何实现
3.10.4 总结
哲学家进餐问题的关键在于解决进程死锁。
这些进程之间只存在互斥关系,但是与之前接触到的互斥关系不同的是,每个进程都需要同时持有两个临界资源,因此就有“死锁”问题的隐患。
如果在考试中遇到了一个进程需要同时持有多个临界资源的情况,应该参考哲学家问题的思想,分析题中给出的进程之间是否会发生循环等待,是否会发生死锁。
可以参考哲学家就餐问题解决死锁的三种思路。
3.11 管程
3.11.1 为什么会出现管程
3.11.2 管程定义和基本特征
管程是一.种特殊的软件模块,有这些部分组成:
- 局部于管程的共享数据结构说明;
- 对该数据结构进行操作的一组过程;
- 对局部于管程的共享数据设置初始值的语句;4.管程有一个名字。
跨考Tips:“过程”其实就是“函数”
管程的基本特征:
- 局部于管程的数据只能被局部于管程的过程所访问;
- –个进程只有通过调用管程内的过程才能进入管程访问共享数据;
- 每次仅允许一个进程在管程内执行某个内部过程。
3.11.3 拓展:管程解决生产者消费者问题
引入管程的目的无非就是要更方便地实现进程互斥和同步。
- 需要在管程中定义共享数据(如生产者消费者问题的缓冲区)
- 需要在管程中定义用于访问这些共享数据的“入口”–其实就是一-些函数( 如生产者消费者
问题中,可以定义一个函数用于将产品放入缓冲区,再定义一个函数用于从缓冲区取出产品) - 只有通过这些特定的“入口”才能访问共享数据
- 管程中有很多“入口”,但是每次只能开放其中一个“入口”,并且只能让一个进程或线程进入(如生产者消费者问题中,各进程需要互斥地访问共享缓冲区。管程的这种特性即可保证一个时间段内最多只会有一个进程在访问缓冲区。注意:这种互斥特性是由编译器负责实现的,程序员不用关心)
- 可在管程中设置条件变量及等待/唤醒操作以解决同步问题。可以让-一个进程或线程在条件变量
上等待(此时,该进程应先释放管程的使用权,也就是让出“入口”) ;可以通过唤醒操作将等待在条件变量上的进程或线程唤醒。
程序员可以用某种特殊的语法定义-一个管程(比如: monitor ProducerConsumer … end monitor;),之后其他程序员就可以使用这个管程提供的特定“入口”(封装的思想)很方便地使用实现进程同步/互斥了。
3.11.4 拓展:java中类似管程的机制
Tips:不熟悉Java的同学看不懂也没关系,不会考,仅作为思维拓展。
熟悉Java的同学在时间充裕的情况下可以动手尝试用synchronized实现生产者消费者问题的“管程”
3.11.5 总结
四、死锁
4.1 死锁的概念
4.1.1 什么是死锁
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。
饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如:在短进程优先(SPF) 算法中,若有源源不断的短进程到来,则长进程将一直 得不到处理机,从而发生长进程“饥饿”。
死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑bug 导致的,有时是程序员故意设计的。
4.1.2 为什么会产生死锁
4.1.3 死锁产生的条件
4.1.4 什么时候会发生死锁
- 对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
- 进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。例如,并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
- 信号量的使用不当也会造成死锁。如生产者消费者问题中,如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是–种抽象的系统资源)
总之,对不可剥夺资源的不合理分配,可能导致死锁。
4.1.5 死锁的处理策略
1.预防死锁。破坏死锁产生的四个必要条件中的一一个或几个。
2.避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
3.死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁。
4.1.6 总结
4.2 死锁的处理策略-预防死锁
4.2.1 总览
4.2.2 破坏死锁产生的条件
- 破坏互斥条件
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁。
如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。比如: SPOOLing技 术。操作系统可以采用SPOOLing技术把独占设备在逻辑上改造成共享设备。比如,用SPOOLing技 术将打印机改造为共享设备…
该策略的缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件。
- 破坏不剥夺条件
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。破坏不剥夺条件:
方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。
方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一-般需要考虑各进程的优先级( 比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
该策略的缺点:
1.实现起来比较复杂。
2.释放已获得的资源可能造成前–阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。
3.反复地申请和释放资源会增加系统开销,降低系统吞吐量。
4.若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。
- 破坏请求和保持条件
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求:,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放:。
可以采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。-旦投入运行后,这些资源就一直归它所有, 该进程就不会再请求别的任何资源该策略实现起来简单,但也有明显的缺点::
有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿。
- 破坏循环等待条件
循环等待条件:存在–种进程资源的循环等待链,链中的每-个进程已获得的资源同时被下一个进程所请求。
可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。
原理分析: -个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。
4.2.3 总结
4.3 死锁的处理策略-避免死锁
4.3.1 什么是安全序列
你是一位成功的银行家,手里掌握着100个亿的资金,有三个企业想找你贷款,分别是企业B、企业A、企业T,为描述方便,简称BAT。B表示:“大哥,我最多会跟你借70…”
A表示:“大哥,我最多会跟你借40亿…”
T表示: “大哥,我最多会跟你借50亿…”
然而…江湖中有个不成文的规矩:如果你借给企业的钱总数达不到企业提出的最大要求,那么不管你之前给企业借了多少钱,那些钱都拿不回来了…
刚开始,BAT三个企业分别从你这儿借了20、 10、30亿…
4.3.2 安全序列、不安全状态、死锁的联系
4.3.3 银行家算法
银行家算法是荷兰学者Djkstra 为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中,用于避免死锁。
核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待。
实际做题(手算)时可用更快速的方法找到一一个安全序列:
经对比发现,(3, 3,2)可满足P1、P3,说明无论如何,这两个进程的资源需求一.定是可以依次被满足的,因此P1、 P3一定可以顺利的执行完,并归还资源。可把P1、 P3先加入安全序列。
(2,0,0)+ (2, 1,1)+(3, 3, 2)=(7, 4, 3)
剩下的PO、P2、P4都可被满足。同理,这些进程都可以加入安全序列。
于是,5个进程全部加入安全序列,说明此时系统处于安全状态,暂不可能发生死锁。
再看一个找不到安全序列的例子:
经对比发现,(3,3,2)可满足P1、P3,说明无论如何,这两个进程的资源需求一定是可以依次被满足的,因此P1、P3一定可以顺利的执行完,并归还资源。可把P1、 P3先加入安全序列。
(2,0,0)+ (2, 1, 1)+(3, 3, 2)=(7,4, 3)
剩下的PO需要(8,4,3),P2 需要(6, 5,0),P4需要(4, 3, 4)
任何一个进程都不能被完全满足
于是,无法找到任何一个安全序列,说明此时系统处于不安全状态,有可能发生死锁。
4.3.4 总结
数据结构:
长度为m的一维数组Available表示还有多少可用资源
n * m矩阵 Max表示各进程对资源的最大需求数
n * m矩阵 Allocation 表示已经给各进程分配了多少资源
Max-Allocation=Need 矩阵表示各进程最多还需要多少资源
用长度为m的一位数组Request表示进程此次申请的各种资源数
银行家算法步骤:
①检查此次申请是否超过了之前声明的最大需求数
②检查此时系统剩余的可用资源是否还能满足这次请求
③试探着分配,更改各数据结构
④用安全性算法检查此次分配是否会导致系统进入不安全状态
安全性算法步骤:
检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。
不断重复上述过程,看最终是否能让所有进程都加入安全序列。
系统处于不安全状态未必死锁,但死锁时一定处于 不安全状态。系统处于安全状态一定 不会死锁。
4.4 死锁的处理策略-死锁的检查与解除
4.4.1 总览
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
①死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁。
②死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
4.4.2 死锁的检测与解除
为了能对系统是否已发生了死锁进行检测,必须:
①用某种数据结构来保存资源的请求和分配信息;
②提供一种算法,利用.上述信息来检测系统是否已进入死锁状态。
检测死锁的算法:
- 在资源分配图中,找出既不阻塞又不是孤点的进程Pi (即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。如下图中,R1没有空闲资源,R2有一个空闲资源。若所有的连接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配变,使之称为孤立的结点。在下图中,P1是满足这- - 条件的进程结点,于是将P1的所有边消去。
- 进程Pi所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。在下图中,P2就满足这样的条件。根据1)中的方法进行一-系列简化后,若能消去途中所有的边,则称该图是可完全简化的。
4.4.3 死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁。
补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
解除死锁的主要方法有:
- 资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿。
- 撤销进程法(或称终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏-篑,以后还得从头再来。
- 进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。
4.4.4 总结
进程控制块PCB
定义:存放进程的管理和控制信息的数据结构成为进程控制块
原语
原语是由若干指令构成的原子操作过程,作为整体是新功能,不可被打断。
原语的种类:终止原语、阻塞原语、 唤醒原语、挂起原语、激活原语
互斥与同步
互斥:在操作系统中,当一个进程进入临界区使用临界资源时,;另一个进程必须等待,直到占用临界资源的进程退出临界区,我们称进程之间的这种相互制约关系为”互斥“。
同步:多个相互合作的进程,在一些关键点上可能需要互相等待或互相交换信息,这种相互制约关系成为进程同步关系,可以理解为”有序“。
临界资源和临界区
临界资源:一次仅允许一个进程使用的资源
临界区:每个进程中访问临界资源的那段代码叫临界区。为了正确同步,对临界区的代码要增加控制
信号量及其应用
信号量:
信号量的应用:实现进程互斥、实现进程间的前趋关系(有序)
例题
线程
为什么要引入线程:
由于进程是资源的拥有者,所以在创建、撤销、切换操作中需要较大的时空开销,限制了并发程度的进一步提高。为减少进程切换的开销,把进程作为资源分配单位和调度单位这两个书香分开处理,即进程还是作为资源分配的基本单位,但是不作为调度的基本单位(很少调度或交换),把调度执行与切换的责任交给“线程”。这样做的好处是不但可以提高系统的并发度,还能适应新的对称多处理机(SMP)环境的运行,充分发挥其性能。
线程的概念:
是操作系统能够进行运算调度的最小单位。他被包含在进程之中,是进程中的实际运作单位。一条线程是进程中的一个单一顺序控制流。一个进程中可以并发多个线程,每条线程并行执行不同的任务。在某些系统中也被称为轻量进程,但轻量进程更多指内核线程,而把用户线程成为线程。线程是独立调度和分派的基本单位。
线程的种类:
内核线程KST:依赖于内核,利用系统调用由OS内核在内核空间完成创建、撤销、切换等线程工作。
用户线程ULT:无需利用系统调用,不依赖于OS核心。进程利用线程库函数创建、同步、调度和管理控制用户线程。调度由应用软件内部进行,通常采用非抢先式和更简单的规则,也无需用户态/核心态切换,速度必KST快。