操作系统学习笔记「进程调度」
调度的基本概念
调度:当有一堆任务要处理,但由于资源有限,无法同时处理。调度就是决定处理这些任务顺序的规则。
调度的三个层次:
-
高级调度(作业调度)
高级调度是外存和内存之间的调度。每个作业只调入一次,调出一次。
作业调度时会建立相应的PCB,作业调出时才撤销PCB
⚠️高级调度的时机由操作系统来决定
-
中级调度(内存调度)
为了提高内存利用率和系统吞吐量,引入虚拟存储技术,将暂时不能运行的进程调至外存等待,等它重新具备了运行条件且内存有稍有空闲时,再重新调入内存。
⚠️暂时调到外存等待的进程状态为挂起状态。但是PCB并不会一起调到外存,而是常驻内存中,用于记录进程数据在外存中的存放位置、进程状态等信息。
-
低级调度(进程调度)
工作 | 调度发生的阶段 | 发生频率 | 对进程状态的影响 | |
---|---|---|---|---|
高级调度(作业调度) | 按照规则,从后备队列中选择适合的作业将其调入内存,并为其创建进程 | 外存-->内存(面向作业) | 最低 | 无--> 创建态--> 就绪态 |
中级调度(内存调度) | 按照规则,从挂起队列中选择合适的进程将其数据调回内存 | 外存-->内存(面向进程) | 中等 | 挂起态--> 就绪态(阻塞挂起-->阻塞态) |
低级调度(进程调度) | 按照规则,从就绪队列中选择一个进程为其分配处理机 | 内存-->CPU | 最高 | 就绪态--> 允许态 |
进程的挂起态和七状态模:
graph LR 创建态 --> 就绪态 就绪态 --> 运行态 运行态 --> 终止态 运行态 --> 就绪态 创建态 --> 就绪挂起 就绪挂起 --激活--> 就绪态 就绪态 --挂起--> 就绪挂起 运行态--> 阻塞态 阻塞态 --> 就绪态 运行态 --> 就绪挂起 阻塞态 --挂起--> 阻塞挂起 阻塞挂起 --激活--> 阻塞态 阻塞挂起 --事件出现--> 就绪挂起暂时调到外存等待的进程状态称为挂起状态(suspend)
挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态
⚠️“挂起”和“阻塞”:两种状态都是暂时不能活的CPU服务,但是挂起态是将进程映像调到外存,而阻塞态下进程映像还在内存中
进程调度的时机
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机
需要进行进程调度与切换的情况
-
当前运行的进程主动放弃处理机
- 进程正常终止
- 运行过程中发生异常而终止
- 进程主动请求阻塞(如等待I/O)
有的系统中,只允许进程主动放弃处理机
-
当前运行的进程被动放弃处理机
- 分给进程的时间片用完
- 有更紧急的事需要处理( 如I/O中断)
- 有更高优先级的进程进入就绪队列
有的系统中,进程可以主动放弃处理机,当有更紧急的任务需要处理时,也会强制剥夺处理机(被动放弃)
不能进行进程调度与切换的情况
- 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换。
- 进程在操作系统内核程序临界区中。
- 在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)
✅进程在操作系统内核程序临界区中不能进行调度与切换
❌进程处于临界区时不能进行处理机调度
进程切换与过程
狭义的进程调度与进程切换的区别:
-
狭义的进程调度指的是从就绪队列中选中一个要运行的进程
这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换
-
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程
广义的进程调度包含了选择一个进程和进程切换两个步骤
进程切换的过程主要完成:
- 对原来运行进程各种数据的保存
- 对新的进程各种数据的恢复
⚠️进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。
进程调度的方式
-
非剥夺调度方式
又称非抢占方式。只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。
-
剥夺调度方式
又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。
抢占方式可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统
调度算法的评价指标
CPU利用率
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作
CPU利用率:指CPU“忙碌”的时间占总时间的比例
例题:
某计算机只支持单道程序,某个作业刚开始需要在CPU上运行5秒,再用打印机打印输出5秒,之后再执行5秒才能结束。在此过程中,CPU利用率、打印机利用率分别是多少?
展开查看答案
CPU利用率 = (5+5)/(5+5+5) = 66.66%
打印机利用率 = 5 /15 = 33.33%
系统吞吐量
系统吞吐量:单位时间内完成作业的数量
周转时间
周转时间:从作业被提交给系统开始,到作业完成为止的这段时间间隔
包括四个部分:
- 作业在外存后备队列上等待作业调度(高级调度)的时间
- 进程在就绪队列上等待进程调度(低级调度)的时间
- 进程在CPU上执行的时间
- 进程等待I/O操作完成的时间
-
周转时间、平均周转时间
\[(作业)周转时间 = 作业完成时间 - 作业提交时间 \]对于用户来说,更关心自己的单个作业的周转时间
\[平均周转时间 = \frac{各作业周转时间之和}{作业数} \]对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值
-
带权周转时间、平均带权周转时间
\[带权周转时间 = \frac{作业周转时间}{作业实际运行时间} = \frac{作业完成时间 - 作业提交时间}{作业实际运行时间} \]带权周转时间必然$\ge$1
带权周转时间与周转时间都不是越小越好
\[平均带权周转时间 = \frac{各作业带权周转时间之和}{作业数} \]
对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的时间更多,带权周转时间更小,用户满意度更高。
对于实际运行时间相同的两个作业,周转时间短的带权周转时间更小,用户满意度更高
等待时间
等待时间:指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。
平均等待时间:各个进程/作业等待时间的平均值
- 作业在后备队列等待被服务(调度)
- 作业调入内存后,建立对应的进程。这个进程会有等待被服务的时候
- 对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,等待I/O完成的期间其实进程也是在被服务的,所以不计入等待时间。
- 对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队累中等待的时间。
调度算法只会影响作业/进程的等待时间。
一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的
响应时间
响应时间:从用户提交请求到首次产生响应所用的时间
调度算法
饥饿:某进程/作业长期得不到服务
先来先服务FCFS
-
算法思想: 主要从“公平” 的角度考虑
-
算法规则:按照作业到达的先后顺序进行服务
-
既可用于作业调度,也可用与进程调度
- 用于作业调度时,考虑的是哪个作业先到达后备队列
- 用于进程调度时,考虑的是哪个进程先到达就绪队列
-
非抢占算法
-
优点:公平、算法实现简单
-
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说的用户体验不好。
-
不会导致饥饿
FCFS算法对长作业有利,对短作业不利
短作业有限SJF
-
算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间
-
算法规则:服务时间最短的作业优先得到服务
-
既可用于作业调度,也可用与进程调度
用于进程调度时称为“短进程有限SPF,Shortest Process First算法”
-
SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最短剩余时间有限算法SRTN,Shortest Remaining Time Next
最短剩余时间有限算法SRTN,Shortest Remaining Time Next
- 算法思想:每当有进程加入,就绪队列改变时就需要调度,如果新到达的进程剩余时间比当前的运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度。
-
优点:“最短的”平均等待时间、平均周转时间
在所有进程几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少
⚠️虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但是相对于其他算法(FCFS),SJF依然可以获得较少的平均等待时间、平均周转时间
-
缺点:
- <不公平>对短作业有利,对长作业不利。
- 作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先
-
会导致饥饿。如果源源不断地有短作业进来,可能使长作业长时间得不到服务,产生饥饿。如果一直得不到服务,则“饿死”
高响应比优先HRRN
- FCFS没有考虑到作业的运行时间,因此导致了对短作业不友好的问题
- SJF完全不考虑各个作业的等待时间,因此导致了对长作业不友好的问题*,甚至还会造成饥饿
-
算法思想:综合考虑作业的等待时间和要求服务的时间
-
算法规则:在每次调度时先计算各个作业的响应比,选择响应比最高的作业为其服务
\[响应比 = \frac{等待时间 + 要求服务时间}{要求服务时间} \] -
既可用于作业调度,也可用于进程调度
-
非抢占式的算法
因此只有当前运行的作业主动放弃处理机时,才需要调度,才需要计算响应比
-
优点:综合考虑了等待时间和运行时间
-
- 等待时间相同时,要求服务时间短的优先
- 要求服务时间相同时,等待时间长的优先
-
缺点:对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
-
不会导致饥饿
算法 | 思想和规则 | 是否可抢占 | 优点 | 缺点 | 是否会导致饥饿 | 是否考虑到等待时间和运行时间 |
---|---|---|---|---|---|---|
FCFS | 按照作业到达的先后顺序进行服务 | ❌ | 公平、实现简单 | 对短作业不利 | 等待时间✅运行时间❌ | 不会 |
SJF | 服务时间最短的作业优先得到服务 | ❌ | “最短的”平均等待/周转时间 | 对长作业不利,可能导致饥饿;难以做到真正的短作业优先 | 等待时间❌运行时间✅ | 会 |
HRRN | 综合考虑作业的等待时间和要求服务的时间 | ❌ | 上述两种算法的权衡折中,综合考虑的等待时间和运行时间 | 等待时间✅运行时间✅ | 不会 |
这几种算法主要关心用户的公平性、平均周转时间、平均等待时间等评价系统整体性能等指标,但是不关心“响应时间”,也不区分任务的紧急程度。
这三种算法只适用于早期的批处理系统。FCFS算法也常结合其他的算法使用
时间片轮转RR,Round-Robin
轮流让就绪队列中的进程依次执行一个时间片(每次选择的都是排在就绪队列队头的进程)
RR算法常用于分时操作系统,更注重“响应时间”
⚠️RR算法中的时间片划分:
- 如果时间片太大,则每个进程都可以在一个时间片内完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间
- 如果时间片太小,会导致进程切换过于频繁(进程调度、切换是有时间代价的),系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例少
-
算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
-
算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片。若进程未在一个时间片内执行完,则剥离处理机,将进程重新放到就绪队列队尾重新排队。
-
用于进度调度
只有作业放入内存建立了相应的进程后码才能被分配处理机时间片
-
抢占式算法
由时钟装置发出时钟中断来通知CPU时间片已到
-
优点:公平;响应快(适用于分时操作系统)
-
缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度
-
不会导致饥饿
优先级调度
每次调度时选择当时已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度。
当就绪队列发生改变时也需要检查是否会发生抢占
就绪队列:
- 就绪队列未必只有一个,可以按照不同优先级来组织。
- 可以把优先级高的进程排在更靠近队头的位置
根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级
- 静态优先级:创建进程时确定,之后一直不变
- 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级
⚠️可以从追求公平、提升资源利用率的角度考虑:
- 如果某进程在就绪队列中等待了很长时间,则可以适当提高其优先级
- 如果某进程占用处理机运行了很长时间,则可以适当降低其优先级
通常:
- 系统进程优先级高于用户进程
- 前台进程优先级高于后台进程。
操作系统更偏好I/O型进程(I/O繁忙型进程),而不是计算型进程(CPU繁忙型进程)
⚠️I/O设备和CPU设备可以并行工作。如果优先让I/O繁忙型进程优先运行的话,则越有可能让I/O设备尽早投入工作,则资源利用率、系统吞吐量都会得到提升
-
算法思想:根据任务的紧急程度来决定处理顺序
-
算法规则:调度时选择优先级最高的作业/进程
-
既可用于作业调度,也可用于进程调度
甚至,还会用于I/O调度
-
抢占式、非抢占式都有
非抢占式只需要在进程主动放弃处理机时进行调度
抢占式还需在就绪队列变化时,检查是否会发生抢占
-
优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度
-
缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
-
会导致饥饿
多级反馈队列
-
算法思想:对其他调度算法的折中权衡
-
算法规则:
- 设置多级就绪队列,各级优先队列优先级从高到低,时间片从小到大
- 新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片
- 若用完时间片仍未结束作业,则进程进入下一级队列队尾
- 如果此时已经时在最下级的队列,则重新放回该队列队尾
- 只有第k级队列为空时,才会为k+1级队头的进程分配时间片
- 被抢占处理机的进程重新放回原队列队尾
-
用于进程调度
-
抢占式算法
在k级队列的进程运行过程中,若更上级的队列(1 ~ k-1级)中进入了一个新进程,则由新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾
-
优点:
-
对各类型进程相对公平(FCFS的优先)
-
每个新到达的进程都可以很快就得到响应(RR的优点)
-
短进程只用较少的时间就可完成(SPF的优点)
-
不必实现估计进程的运行时间(避免用户作假)
-
可以灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程
可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级
-
-
会导致饥饿
算法 | 思想 | 是否可以抢占 | 优点 | 缺点 | 是否会导致饥饿 |
---|---|---|---|---|---|
时间片轮转 | 公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应 | 抢占式 | 公平,适用于分时系统 | 频繁切换有开销,不区分优先级 | ❌ |
优先级调度 | 根据任务的紧急程度来决定处理顺序 | 有抢占式,也有非抢占式 | 区分优先级,适用于实时系统 | 可能导致饥饿 | ✅ |
多级反馈队列 | 对其他调度算法的折中权衡 | 抢占式 | 平衡优秀 | 一般不说它有缺点,不过可能导致饥饿 | ✅ |
这三种算法适合用于交互式系统