2.2 调度 调度的 概念、层次
2.2 调度 调度的 概念、层次
三个层次
-
高级调度(作业调度)
-
中级调度(内存调度)
-
低级调度(进程调度)
什么是调度?
就是决定优先为谁服务!比如同时面对一大堆普通客人和一个vip客人,当然后者优先
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理 这些任务的顺序,这就是“调度”研究的问题。
高级调度
按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。【外存→内存,面向作业;无→创建态→就绪态】
简化理解:好几个程序需要启动,到底先启动哪个
低级调度
低级调度(进程调度/处理机调度)—— 按照某种策略从就绪队列中选取一个进程,将处理机分配给它。
最基本的一种调度,频率很高,一般几十毫秒一次。
中级调度
内存不够时,将某些进程的数据调出外存【即挂起状态,被挂起的进程PCB会被组织成挂起队列,挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态】。等内存空闲或者进程需要运行时再重新调入内存。 【内存→外存,面向进程;挂起态→就绪态】
频率中等
进程的挂起态与七状态模型
调度时机 切换与过程 调度方式
- 时机
- 什么时候需要进程调度?
- 什么时候不能进行进程调度?
- 切换与过程
- “狭义的调度"与“切换"的区别
- 进程切换的过程需要做什么?
- 调度方式
- 非剥夺调度方式(非抢占式)
- 剥夺调度方式(抢占式)
调度时机
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
需要进行进程调度与切换的情况
- 当前运行的进程主动放弃处理机
- 进程正常终止
- 运行过程中发生异常而终止
- 进程主动请求阻塞(如 等待I/O)
- 当前运行的进程被动放弃处理机
- 分给进程的时间片用完
- 有更紧急的事需要处理(如 I/O中断)
- 有更高优先级的进程进入就绪队列
不能进行进程调度与切换的情况
- 在处理中断的过程中。中断处理过程复杂,与硬件密切相关,很难 做到在中断处理过程中进行进程切换。
- 进程在操作系统内核程序临界区中。
- 在原子操作过程中(原语)。原子操作不可中断,要一气呵成(如 之前讲过的修改PCB中进程状态标志,并把PCB放到相应队列)
进程调度的时机
进程在操作系统内核程序临界区中不能进行调度与切换 √
(2012年联考真题)进程处于临界区时不能进行处理机调度 ×
临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区:访问临界资源的那段代码。 内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列由各就绪进程的PCB组成。但是进程在普通临界区中是可以进行调度、切换的。
为何一个可以一个不可以?
如果还没退出临界区(还没解锁)就进行进程调度,但是进程调度相关的程序也需要访问就绪队列,但此时就绪队列被锁住了,因此又无法顺利进行进程调度
内核程序临界区访问的临界资源如果不尽快释放的话,极有可能影响到操作系统内核的其他管理工作。因此在访问内核程序临界区期间不能进行调度与切换
在打印机打印完成之前,进程一直处于临界区内,临界资源不会解锁。但打印机又是慢速设备,此时如果一直不允许 进程调度的话就会导致CPU一直空闲
普通临界区访问的临界资源不会直接影响操作系统内核的管理工作。因此在访问普通临界区时可以进行调度与切换。
进程调度的方式
- 非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即使有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统
- 剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进 程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。可以优先处理更紧急的进程,也可实现让各 进程按时间片轮流执行的功能(通过时钟中 断)。适合于分时操作系统、实时操作系统
进程的切换与过程
“狭义的进程调度”与“进程切换”的区别:
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:
1.对原来运行进程各种数据的保存
2.对新的进程各种数据的恢复
(如:程序计数器、程序状态字、各种数据寄存器等处理机现场信息,这些信息一般保存在进程控制块)
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。并不是调度越频繁,并发度就越高
调度算法的评价指标
- CPU利用率
- 系统吞吐量
- 周转时间
- 周转时间、平均周转时间
- 带权周转时间、平均带权周转时间
- 等待时间
- 响应时间
CPU利用率
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作
利用率 = 忙碌的时间 / 总时间
Eg:某计算机只支持单道程序,某个作业刚开始需要在CPU上运行5秒, 再用打印机打印输出5秒,之后再执行5秒,才能结束。在此过程中, CPU利用率、打印机利用率分别是多少?
CPU利用率 = 5+5 /5+5+5 = 66.66%; 打印机利用率 = 5 /15 = 33.33%
系统吞吐量
系统吞吐量= 总共完成了多少道作业/总共花了多少时间
Eg:某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为? 10/100 = 0.1 道/秒
周转时间
周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
1.周转时间 = 作业完成时间 – 作业提交时间;对于用户来说,更关心自己的单个作业的周转时间
2.平均周转时间 = 各作业周转时间之和 / 作业数;对于操作系统来说,更关心系统的整体表现
但是,有的作业时间短,有的时间长,给人的感觉一定是不一样的
3.带权周转时间 = 作业周转时间 / 作业实际运行的时间
4.平均带权周转时间 = 各作业带权周转时间之和 作业数
所以,带权周转时间必然 ≥ 1,带权周转时间越小,咱体验越好就越高兴
等待时间
指进程/作业处于等待处理机状态时间之和
响应时间
指从用户提交请求到首次产生响应所用的时间
调度算法
- 先来先服务FCFS、最短作业优先SFJ、最高响应比优先HRRN
- 时间片轮转、优先级调度、多级反馈队列
先来先服务 | 短作业优先 | 高响应比优先 | 时间片轮转 | 优先级调度 | 多级反馈队列调度 | |
---|---|---|---|---|---|---|
算法思想 | “公平”(类似于我们生活中排队买东 西的例子) | 追求最少的平均等待时间,最少的平均周转时间、最少的 平均平均带权周转时间 | 要综合考虑作业/进程的等待时间和要求服务的时间 | 公平地、轮流地为各个进程服务,让每个进程在一定时间 间隔内都可以得到响应 | 随着计算机的发展,特别是实时操作系统的出现,越来越 多的应用场景需要根据任务的紧急程度来决定处理顺序 | 对其他调度算法的折中权衡 |
算法规则 | 先来先服务 | 最短的作业/进程优先得到服务(所谓“最短”,是指要求 服务时间最短) | 在每次调度时先计算各个作 业/进程的响应比,选择响应 比最高的作业/进程为其服务 | 按照各进程到达就绪队列的顺序,轮流让各个进程执行一 个时间片(如 100ms)。若进程未在一个时间片内执行完, 则剥夺处理机,将进程重新放到就绪队列队尾重新排队。 | 调度时选择优先级最高的作业/进程 | 1. 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大 2. 新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时 间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。 如果此时已经是在最下级的队列,则重新放回该队列队尾 3. 只有第 k 级队列为空时,才会为 k+1 级队头的进程分配时间片 |
用于作业/进程调度 | 用于作业调度时,考虑的是哪个作业先到达后备队列;用 于进程调度时,考虑的是哪个进程先到达就绪队列 | 即可用于作业调度,也可用于进程调度。用于进程调度时 称为“短进程优先(SPF, Shortest Process First)算法” | 可用于作业调度,也可用于进程调度 | 用于进程调度(只有作业放入内存建立了相应的进程后, 才能被分配处理机时间片) | 既可用于作业调度,也可用于进程调度。甚至,还会用于 在之后会学习的I/O调度中 | 用于进程调度\ |
是否可抢占? | 非抢占式 | SJF和SPF是非抢占式的算法。但是也有抢占式的版本——最 短剩余时间优先算法(SRTN, Shortest Remaining Time Next) | 非抢占式的算法。因此只有当前运行的作业/进程主动放弃 处理机时,才需要调度,才需要计算响应比 | 若进程未能在时间片内运行完,将被强行剥夺处理机使用 权,因此时间片轮转调度算法属于抢占式的算法。由时钟 装置发出时钟中断来通知CPU时间片已到 | 抢占式、非抢占式都有。做题时的区别在于:非抢占式只 需在进程主动放弃处理机时进行调度即可,而抢占式还需 在就绪队列变化时,检查是否会发生抢占。 | 抢占式的算法。在 k 级队列的进程运行过程中,若更上级的队列 (1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的 队列中,因此新进程会抢占处理机,原来运行的进程放回 k 级队列 队尾。 |
优缺点 | 优点:公平、算法实现简单 缺点:排在长作业(进程)后面的短作业需要等待很长时 间,带权周转时间很大,对短作业来说用户体验不好 | 优点:“最短的”平均等待时间、平均周转时间 缺点:不公平。对短作业有利,对长作业不利。可能产生 饥饿现象。另外,作业/进程的运行时间是由用户提供的, 并不一定真实,不一定能做到真正的短作业优先 | 综合考虑了等待时间和运行时间(要求服务时间) 等待时间相同时,要求服务时间短的优先(SJF 的优点) 要求服务时间相同时,等待时间长的优先(FCFS 的优点) 对于长作业来说,随着等待时间越来越久,其响应比也会 越来越大,从而避免了长作业饥饿的问题 | 优点:公平;响应快,适用于分时操作系统; 缺点:由于高频率的进程切换,因此有一定开销;不区分 任务的紧急程度。 | 优点:用优先级区分紧急程度、重要程度,适用于实时操 作系统。可灵活地调整对各种作业/进程的偏好程度。 缺点:若源源不断地有高优先级进程到来,则可能导致饥 饿 | 对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以 很快就得到响应(RR的优点);短进程只用较少的时间就可完成 (SPF的优点);不必实现估计进程的运行时间(避免用户作假); 可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密 集型进程(拓展:可以将因I/O而阻塞的进程重新放回原队列,这样 I/O型进程就可以保持较高优先级) |
是否会导致饥饿 | 不会 | 会 | 不会 | 不会 | 会 | 会 |
先来先服务(FCFS, First Come First Serve)
- 周转时间 = 完成时间 - 到达时间 —— P1=7-0=7;P2=11-2=9;P3=12-4=8;P4=16-5=11
- 带权周转时间 = 周转时间/运行时间 —— P1=7/7=1;P2=9/4=2.25;P3=8/1=8;P4=11/4=2.75
- 等待时间 = 周转时间 – 运行时间 —— P1=7-7=0;P2=9-4=5;P3=8-1=7;P4=11-4=7
注意:本例中的进程都是纯计算型的进程,一个进程到 达后要么在等待,要么在运行。如果是又有计算、又有 I/O操作的进程,其等待时间就是周转时间 - 运行时间 - I/O操作的时间
短作业优先(SJF, Shortest Job First)
- 周转时间 = 完成时间 - 到达时间 —— P1=7-0=7;P3=8-4=4;P2=12-2=10;P4=16-5=11
- 带权周转时间 = 周转时间/运行时间 —— P1=7/7=1;P3=4/1=4;P2=10/4=2.5;P4=11/4=2.75
- 等待时间 = 周转时间 – 运行时间 —— P1=7-7=0;P3=4-1=3;P2=10-4=6;P4=11-4=7
抢占式的短作业优先算法 又称“最短剩余时间优先 算法(SRTN)”
对比非抢占式的短作业优先算法,显 然抢占式的这几个指标又要更低【平均周转时间:平均带权周转日平均等待时间:】
注意几个小细节:
- 如果题目中未特别说明,所提到的“短作业/进程优先算法”默认是非抢占式的
- 很多书上都会说“SJF 调度算法的平均等待时间、平均周转时间最少”
严格来说,这个表述是错误的,不严谨的。之前的例子表明,最短剩余时间优先算法得到的平均等待
时间、平均周转时间还要更少
应该加上一个条件“在所有进程同时可运行时,采用SJF调度算法的平均等待时间、平均周转时间最
少”;
或者说“在所有进程都几乎同时到达时,采用SJF调度算法的平均等待时间、平均周转时间最少”;
如果不加上述前提条件,则应该说“抢占式的短作业/进程优先调度算法(最短剩余时间优先, SRNT算
法)的平均等待时间、平均周转时间最少” - 虽然严格来说,SJF的平均等待时间、平均周转时间并不一定最少,但相比于其他算法(如 FCFS),
SJF依然可以获得较少的平均等待时间、平均周转时间 - 如果选择题中遇到“SJF 算法的平均等待时间、平均周转时间最少”的选项,那最好判断其他选项
是不是有很明显的错误,如果没有更合适的选项,那也应该选择该选项
能不能设计一个算法,即考虑到各个作业 的等待时间,也能兼顾运行时间呢? 高响应比优先算法
高响应比优先算法
响应比 = 等待时间+要求服务时间/要求服务时间
注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但 是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算 法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的 角色。而适合用于交互式系统的调度算法将在下个小节介绍…
时间片轮转(RR, Round-Robin)
其中,时间为4的时候,运行p1而不是p3
如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来 先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。 另一方面,进程调度、切换是有时间代价的(保存、恢复运行环境),因此如果时间片太小,会导 致进程切换过于频繁,系统会花大量的时间来处理进程切换
优先级调度算法
补充: 就绪队列未必只有一个,可以按照不同优先级来组织。
另外,也可以把优先级 高的进程排在更靠近队头的位置 根据优先级是否可以动态改变,可将优先级分为静态优先级和动态优先级两种。
静态优先级:创建进程时确定,之后一直不变。
动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级。
如何合理地设置各类进程的优先级?
通常: 系统进程优先级 高于 用户进程 前台进程优先级 高于 后台进程 操作系统更偏好 I/O型进程(或称 I/O繁忙型进程) 注:与I/O型进程相对的是计算型进程(或称 CPU繁忙型进程)
如果采用的是动态优先级,什么时候应该调整?
可以从追求公平、提升资源利用率等角度考虑 如果某进程在就绪队列中等待了很长时间,则可以适当提升其优先级 如果某进程占用处理机运行了很长时间,则可适当降低其优先级 如果发现一个进程频繁地进行I/O操作,则可适当提升其优先级
多级反馈队列调度算法
FCFS算法的优点是公平、SJF 算法的优点是能尽快处理完短作业, 平均等待/周转时间等参数很优秀、时间片轮转调度算法可以让各个进程得 到及时的响应、优先级调度算法可以灵活地调整各种进 程被服务的机会,能否对其他算法做个折中权衡?得到一个 综合表现优秀平衡的算法呢?
设置多级就绪队列,各级队列优先级从高到低,时间片从小到大 新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片。若用完时间片进程还 未结束,则进程进入下一级队列队尾。如果此时已经在最下级的队列,则重新放回最下级 队列队尾 只有第 k 级队列为空时,才会为 k+1 级队头的进程分配时间片 被抢占处理机的进程重新放回原队列队尾
注:比起早期的批处理操作系统来说,由于计算机造价大幅降低,因此之后出现的交互式操作系统(包括 分时操作系统、实时操作系统等)更注重系统的响应时间、公平性、平衡性等指标。而后三种算法刚好非常适合,适合用于交互式系统。(比如UNIX使用的就是多级反馈 队列调度算法)