Loading

操作系统笔记二:进程与调度(2)

进程同步与互斥

进程同步

同步亦称直接制约关系,它是指为完成某种任务而建立的两个或多个进程,这些进程因为需要在某些位置上协调它们的工作次序而产生的制约关系。进程间的直接制约关系就是源于它们之间的相互合作。

进程互斥

我们把一个时间段内只允许一个进程使用的资源成为临界资源。许多物理设备(比如摄像头、打印机)都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源。

对临界资源的访问,必须互斥地进行。互斥,亦称间接制约关系进程互斥指当一个进程访问某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后,另一个进程才能去访问临界资源。

对临界资源的互斥访问,可以在逻辑上分为如下四个部分:

  • 进入区(Entry section):负责检查是否可进入临界区,若可进入,则应设置正在访问临界资源的标志(可理解为“上锁”),以阻止其他进程同时进入临界区。
  • 临界区(Critical section):访问临界资源的那段代码
  • 退出区(Exit section):负责接触正在访问临界资源标志(可理解为“解锁”)
  • 剩余区(Remainder section):做其他处理
  • 注意:
    • 临界区是进程中访问临界资源的代码段。
    • 进入区退出区负责实现互斥的代码段。
    • 临界区也可称为“临界段”

为了实现对临界资源的互斥访问,同时保证系统整体性能,需要遵循以下原则:

  1. 空闲让进:临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区;
  2. 忙则等待:当已有进程进入临界区时,其他试图进入临界区的进程必须等待;
  3. 有限等待:对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿);
  4. 让权等待:当进程不能进入临界区时,应立即释放处理机,防止进程忙等待。

进程互斥的软件实现算法

单标志法

算法思想:两个进程在访问完临界区后会把使用临界区的权限转交给另一个进程。也就是说每个进程进入临界区的权限只能被另一个进程赋予。

int turn=0;	//turn 表示当前允许进入临界区的进程号

单标志法存在主要问题时:违背“空闲让进”原则。

双标志先检查法

算法思想:设置一个布尔型数组flag[],数组中各个元素用来标记各进程想进入临界区的意思,比如“flag[0]=true”意味着0号进程P0现在想要进入临界区。每个进程在进入临界区之前先检查当前没有别的进程想进入临界区,如果没有,则把自身对应的标志flag[i]设为true,之后开始访问临界区。

bool flag[2];		//表示进入临界区意愿的数组
flag[0]=false;
flag[1]=false;		//刚开始设置为两个进程都不想进入临界区

双标志先检查法的主要问题是:违反“忙则等待”原则。

原因在于,进入区的“检查”和“上锁”两个处理不是一气呵成的。“检查”后,“上锁”前可能发生进程切换。

双标志后检查法

算法思想:双标志先检查法的改版。前一个算法的问题是先“检查”后"上锁",但是这两个操作又无法一气呵成,因此导致了两个进程同时进入临界区的问题。因此,人们又想到先“上锁”后“检查”的方法,来避免上述问题。

bool flag[2];		//表示进入临界区意愿的数组
flag[0]=false;
flag[1]=false;		//刚开始设置为两个进程都不想进入临界区

双标志后检查法虽然解决了“忙则等待”的问题,但是又违背了“空闲让进”和“有限等待”原则,会因各进程都长期无法访问临界资源而产生“饥饿”现象。

两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。

Peterson算法

算法思想:双标志后检查法中,两个进程都争着想进入临界区,但是谁也不让谁,最后谁都无法进入临界区。Gary L.Peterson想到一种方法,如果双方都争着想进入临界区,那可以让进程尝试“孔融让梨”,主动让对方先使用临界区。

bool flag[2];	//表示进入临界区意愿的数组,初始值都是false
int turn=0;		//turn表示优先让哪个进程进入临界区

Peterson算法用软件方法解决了进程互斥问题,遵循了空闲让进、忙则等待、有限等待三个原则,但是依然未遵循让权等待的原则。

Peterson算法相较于之前三种软件解决方案来说,是最好的,但依然不够好。

进程互斥的硬件实现方法

中断屏蔽方法

利用“开/关中断指令”实现(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)

---
关中断;
临界区;
开中断;
---

优点:简单、高效

缺点:不适用于多处理机;只适用于操作系统内核进程,不适用于用户进程(因为开/关中断指令只能允许在内核态,这组指令如果能让用户随意使用会很危险)

TestAndSet指令

简称TS指令,也有地方称为TestAndSetLock指令,或TSL指令

TSL指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成的。以下是用c++语言描述的逻辑

//布尔型共享变量lock表示当前临界区是否被加锁
//true表示已加锁,false表示未加锁
bool TestAndSet(bool *lock)
{
	bool old;
	old = *lock;	//old用来存放lock原来的值
	*lock= true;	//无论之前是否已加锁,都将lock设为true
	return old;		//返回lock原来的值
}
//以下是使用TSL指令实现互斥的算法逻辑
while(TestAndSet(&lock));		//"上锁"并“检查”
//临界区代码段...
lock=false;					   //“解锁”
//剩余区代码段...

若刚开始lock是false,则TSL返回的old值为false,while循环条件不满足,直接跳过循环,进入临界区。若刚开始lock是true,则执行TLS后old返回的值为true,while循环条件满足,会一直循环,直到当前访问临界区的进程在退出区进行“解锁”。

相比软件实现方法,TSL指令把“上锁”和“检查”操作用用硬件得方式变成了一气呵成得原子操作。

优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境。

缺点:不满足”让权等待“原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致”忙等“。

Swap指令

有的地方也叫Exchange指令,或简称XCHG指令。

Swap指令是用硬件实现的,执行的过程不允许被中断,只能一气呵成。以下是用c++语言描述的逻辑

//Swap指令的作用是交换两个变量的值
Swap(bool *a,bool *b)
{
	bool temp;
	temp=*a;
	*a=*b;
	*b=temp;
}
//以下是用Swap指令实现互斥的算法逻辑
//lock表示当前临界区是否被加锁
bool old=true;
while(old==true)
	Swap(&lock,&old);
临界区代码段...
lock=false;
剩余区代码段...

逻辑上来看Swap和TSL并无太大区别,都是先记录下此时临界区是否已经被上锁(记录在old变量上),再将上锁标记lock设置为true,最后检查old,如果old为false则说明之前没有别的进程对临界区上锁,则可跳出循环,进入临界区。

优点:实现简单,无需像软件实现方法那样严格检查是否会有逻辑漏洞;适用于多处理机环境。

缺点:不满足“让权等待”原则,暂时无法进入临界区的进程会占用CPU并循环执行TSL指令,从而导致“忙等"。

信号量机制

用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步。

信号量其实就是一个变量(可以是一个整数,也可以是更复杂的记录型变量),可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置一个初值为1的信号量。

原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断/开中断指令实现的。软件解决方案的主要问题是由“进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用“原语”实现,是这些操作能“一气呵成”就能避免问题。

一对原语:wait(S)原语和signal(S)原语,可以把原语理解为我们自己写的函数,函数名分别为wait和signal,括号里的信号量S其实就是函数调用时传入的一个参数。

wait、signal原语常简称为P、V操作

整型信号量

用一个整数型的变量作为信号量,用来表示系统中某种资源的数量

对普通整数变量的区别:对信号量的操作只有三种,即初始化、P操作、V操作

Eg:某计算机系统中有一台打印机

int S=1;	//初始化整型信号量s,表示当前系统中可用的打印机资源数

void wait(int S)
{					//wait原语,相当于“进入区”
	while(S<=0);     //如果资源数不够,就一直循环等待
	S=S-1;			//如果资源数够,则占用一个资源
}

void signal(int S)
{					//signal原语,相当于“退出区”
    S=S+1;			 //使用完资源后,在退出区释放资源
}

存在的问题:不满足“让权等待”原则,会发生“忙等”

记录型信号量

整型信号量的缺陷是存在“忙等”问题,因此人们又提出了"记录型信号量",即用记录型数据结构表示的信号量。

//记录型信号量的定义
typedef struct
{
	int value;		      //剩余资源数
	struct process *L;     //等待队列
}semlphore;

//某进程需要使用资源时,通过wait原语申请
void wait(semaphore S)
{
	S.value--;
	if(S.value<0)
	{
		block(S.L);
	}
}


//进程使用完资源后,通过signal原语释放
void signal(semaphere S)
{
	S.value++;
	if(S.value<=0)
	{
		wakeup(S.L);
	}
}

如果剩余资源数不够,使用block原语使进程从运行态进入阻塞态,并把挂到信号量的S的等待队列(即阻塞队列)中。

释放资源后,若还有别的进程在等待这种资源,则使用wakeup原语唤醒等待队列中的一个进程,该进程从阻塞态变为就绪态。

S.value的初值表示系统中某种资源的数目

对信号量S的一次P操作意味着进程请求一个单位的该类资源,因此需要执行S.value--,表示资源数减1,当S.value<0时表示该类资源已分配完毕,因此进程应调用block原语进行自我阻塞(当前运行的进程从运行态->阻塞态),主动放弃处理机,并插入该类资源的等待队列S.L中。可见,该机制遵循了“让权等待”原则,不会出现“忙等”现象。

对信号量S的一次V操作意味着进程释放一个单位该类资源,因此需要执行S.value++,表示资源数加1,若加1后仍是S.value<=0,表示依然有进程在等待该类资源,因此应调用wakeup原语唤醒等待队列的第一个进程(被唤醒进程从阻塞态->就绪态)。

信号量机制实现进程互斥、同步、前驱关系

信号量机制实现进程互斥

  1. 分析并发进程的关键活动,划定临界区(如:对临界资源打印机的访问就应放在临界区)
  2. 设置互斥信号量mutex,初值为1
  3. 在临界区之前执行P(mutex)
  4. 在临界区之后执行V(mutex)

注意:对不同的临界资源需要设置不同的互斥信号量。

P、V操作必须成对出现。缺少P(mutex)就不能保证临界资源的互斥访问。缺少V(mutex)会导致资源永不被释放,等待进程永不被唤醒。

信号量机制实现进程同步

进程同步:要让各并发进程按要求有序地推进。

  1. 分析什么地方需要实现“同步关系”,即必须保证“一前一后”执行的两个操作(或两句代码)
  2. 设置同步信号量S,初始为0
  3. 在“前操作”之后执行V(S)
  4. 在“后操作”之前执行P(S)

信号量机制实现前驱关系

其实每一对前驱关系都是一个进程同步问题(需要保证一前一后的操作),因此

  1. 为每一对前驱关系各设置一个同步变量
  2. 在“前操作”之后对相应的同步变量执行V操作
  3. 在“后操作”之前对相应的同步变量执行P操作

生产者消费者问题

系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。(注:这里的“产品”理解为某种数据)

生产者、消费者共享一个初始为空、大小为n的缓冲区

只有缓冲区没满时,生产者才能把产品放入缓冲区,否则必须等待。(同步关系)

只有缓冲区不空时,消费者才能从中取出产品,否则必须等待。(同步关系)

缓冲区是临界资源,各进程必须互斥地访问。(互斥)

信号量机制可实现互斥、同步、对一类系统资源的申请和释放。

PV操作题目分析步骤:

  1. 关系分析。找出题目中描述的各个进程,分析它们之间的同步、互斥关系。
  2. 整理思路。根据各进程的操作流程确定P、V操作的大致顺序。
  3. 设置信号量。设置需要的信号量,并根据题目条件确定信号量初值。(互斥信号量初值一般为1,同步信号量的初始值要看对应资源的初始值是多少)

多生产者多消费者

桌面上有一只盘子,每次只能向其中放入一个水果。爸爸专向盘子中放苹果,妈妈专向盘子放橘子,儿子专等着吃盘子中的橘子,女儿专等着吃盘子中的苹果。只有盘子空时,爸爸或妈妈才可向盘子中放一个水果。仅当盘子中有自己需要的水果时,儿子或女儿可以从盘子中取出水果。

image-20201207182006730

互斥关系(mutex=1):对缓冲区(盘子)的访问要互斥地进行

同步关系(一前一后):

  1. 父亲将苹果放入盘子后,女儿才能取苹果
  2. 母亲将橘子放入盘子后,儿子才能取橘子
  3. 只有盘子为空时,父亲或母亲才能放入水果

总结:在生产者-消费者问题中,如果缓冲区大小为1,那么有可能不需要设置互斥信号量就可以实现互斥访问缓冲区的功能。当然,这不是绝对的,要具体问题具体分析。

建议:在考试中如果来不及仔细分析,可以加上互斥信号量,保证个进程一定会互斥地访问缓冲区,但需注意的是,实现互斥的P操作一定要在实现同步的P操作之后,否则可能引起“死锁”。

解决“多生产者-多消费者问题”的关键在于理清复杂的同步关系。

正确的分析方法应该从“事件”的角度来考虑,我们可以把上述四对“进程行为的前后关系”抽象为一对“事件的前后关系”

吸烟者问题

假设一个系统有三个抽烟者进程一个供应者进程。每个抽烟者不停地卷烟并抽掉它,但是要卷起并抽掉一支烟,抽烟者需要有三种材料:烟草、纸和胶水。三个抽烟者中,第一个拥有烟草、第二个拥有纸、第三个拥有胶水。供应者进程无限地提供三种材料,供应者每次将两种材料放桌子上,拥有剩下那种材料的抽烟者卷一根烟并抽掉它,并给供应者进程一个信号告诉完成了,供应者就会放另外两种材料在桌上,这个过程一直重复(让三个抽烟者轮流抽烟

image-20201207192240908

吸烟者问题可以为我们解决"可以生产多个产品的单生产者"问题提供一个思路。

值得吸取的精华是:“轮流让各个吸烟者吸烟”必然需要“轮流的在桌子放上组合一、二、三”,注意体会我们是用一个整型变量i实现这个“轮流”过程的。

若一个生产者要生产多种产品(或者说会引发多钟前驱事件),那么各个V操作应该放在各自对应的“事件”发生之后的位置。

读者-写者问题

有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时则可能导致数据不一致的错误。因此要求:

  1. 允许多个读者可以同时对文件执行读操作
  2. 只允许一个写者往文件中写信息
  3. 任一写者在完成写操作之前不允许其他读者或写者工作
  4. 写者执行写操作前,应让已有的读者和写者全部退出

两类进程:写进程、读进程

互斥关系:写进程-写进程、写进程-读进程。读进程与读进程不存在互斥问题。

写者进程和任何进程都互斥,设置一个互斥信号量rw,在写者访问共享文件前后分别执行P、V操作。读者进程和写者进程也要互斥,因此读者访问共享文件前后也要对rw执行P、V操作。

P(rw)和V(rw)其实就是对共享文件的“加锁”和“解锁”。既然各个读进程需要同时访问,而读进程与写进程又必须互斥访问。那么我们可以让第一个访问文件的读进程“加锁”,让最后一个访问完文件的读进程“解锁“。可以设置一个整数变量count来记录当前有几个读进程在访问文件。

若两个读进程并发执行,则两个读进程都有可能先后执行P(rw),从而使第二个读进程阻塞的情况。

  • 出现上述问题的原因在于对count变量的检查和赋值无法一气呵成,因此可以设置拎一个互斥信号量来保证各读进程对count的访问是互斥的。

潜在的问题:只要有读进程还在读,写进程就要一直阻塞等待,可能“饿死”。因此,这种算法中,读进程是优先的。

  • 通过增加一个互斥量用于实现“写优先”
  • 在这种算法,连续进入的多个读者可以同时读文件;写者和其他进程是不能同时访问文件;写者不会饥饿,但也并不是真正的“写优先”,而是相对公平的先来先服务原则。
semaphore rw=1;			//用于实现对文件的互斥访问
int count=0;			//记录当前有几个读进程在访问文件
semaphore mutex =1;		 //用于保证对count变量的互斥访问
semaphore w=1;			//用于实现“写优先”

读者-写者问题为我们解决复杂的互斥问题提供了一个参考思路。

核心思想在于设置了一个计数器count用来记录当前正在访问共享文件的读进程数。我们用count的值来判断当前进入的进程是否是第一个/最后一个读进程,从而做出不同的处理。

另外,对count变量的检查和赋值不能一气呵成导致了一些错误,如果需要实现“一气呵成”,自然应该想到用互斥信号量。

哲学家进餐问题

一张圆桌上坐着5名哲学家,每两个哲学家之间的桌上摆一根筷子,桌子的中间是一碗米饭。哲学家们倾注毕生的精力用于思考和进餐,哲学家在思考时,并不影响他人。只有当哲学家饥饿时,才试图拿起左、右两根筷子(一根一根地拿起)。如果筷子已在他人手上,则需等待。饥饿的哲学家只有同时拿起两根筷子才可以开始进餐,当进餐完毕后,放下筷子继续思考。

  1. 关系分析。系统中有5个哲学家进程,5位哲学家与左右邻居对其中间筷子的访问是互斥关系。
  2. 整理思路。这个问题中只有互斥关系,但与之前遇到的问题不同的事,每个哲学家进程需要同时持有两个临界资源才能开始吃饭。如何避免临界资源分配不当造成的死锁现象,是哲学家问题的精髓。
  3. 信号量设置。定义互斥信号量数组chopstick[5]={1,1,1,1,1}用于实现对5个筷子的互斥访问。并对哲学家按0~4编号,哲学家i左边的筷子编号为i,右边的筷子编号为(i+1)%5。

如何防止死锁的发生

  1. 可以对哲学家进程施加一些限制条件,比如最多允许四个哲学家同时进餐。这样可以保证至少有一个哲学家是可以拿到左右两只筷子的。
  2. 要求奇数号哲学家先拿左边的筷子,然后再拿右边的筷子,而偶数号哲学家刚好相反。用这种方法可以保证如果相邻的两个奇偶号哲学家都想吃饭,那么只会有其中一个可以拿起第一只筷子,另一个会直接阻塞。这就避免了占有一支后再等待另一只的情况。
  3. 仅当一个哲学家左右两支筷子都可用时才允许他抓起筷子。

第二种方法这种方法并不能保证只有两边的筷子都可用时,才允许哲学家拿起筷子。

更准确的说法应该是:各哲学家拿筷子这件事必须互斥的执行。这就保证了即使一个哲学家在拿筷子拿到一半时被阻塞,也不会有别的哲学家会继续尝试拿筷子。这样的话,当前正在吃饭的哲学家放下筷子后,被阻塞的哲学家就可以获得等待的筷子了。

知识回归与重要考点

哲学家进餐问题的关键在于解决进餐死锁。

这些进程之间只存在互斥关系,但是与之前接触到的互斥关系不同的是,每个进程都需要同时持有两个临界资源,因此就有“死锁”问题的隐患。

管程

信号量机制存在的问题:编写程序困难,易出错。

1973年,Brinch Hansen首次在程序设计语言(Pascal)中引入了“管程”成分--一种高级同步机制。

管程的定义和基本特征

管程是一种特殊的软件模块,有这些部分组成:

  1. 局部于管程的共享数据结构说明
  2. 对该数据结构进行操作的一组过程
  3. 对局部于管程的共享数据设置初始值的语句
  4. 管程有一个名字。

管程的基本特征:

  1. 局部于管程的数据只能被局部于管程的过程所访问
  2. 一个进程只有通过调用管程内的过程才能进入管程访问共享数据
  3. 每次仅允许一个进程在管程内执行某个内部过程。

拓展1:用管程解决生产者消费者问题

monitor ProducerConsumer
	condition full,empty;		//条件变量用来实现同步(排队)
	int count=0;			   //缓冲区中的产品数
    void insert(Item item)
    {						   //把产品item放入缓冲区
    	if(count==N)
    	   wait(full);
    	count++;
    	insert_item(item);
        if(count==1)
           signal(empty);
    }
    Item remove()
    {   						//从缓冲区中取出一个产品
    	if(count==0)
    	 	wait(empty);
    	 count--;
    	 if(count==N-1)
    	 	signal(full);
    	 return remove_item();
    }
end monitor;
//生产者进程
producer()
{
	while(1)
	{
		item=生产一个产品;
		ProdecerConsumer.insert(item);
	}
}
//生产者进程
consumer()
{
	while(1)
	{
		item=ProdecerConsumer.remove();
		消费产品item;
	}
}

由编译器负责实现各进程互斥地进入管程的过程。管程中设置条件变量和等待/唤醒操作,以解决同步问题。

每次仅允许一个进程在管程内执行某个内部过程。

引入管程的目的无非就是要更方便地实现进程互斥和同步。

  1. 需要在管程中电一共享数据(如生产者消费者问题的缓冲区)
  2. 需要在管程中定义用于访问这些共享数据的“入口”--其实就是一些函数。
  3. 只有通过这些特定的“入口”才能访问共享数据。
  4. 管程中有很多“入口”,但是每次只能开放其中一个“入口”,并且只能让一个进程或线程进入注意:这种互斥特性是由编译器负责实现的,程序员不用关心
  5. 可在管程中设置条件变量等待/唤醒操作以解决同步问题。可以让一个进程或线程在条件变量上等待(此时,该进程应先释放管程的使用权,也就是让出“入口”);可以通过唤醒操作将等待在条件变量上的进程或线程唤醒。

程序员可以某种特殊的语法定义管程,之后其他程序员就可以使用这个管程提供的特定“入口”很方便地使用实现进程同步/互斥了。

拓展2:Java中类似管程的机制

Java中,如果用关键字synchronized来描述一个函数,那么这个函数同一时间段内只能被一个线程调用

static class monitor{
	private Item buffer[]=new Item[N];
	private int count=0;
	public synchronized void insert(Item item)
	{
		...
	}
}

每次只能由一个线程进入insert函数,如果多个线程同时调用insert函数,则后来者需要排队等待。

死锁

死锁的概念

在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。发生死锁后若无外力干涉,这些进程都将无法向前推进。

死锁、饥饿、死循环的区别

共同点 区别
死锁 都是进程无法顺利向前推进的现象(故意设计的死循环除外) 死锁一定是“循环等待对方手里的资源”导致的,因此如果有死锁现象,那至少有两个或两个以上的进程同时发生死锁。另外,发生死锁的进程一定处于阻塞态。
饥饿 可能只有一个进程发生饥饿。发生饥饿的进程既可能是阻塞态(如长期得不到需要的I/O设备),也可能是就绪态(长期得不到处理机)
死循环 可能只有一个进程发生死循环。死循环的进程可以上处理机运行(可以是运行态),只不过无法像期待的那样顺利推进。死锁和饥饿问题是由于操作系统分配资源的策略不合理导致的,而死循环是由代码逻辑的错误导致的。死锁和饥饿是管理者(操作系统)的问题,死循环是被管理者的问题。

死锁产生的必要条件

产生死锁必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生。

互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如:哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。

不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。

请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。

循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。

注意!发生死锁时一定有循环等待,但是发生循环等待时未必死锁(循环等待时死锁的必要不充分条件)

如果同类资源数大于1,则即使有循环等待,也未必发生死锁。但如果系统中每类资源都只有一个,那循环等待就是死锁的充分必要条件了。

什么时候会发生死锁

  1. 对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的。
  2. 进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。例如:并发执行的进程P1、P2分别申请并占有了资源R1、R2,之后进程P1又紧接着申请资源R2,而进程P2又申请资源R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
  3. 信号量的使用不当也会造成死锁。如果实现互斥的P操作在实现同步的P操作之前,就有可能导致死锁。(可以把互斥信号量、同步信号量也看做是一种抽象的系统资源)

总之,对不可剥夺资源的不合理分配,可能导致死锁。

死锁的处理策略--预防死锁

破环互斥条件

互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁。
如果把只能互斥使用的资源改造成允许共享使用,则系统不会进入死锁状态。比如:SPOOLing技术。操作系统可以采用SPOOLing技术把独占设备在逻辑上改造成共享设备。比如,用SPOOLing技术将打印机改造成共享设备...

image-20201207221134783

该策略的缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破环互斥条件

破坏不剥夺条件

不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。

破坏不剥夺条件:

方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件。

方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)

该策略的缺点:

  1. 实现起来比较复杂。
  2. 释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如CPU。
  3. 反复地申请和释放资源会增加系统开销,降低系统吞吐量。
  4. 若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿。

破环请求和保存条件

请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。

可以采用静态分配方法,即进程再运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了。

该策略实现起来简单,但也有明显的缺点

有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿

破环循环等待条件

循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。

可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完。

原理分析:一个进程只有已占有小编好的资源时,才有资源申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象。

该策略的缺点:

  1. 不方便增加新的设备,因为可能需要重新分配所有的编号。
  2. 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费。
  3. 必须按规定次序申请资源,用户编程麻烦。

死锁的处理策略-避免死锁

安全序列、不安全状态、死锁的联系

所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找到一个安全序列,系统就是安全状态。当然,安全序列可能有多个

如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之后总是要考虑到最坏的情况。

如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)

因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答案资源分配请求。这也是"银行家算法"的核心思想。

银行家算法

银行家算法是荷兰学者Dijkstra为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中,用于避免死锁

核心思想:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待。

银行家算法步骤:

  1. 检查次此次申请是否超过了之前声明的最大需求数
  2. 检查此时系统剩余的可用资源是否还能满足这次请求
  3. 试探着分配,更改各数据结构
  4. 用安全性算法检查此次分配是否会导致系统进入不安全状态

安全性算法步骤:

检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。

不断重复上述过程,看最终是否能让所有进程都加入安全序列。

死锁的处理策略--检测和解除

死锁的检测

为了能对系统是否已发生了死锁进行检测,必须:

  1. 某种数据结构来保存资源的请求和分配信息;
  2. 提供一种算法,利用上述信息来检测系统是否已进入死锁状态。

数据结构资源分配图:

  • 两种结点:
    • 进程结点:对应一个进程
    • 资源结点:对应一类资源,一类资源可能有多个
  • 两种边:
    • 进程结点->资源结点:表示进程想申请几个资源(每条边代表一个)
    • 资源节点->进程结点:表示已经为进程分配了几个资源(每条边代表一个)

image-20201208092613142

如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去。如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源的进程被激活,并顺利地执行下去。

相应的,这些被激活的进程执行完了之后又会归还一些资源,这样可能又会激活另外一些阻塞的进程..

如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)

如果最终不能消除所有边,那么此时就是发生了死锁

最终还连着边的那些进程就是处于死锁状态的进程。

检测死锁的算法:

  1. 在资源分配图中,找不到既不阻塞又不是孤点的进程Pi(即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。如上图,R1没有空闲资源,R2有一个空闲资源。若所有的链接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配变,使之成为孤立的结点。在上图中,P1是满足这一条件的进程结点,于是将P1的所有边消去。
  2. 进程Pi释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来阻塞进程可能变为非阻塞进程。在下图中,P2就满足这样的条件。根据1的方法进行一系列简化后,若能消去途中所有的边,则称该图是可完全简化的

死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁

死锁的解除

一旦检测出死锁的发生,就应该立即接触死锁。

补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图,还连着边的那些进程就是死锁进程

解除死锁的主要方法有:

  1. 资源剥夺法:挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应放着被挂起的进程长时间得不到资源而饥饿。
  2. 撤销进程法(或称终止进程法):强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方法的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来。
  3. 进程回退法:让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点。

如何决定"对谁动手":

  1. 进程优先级
  2. 已执行多长时间
  3. 还有多久能完成
  4. 进程已经使用了多少资源
  5. 进程是交互式的还是批处理式的
posted @ 2020-12-15 17:39  Ligo丶  阅读(934)  评论(0编辑  收藏  举报