死锁
一、死锁的概念
1、死锁的定义
如果一组进程中的每个进程都在等待仅由该组进程中的其他进程才能引发的事件发生,那么该组进程是死锁的
2、死锁产生的必要条件
产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源有被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放
循环等待条件:存在一阵进程资源的循环等待链,链中的每个进程已获得的资源同时被下一个进程所请求
小贴士:发生死锁时一定要循环等待,但是发生循环等待时未必死锁(循环等待是死锁的必要不充分条件)
3、死锁的发生时机
对系统资源的竞争。各进程对不可剥夺的资源(如打印机)的竞争可能引起死锁,对可剥夺的资源(CPU)的竞争是不会引起死锁的
进程推进顺序非法。请求和释放资源的顺序不当,也同样会导致死锁。
信号量的实验不当也会造成死锁。
总之,对不可剥夺资源的不合理分配,可能导致死锁
4、死锁的处理策略
预防死锁:破坏死锁产生的四个必要条件中的一个或几个
避免死锁:用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
死锁的检测和解除:允许死锁的发生,不过操作系统会负责死检测出死锁的发生,然后采取某种措施解除死锁
二、预防死锁
1、破坏互斥条件
互斥条件:只有对必须互斥使用的资源才会导致死锁
如果不只能互斥使用的资源改造成允许共享使用,则系统不会进入死锁状态。比如:SPOOLing技术。操作系统可以采用SPOOLing技术把独占设备在逻辑上改造成共享设备。比如:用SPOOLing技术将打印机改造为共享设备
该策略的缺点:并不是所有的资源都可以改造成共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件
2、破坏不可剥夺条件
不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺命,只能主动释放
破坏不剥夺条件:
- 当某个进程请求新的资源得不到满足时,它必须立即释放保存的所有资源,待以后需要时在重新申请。也就是说,及时某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺资源
- 当某个进程需要的资源被其他进程所占用的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
该策略的缺点:
- 实现起来比较复杂
- 释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保护和恢复状态的资源,如CPU
- 反复地申请和释放资源会增加系统开销,降低系统吞吐量
- 若采用破坏互斥条件,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿
3、破坏请求和保存条件
请求和保存条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占用,此时请求进程被阻塞,但又对自己已有的资源保持不放
可以采用静态分配方法,即进程在运行前一次申请完它所需的全部资源,在它的资源未满足前不让它允许。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了
缺点:有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿
4、破坏循环等待条件
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求
可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完
原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待现象
缺点:
- 不方便增加新的设备,因为可能需要重新分配所有的编号
- 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费
- 必须按规定次序申请资源,用户编程麻烦
三、避免死锁
1、什么是安全序列
- 安全序列:就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个。
- 如果分配了资源之后,系统中找不到任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况
- 如果系统处于安全状态,就一定不会发生死锁如果系统进入不安全状态,就可能发生死锁(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)
- 因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这也是“银行家算法“的核心思想
2、银行家算法
这个自己看吧(我太懒了)
四、检测和解除
1、知识总览
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁。在这种情况下,系统应当提供两个算法:
- 死锁检测算法:用于检测系统状态,以确定系统中是否发生了死锁
- 死锁解除算法:当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来
2、死锁的检测
为了能对系统是否已经发生了死锁进行检测,必须:
- 用某种数据结构来保存资源的请求和分配信息
- 提供一种算法,利用上述信息来检测系统是否已进入死锁状态
数据结构资源分配图:
- 两种结点:
- 进程结点:对应一个进程
- 资源结点:对应一类资源,一类资源可能有多个
- 两种边:
- 进程结点 --> 资源结点:表示进程想申请几个资源(每条边代表一个)
- 资源结点 --> 进程结点:表示已经为进程分配了几个资源(每条边代表一个)
如图:
如果能消除所有边,就称这个图是可完全简化的。此时一定没有发生死锁(相当于能找到一个安全序列)
如果最终不能消除所有边,那么此时就是发生了死锁
最终还连着边的那些进程就是处于死锁状态的进程
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁
3、死锁的解除
一旦检测出死锁的发生,就应该立即解除死锁
补充:并不是系统中所有的进程都是死锁状态,用死锁检测算法化简资源分配图后,还连着边的那些进程就是死锁进程
解除死锁的主要方法有:
- **资源剥夺法 **:挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿
- 撤销进程法(或称终止进程法):强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的有的是简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长的时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来
- 进程回退法 :让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点