02_进程管理_1

进程管理

进程的概念、组成、特征

概念

程序:是静态的,就是个存放在磁盘里面的可执行文件,就是一系列指令的集合。

进程:是动态的,是程序的一次执行过程。

当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的“身份证号”——PID(PROCESS ID,进程ID)

PCB:

操作系统要记录PID、进程所属用户ID(UID)

进程分配了哪些资源(分配了多少内存、正在使用哪些设备、正在使用那些文件)

进程的运行情况(EG:CPU使用时间、磁盘使用情况、网络流量使用情况等)

这些信息被保存在一个数据结构PCB(Process Control Block)中,即进程控制块

组成

进程的组成——程序段、数据段(给进程自己用的,与进程自身的运行逻辑有关)

  • 程序段:程序的代码

  • 数据段:运行过程中产生的各种数据。

进程的组成——PCB(给操作系统用的)

  • 进程描述信息:进程标识符PID,用户标识符UID

  • 进程控制和管理信息:CPU、磁盘、网络流量使用情况统计; 进程当前的状态

  • 资源分配清单:

  • 处理机相关信息

程序段、数据段、PCB三部分组成了进程实体(进程映像)

引入进程实体的概念后,可把进程定义为:进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。

注意:PCB是进程存在的唯一标志!!!!!!很重要。

特征

进程拥有以下特征:

  • 动态性:进程是程序的一次执行过程,是动态的产生、变化和消亡的。
  • 并发性:内存中有多个进程实体,各进程可并发执行。
  • 独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位。
  • 异步性:各进程按各自独立的、不可预知的速度向前推进,操作系统要提供“进程同步机制”来解决异步问题。
  • 结构性:每个进程都会配置一个PCB。结构上看,进程由数据段、程序段和PCB组成。

进程的状态与转换、进程的组织

进程的状态

  • 创建态:(新建态,New):进程正在被创建,操作系统为进程分配资源,初始化PCB。

  • 就绪态:(Ready):已经具备运行条件,但由于没有空闲CPU,而暂时不能运行。

  • 运行态:(Running):占有CPU,并在CPU上运行。

  • 阻塞态:(Waiting/Blocked,等待态):因等待某一事件而暂停不能运行。

  • 终止态:(Terminated,结束态):进程正在从系统中撤销,操作系统会回收进程拥有的资源、撤销PCB

进程PCB中,会有一个变量state来表示进程的当前状态。如:1表示创建态,2表示就绪态,3表示运行态......

为了对同一个状态下的各个进程进行统一的管理,操作系统会将各个进程的PCB组织起来。

进程的转换

进程五状态模型:

image-20230921232031179

此外还有七状态模型,老师上课详细讲解了

image-20230921232450246

进程的组织

链接方式

  • 按照进程状态将PCB分为多个队列
  • 操作系统持有指向各个队列的指针

image-20231018103445261

索引方式(了解)

  • 根据进程状态的不同,建立几张索引表
  • 操作系统持有指向各个索引表的指针。

image-20231018103607931

进程控制

进程控制概念

进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。

简化理解:实现进程状态转换。

怎样实现进程控制

  • 为什么进程控制(状态转换)的过程要“一气呵成”?(使用原语的原因)

  • 如何实现原语的“原子性”?

原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性。

CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。

  • 进程控制相关的原语

image-20231018110411573

image-20231018110442845

image-20231018111111766

image-20231018111317305

阻塞和唤醒要

成对出现。

无论在哪一个进程控制原语,要做的无非三类事情:

  1. 更新PCB中的信息:(修改进程状态(state),保存/恢复运行环境)。
  2. 将PCB插入合适的队列
  3. 分配/回收资源。

进程通信(IPC)

进程间通信(Inter-Process Communication,IPC)是指两个进程之间产生数据交互.

为什么进程通信需要操作系统支持?

进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。

为了保证安全,一个进程不能直接访问另一个进程的地址空间。

共享存储

image-20231025101620500

为避免出错,各个进程对共享空间的访问应该是互斥的。

  • 基于存储区的共享(高级):操作系统在内存中划出一块共享存储区,数据的形式、存放位置都是由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。
  • 基于数据结构的共享(低级):比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。

消息传递

传递结构化的消息(消息头/消息体)

直接通信方式

image-20231025110458054

间接通信方式

通过一个中间实体——“信箱”进行通信。

image-20231025110605827

管道通信

“管道”是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区。

image-20231025110652982

  1. 管道只能采用半双工通信,某一段时间内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
  2. 各进程要互斥的访问管道。(由操作系统控制)
  3. 当管道写满时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程。
  4. 当管道读空时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程。
  5. 管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此通常产生两种解决方案:①一个管道允许多个写进程,一个读进程;②允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据。(Linux的方案。)

线程的概念

什么是线程,为什么引入线程?

在还没有引入进程之前,系统中的各个程序只能串行执行。

引入进程后——

image-20231025143837812

有的进程可能需要“同时”做很多事,而传统的进程只能串行的执行一系列程序。为此,引入了“线程”,来增加并发度。

image-20231025144159294

引入线程后,线程成了程序执行流的最小单位。可以理解为轻量级进程。

线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程后,不仅是进程之间可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务。

引入线程后,进程只作为除CPU之外的系统资源分配单元(如打印机、内存地址空间等都是分配给进程的)

引入线程机制后,有什么变化

  1. 资源分配、调度
    • 传统进程机制中,进程是资源分配、调度的基本单位。
    • 引入线程后,进程是资源分配的基本单元,线程是调度的基本单元。
  2. 并发性
    • 传统进程机制中,只能进程间并发。
    • 引入线程后,各线程间也能并发,提升了并发度
  3. 系统开销
    • 传统的进程间并发,需要切换进程的运行环境,系统开销大
    • 线程间并发,如果是统一进程内的线程切换,则不需要切换进程环境,系统开销小
    • 引入线程后,并发所带来的系统开销减小。

线程的属性

  1. 线程是处理机调度的单位。
  2. 多CPU计算机中,各个线程可占用不同的CPU。
  3. 每个线程都有一个线程ID、线程控制块(TCB)。
  4. 线程也有就绪、阻塞、运行三种基本状态。
  5. 线程几乎不拥有系统资源。
  6. 同一进程的不同线程间共享进程的资源。
  7. 由于共享内存地址空间,统一进程中的线程间通信甚至无需系统干预。
  8. 同一进程中的线程切换,不会引起进程切换。
  9. 不同进程中的线程切换,会引起进程切换。
  10. 切换同进程内的线程,系统开销很小。
  11. 切换进程,系统开销大。

线程的实现方式和多线程模型

线程的实现方式

历史背景:早期的操作系统(eg:早期Unix)只支持进程,不支持线程。当时的“线程”是由线程库实现的。

image-20231025172149794

用户级别线程

从用户视角能看到的线程,由线程库实现。

很多编程语言提供了强大的线程库,可以实现线程的创建、销毁、调度等功能。

  1. 线程的管理工作由谁来完成?

用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责。(包括线程切换)

  1. 线程切换是否需要CPU变态?

用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。

  1. 操作系统是否能意识到用户级线程的存在?

在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。

用户级线程就是“从用户视角看能看到的线程。”

  1. 这种线程的实现方式有什么优缺点?
  • 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
  • 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可以在多核处理机上并行运行。

内核级线程

从操作系统视角看到的线程,由操作系统实现内核级线程才是处理机分配的单位。

  1. 线程的管理工作由谁来完成?

    操作系统内核。

  2. 线程切换是否需要CPU变态?

    线程调度、切换等工作都由操作系统内核完成,因此内核级程序的切换必须需要在核心态下才能完成。

  3. 操作系统是否能意识到用户级线程的存在?

    操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块)通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程

  4. 这种线程的实现方式有什么优缺点?

  • 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
  • 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

多线程模型

一对一模型

一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。

缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

多对一模型

多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。

优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高

缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行

重点:操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。

多对多模型

n用户及线程映射到m个内核级线程(n>=m)。每个用户进程对应m个内核级线程。

克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。

可以这么理解:
用户级线程是“代码逻辑”的载体
内核级线程是“运行机会”的载体

内核级线程才是处理机分配的单位。

一段“代码逻辑”只有获得了“运行机会”才能被CPU执行

内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞

线程的状态与转换

线程的状态和转换

和进程类似,如下图:

image-20231025174244092

线程的组织与控制

image-20231025174812122

posted @ 2023-09-15 11:03  彬彬zhidao  阅读(13)  评论(0编辑  收藏  举报