02_进程管理_1

进程管理

进程的概念、组成、特征

概念

程序：是静态的，就是个存放在磁盘里面的可执行文件，就是一系列指令的集合。

进程：是动态的，是程序的一次执行过程。

当进程被创建时，操作系统会为该进程分配一个唯一的、不重复的“身份证号”——PID（PROCESS ID，进程ID）

PCB：

操作系统要记录PID、进程所属用户ID（UID）

进程分配了哪些资源（分配了多少内存、正在使用哪些设备、正在使用那些文件）

进程的运行情况（EG：CPU使用时间、磁盘使用情况、网络流量使用情况等）

这些信息被保存在一个数据结构PCB（Process Control Block）中，即进程控制块

组成

进程的组成——程序段、数据段（给进程自己用的，与进程自身的运行逻辑有关）

程序段：程序的代码
数据段：运行过程中产生的各种数据。

进程的组成——PCB（给操作系统用的）

进程描述信息：进程标识符PID，用户标识符UID
进程控制和管理信息：CPU、磁盘、网络流量使用情况统计；进程当前的状态
资源分配清单：
处理机相关信息

程序段、数据段、PCB三部分组成了进程实体（进程映像）

引入进程实体的概念后，可把进程定义为：进程是进程实体的运行过程，是系统进行资源分配和调度的一个独立单位。

注意：PCB是进程存在的唯一标志！！！！！！很重要。

特征

进程拥有以下特征：

动态性：进程是程序的一次执行过程，是动态的产生、变化和消亡的。
并发性：内存中有多个进程实体，各进程可并发执行。
独立性：进程是能独立运行、独立获得资源、独立接受调度的基本单位。
异步性：各进程按各自独立的、不可预知的速度向前推进，操作系统要提供“进程同步机制”来解决异步问题。
结构性：每个进程都会配置一个PCB。结构上看，进程由数据段、程序段和PCB组成。

进程的状态与转换、进程的组织

进程的状态

创建态：（新建态，New）：进程正在被创建，操作系统为进程分配资源，初始化PCB。
就绪态：(Ready)：已经具备运行条件，但由于没有空闲CPU，而暂时不能运行。
运行态：(Running)：占有CPU，并在CPU上运行。
阻塞态：(Waiting/Blocked，等待态)：因等待某一事件而暂停不能运行。
终止态：(Terminated,结束态)：进程正在从系统中撤销，操作系统会回收进程拥有的资源、撤销PCB

进程PCB中，会有一个变量state来表示进程的当前状态。如：1表示创建态，2表示就绪态，3表示运行态......

为了对同一个状态下的各个进程进行统一的管理，操作系统会将各个进程的PCB组织起来。

进程的转换

进程五状态模型：

此外还有七状态模型，老师上课详细讲解了

进程的组织

链接方式

按照进程状态将PCB分为多个队列
操作系统持有指向各个队列的指针

索引方式（了解）

根据进程状态的不同，建立几张索引表
操作系统持有指向各个索引表的指针。

进程控制

进程控制概念

进程控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新进程、撤销已有进程、实现进程状态转换等功能。

简化理解：实现进程状态转换。

怎样实现进程控制

为什么进程控制（状态转换）的过程要“一气呵成”？（使用原语的原因）
如何实现原语的“原子性”？

原语的执行具有原子性，即执行过程只能一气呵成，期间不允许被中断。可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性。

CPU执行了关中断指令之后，就不再例行检查中断信号，直到执行开中断指令之后才会恢复检查。

进程控制相关的原语

阻塞和唤醒要

成对出现。

无论在哪一个进程控制原语，要做的无非三类事情：

更新PCB中的信息：（修改进程状态（state），保存/恢复运行环境）。

将PCB插入合适的队列

分配/回收资源。

进程通信（IPC）

进程间通信（Inter-Process Communication,IPC）是指两个进程之间产生数据交互.

为什么进程通信需要操作系统支持？

进程是分配系统资源的单位（包括内存地址空间），因此各进程拥有的内存地址空间相互独立。

为了保证安全，一个进程不能直接访问另一个进程的地址空间。

共享存储

为避免出错，各个进程对共享空间的访问应该是互斥的。

基于存储区的共享（高级）：操作系统在内存中划出一块共享存储区，数据的形式、存放位置都是由通信进程控制，而不是操作系统。这种共享方式速度很快，是一种高级通信方式。

基于数据结构的共享（低级）：比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多，是一种低级通信方式。

消息传递

传递结构化的消息（消息头/消息体）

直接通信方式

间接通信方式

通过一个中间实体——“信箱”进行通信。

管道通信

“管道”是一个特殊的共享文件，又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区。

管道只能采用半双工通信，某一段时间内只能实现单向的传输。如果要实现双向同时通信，则需要设置两个管道。
各进程要互斥的访问管道。（由操作系统控制）
当管道写满时，写进程将阻塞，直到读进程将管道中的数据取走，即可唤醒写进程。
当管道读空时，读进程将阻塞，直到写进程往管道中写入数据，即可唤醒读进程。
管道中的数据一旦被读出，就彻底消失。因此，当多个进程读同一个管道时，可能会错乱。对此通常产生两种解决方案：①一个管道允许多个写进程，一个读进程；②允许有多个写进程，多个读进程，但系统会让各个读进程轮流从管道中读数据。（Linux的方案。）

线程的概念

什么是线程，为什么引入线程？

在还没有引入进程之前，系统中的各个程序只能串行执行。

引入进程后——

有的进程可能需要“同时”做很多事，而传统的进程只能串行的执行一系列程序。为此，引入了“线程”，来增加并发度。

引入线程后，线程成了程序执行流的最小单位。可以理解为轻量级进程。

线程是一个基本的CPU执行单元，也是程序执行流的最小单位。引入线程后，不仅是进程之间可以并发，从而进一步提升了系统的并发度，使得一个进程内也可以并发处理各种任务。

引入线程后，进程只作为除CPU之外的系统资源分配单元（如打印机、内存地址空间等都是分配给进程的）

引入线程机制后，有什么变化

资源分配、调度
- 传统进程机制中，进程是资源分配、调度的基本单位。
- 引入线程后，进程是资源分配的基本单元，线程是调度的基本单元。
并发性
- 传统进程机制中，只能进程间并发。
- 引入线程后，各线程间也能并发，提升了并发度
系统开销
- 传统的进程间并发，需要切换进程的运行环境，系统开销大
- 线程间并发，如果是统一进程内的线程切换，则不需要切换进程环境，系统开销小
- 引入线程后，并发所带来的系统开销减小。

线程的属性

线程是处理机调度的单位。
多CPU计算机中，各个线程可占用不同的CPU。
每个线程都有一个线程ID、线程控制块（TCB）。
线程也有就绪、阻塞、运行三种基本状态。
线程几乎不拥有系统资源。
同一进程的不同线程间共享进程的资源。
由于共享内存地址空间，统一进程中的线程间通信甚至无需系统干预。
同一进程中的线程切换，不会引起进程切换。
不同进程中的线程切换，会引起进程切换。
切换同进程内的线程，系统开销很小。
切换进程，系统开销大。

线程的实现方式和多线程模型

线程的实现方式

历史背景：早期的操作系统（eg：早期Unix）只支持进程，不支持线程。当时的“线程”是由线程库实现的。

用户级别线程

从用户视角能看到的线程，由线程库实现。

很多编程语言提供了强大的线程库，可以实现线程的创建、销毁、调度等功能。

线程的管理工作由谁来完成？

用户级线程由应用程序通过线程库实现，所有的线程管理工作都由应用程序负责。（包括线程切换）

线程切换是否需要CPU变态？

用户级线程中，线程切换可以在用户态下即可完成，无需操作系统干预。

操作系统是否能意识到用户级线程的存在？

在用户看来，是有多个线程。但是在操作系统内核看来，并意识不到线程的存在。

用户级线程就是“从用户视角看能看到的线程。”

这种线程的实现方式有什么优缺点？

优点：用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高。
缺点：当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高。多个线程不可以在多核处理机上并行运行。

内核级线程

从操作系统视角看到的线程，由操作系统实现内核级线程才是处理机分配的单位。

线程的管理工作由谁来完成？

操作系统内核。
线程切换是否需要CPU变态？

线程调度、切换等工作都由操作系统内核完成，因此内核级程序的切换必须需要在核心态下才能完成。
操作系统是否能意识到用户级线程的存在？

操作系统会为每个内核级线程建立相应的TCB（Thread Control Block,线程控制块）通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程”
这种线程的实现方式有什么优缺点？

优点：当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多核处理机上并行执行。
缺点：一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。

多线程模型

一对一模型

一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

优点：当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多核处理机上并行执行。

缺点：一个用户进程会占用多个内核级线程，线程切换由操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。

多对一模型

多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。

优点：用户级线程的切换在用户空间即可完成，不需要切换到核心态，线程管理的系统开销小，效率高

缺点：当一个用户级线程被阻塞后，整个进程都会被阻塞，并发度不高。多个线程不可在多核处理机上并行运行

重点：操作系统只“看得见”内核级线程，因此只有内核级线程才是处理机分配的单位。

多对多模型

n用户及线程映射到m个内核级线程（n>=m)。每个用户进程对应m个内核级线程。

克服了多对一模型并发度不高的缺点（一个阻塞全体阻塞)，又克服了一对一模型中一个用户进程占用太多内核级线程，开销太大的缺点。

可以这么理解：
用户级线程是“代码逻辑”的载体
内核级线程是“运行机会”的载体

内核级线程才是处理机分配的单位。

一段“代码逻辑”只有获得了“运行机会”才能被CPU执行

内核级线程中可以运行任意一个有映射关系的用户级线程代码，只有两个内核级线程中正在运行的代码逻辑都阻塞时，这个进程才会阻塞

线程的状态与转换

线程的状态和转换

和进程类似，如下图：

线程的组织与控制

posted @ 2023-09-15 11:03 彬彬zhidao 阅读(53) 评论(0) 收藏举报

刷新页面返回顶部

binbinzhidao