操作系统02.1

操作系统

进程的定义、组成、组织方式、特征

知识总览

introduce21.

进程的定义

程序:就是一个指令序列。

image-20221115163748462.

程序段:程序的代码放在程序段内。

数据段:程序运行过程处理的数据放在数据段内(如变量)。

image-20221115164046448.

为了方便操作系统管理,完成各程序并发执行,引入了进程进程实体的概念。

PCB、程序段、数据段三部分构成了进程实体进程映像)。

操作系统:内存中同时放入多道程序,各个程序的代码、运算数据存放的位置不同。操作系统要怎么才能找到各程序的存放位置呢?

答:系统为每个运行的程序配置一个数据结构,称为进程控制块(PCB),用来描述进程的各种信息(如程序代码存放位置)。

程序段、数据段、PCB 三部分组成了进程实体进程映像)。一般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程实体中的 PCB;而撤销进程,实质上是撤销进程实体中的 PCB。

注意:PCB 是进程存在的唯一标志

从不同的角度,进程可以有不同的定义,比较传统典型的定义有:

  1. 进程是程序的一次执行过程
  2. 进程是一个程序及其数据在处理机上顺序执行时所发生的活动
  3. 进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位。

以上定义强调 “动态性”。

引入进程实体的概念后,可把进程定义为:

进程是进程实体的运行过程,是系统进行资源分配调度的一个独立单位。

注:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过,除非题目专门考察二者区别,否则可以认为进程实体就是进程。因此我们也可以说 “进程由程序段、数据段、PCB 三部分组成”。

进程的组成

image-20221115170033808.

进程(进程实体)由程序段、数据段、PCB 三部分组成。

PCB:操作系统通过 PCB 来管理进程,因此 PCB 中应该包含操作系统对其进行管理所需的各种信息。

程序段:程序代码即存放在此。

数据段:程序运行时使用、产生的运算数据。如全局变量、局部变量、宏定义的常量 就存放在数据段内。

consistconsist2consist3.

进程的组织

在一个系统中,通常有数十、数百乃至数千个 PCB。为了能对他们加以有效的管理,应该用适当的方式把这些 PCB 组织起来。

注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题。

organization.

链接方式

image-20221116182031833.

索引方式

image-20221116182144797.

进程的特征

进程和程序是两个截然不同的概念,相比于程序,进程拥有以下特征:

feature.

review

review7.

进程的状态与转换

知识总览

introduce22.

进程的状态——三种基本状态

进程是程序的一次执行。在这个执行过程中,有时进程正在被 CPU 处理,有时又需要等待 CPU 服务,可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。

进程的三种基本状态:

status3.

进程的状态——另外两种状态

创建态:操作系统需要完成创建进程。操作系统为该进程分配所需的内存空间等系统资源,并为其创建、初始化 PCB(如:为进程分配 PID)

image-20221116192413923.

终止态:进程运行结束(或者由于 bug 导致进程无法继续执行下去,比如数组越界错误),需要撤销进程。

操作系统需要完成撤销进程相关的工作。完成将分配给进程的资源回收,撤销进程 PCB 等工作。

image-20221116192707239.

statusother2.

status5all.

进程状态的转换

image-20221116193808723.

操作系统完成创建进程的一系列工作后,进程从创建态转换到就绪态,此时就绪态的进程拥有除处理机资源外所有所需要的其他资源等待处理机的调度。就绪态的进程被 CPU(处理机) 调度,进程从就绪态转换为运行态,运行态的进程拥有所有所需的资源,包括处理机资源。处于运行态的进程有以下三种运行状况:① 当时间片到,或者处理机被优先级更高的进程抢占,此时处于运行态的进程会被放入就绪态中,等待以后被调用。②进程运行结束,或运行过程中遇到不可修复的错误,进程从运行态转换到终止态。③ 进程用 “系统调用” 的方式申请某种系统资源,或者请求等待某个事件发生,此时进程从运行态转换到阻塞态。阻塞态中的进程既没有所需的其他资源,更没有处理机资源。当阻塞态中的进程申请的资源被分配,或者等待的事件发生,进程的状态就转换为就绪态。

注意:

  1. 运行态 --> 阻塞态是一种进程自身做出的主动行为
  2. 阻塞态 --> 就绪态不是进程自身能控制的,是一种被动行为
  3. 不能由阻塞态直接转换为运行态,也不能由就绪态直接转换为阻塞态。(因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出这种请求)

review

review9.

进程控制

知识总览

introduce23.

什么是进程控制?

进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建进程、撤销已有进程、实现进程状态转换等功能。

简化理解:反正进程控制就是要实现进程状态转换

image-20221117154411884.

如何实现进程控制?

image-20221117154510569.

image-20221117154557263.

原语实现进程控制,原语的特点是执行期间不允许中断,只能一气呵成。

这种不可被中断的操作即原子操作

原语采用 “关中断指令” 和 “开中断指令” 实现。

这里提到的所有 “中断” 都是第一章中的 “系统调用”,一开始自己还纳闷,这个中断是什么鬼?后来才知道....

image-20221117155405023.

显然,关/开中断指令的权限非常大,必然是只允许在核心态下执行的特权指令

kernel.

进程控制相关的原语

学习技巧:进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:

  1. 更新 PCB 中的信息(如修改进程状态标志、将运行环境保存到 PCB、从 PCB 恢复运行环境)。
    • 所有的进程控制原语一定都会修改进程状态标志
    • 剥夺当前运行进程的 CPU 使用权必然需要保存其运行环境
    • 某进程开始运行前必然要恢复其运行环境。
  2. 将 PCB 插入合适的队列。
  3. 分配 / 回收资源。

进程的创建

processcreate.

进程的终止

processend.

进程的阻塞和唤醒

processblock.

注意:阻塞原语唤醒原语必须成对使用

进程的切换

processswitch.

review

review10.

各原语可以实现怎样的状态转换

各原语大概做了哪些事(理解即可)

进程通信

知识总览

introduce24.

什么是进程通信?

顾名思义,进程通信就是指进程之间的信息交换。

进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立

image-20221118095707731.

为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。

为了保证进程间的安全通信,操作系统提供了一些方法。

image-20221118095742791.

共享存储

image-20221118100046453.

两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。

操作系统只负责提供共享空间和同步互斥工具(如 P、V 操作)

共享存储:

  • 基于数据结构的共享:比如共享空间里只能放一个长度为 10 的数组。这种共享方式速度慢、限制多,是一种低级通信方式。
  • 基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。

管道通信

image-20221118100927475.

“管道” 是指用于连接读写进程的一个共享文件,又名 pipe 文件。其实就是在内存中开辟一个大小固定的缓存区。

注意:

  1. 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道
  2. 各进程要互斥地访问管道。
  3. 数据以字符流地形式写入管道,当管道写满时,写进程的 write() 系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的 read() 系统调用将被阻塞
  4. 如果没写满,就不允许读。如果没读空,就不允许写
  5. 数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。

消息传递

进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的 “发送消息/接收消息” 两个原语进行数据交换。

image-20221118102052547.

消息传递

  1. 直接通信方式:消息直接挂到接收进程的消息缓冲队列上。

image-20221118102543022.

  1. 间接通信方式:消息要先发送到中间实体(信箱)中,因此也称 “信箱通信方式”。eg. 计网中的电子邮件系统。

image-20221118102624219.

review

review11.

线程概念和多线程模型

知识总览

introduce25.

什么是线程,为什么要引入线程?

image-20221118112001222.

还没引入进程之前,系统中各个程序只能串行执行。

引入进程之后....

进程是程序的一次执行。但这些功能显然不可能是由一个程序顺序处理就能实现的。

image-20221118112314162.

有的进程可能需要 “同时” 做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了 “线程”,来增加并发度

传统的进程是程序执行流地最小单位。

引入线程后,线程成为了程序执行流的最小单位。

image-20221118112642987.

可以把线程理解为 “轻量级进程”。

线程是一个基本的 CPU 执行单位,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如 QQ 视频、文字聊天、传文件)。

引入线程后,进程只作为除 CPU 之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。

引入线程机制后,有什么变化?

threadchange.

类比:

去图书馆看书。

切换进程运行环境:有一个不认识的人要用桌子,你需要把你的书收走,他把自己的书放到桌子上。

同一进程内的线程切换:你的舍友要用你这张桌子,你可以不用把桌子上的书收走。

线程的属性

threadproperties.

线程的实现方式

用户级线程

用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)。

用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。

在用户看来,是有多个线程。但是操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)

可以这样理解,“用户级线程” 就是 “从用户角度看能看到的线程”。

image-20221118115136862.

内核级线程

内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此,内核级线程的切换必然需要在核心态下才能完成。

可以这样理解,“内核级线程” 就是 “从操作系统内核视角看能看到的线程”。

image-20221118115920889.

用户级线程+内核级线程

重点重点重点:操作系统只 “看得见” 内核级线程,因此只有内核级线程才是处理机分配的单位

image-20221118120340414.

例如:上面这个模型中,该进程有两个内核级线程,三个用户级线程。在用户看来,这个进程中有三个线程。但即使该进程在一个 4 核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行

多线程模型

在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了 “多线程模型” 问题。

多对一:

image-20221118163045952.

一对一:

image-20221118163247962.

多对多:

image-20221118163358072.

review

image-20221118163551054.

posted @ 2022-11-18 16:40  软柠柠吖  阅读(79)  评论(0编辑  收藏  举报