进程基础认知
进程的认识
程序的定义
程序:一个指令序列
早期支支持单道程序
内存的情况
多道程序技术
内存的情况
pcb1就是系统为每个运行的程序配置一个数据结构,称为进程控制块(pcb),用来描述程序的各种信息(如程序代码存放的位置
PCB、程序段、数据段三部分构成了进程实体(进程)(进程影响
进程的定义
进程实体简称为进程
创建一个进程、实际上是创建PCB
撤销进程、就是撤销进程实体中的PCB
PCB是进程存在的唯一标志
进程的定义
程序的一次执行过程
一个程序及其数据在处理机上顺序执行时所发生的活动
具有独立功能的程序在数据集合上运行的过程,他是系统资源分配和调度的一个独立单位
也可以说
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位
进程实体和进程不一样
进程实体是静态的、进程是动态的
一般认为
进程实体就是进程
进程的组成
进程的管理者(操作系统)所需的数据都在PCB中
程序段、数据段是程序运行所需的数据、程序本身的运行所需的数据在程序段、数据段中
PCB是进程存在的唯一标志
进程的组织
进程的组成是一个进程内部
进程的组织是多个进程之间的组织方式
链接方式
执行指针:指当前处于运行态(执行态)的进程
就绪队列指针:指向当前处于就绪态的进程、通常会把优先级高的进程放在队头
阻塞队列指针:指向当前处于阻塞态的进程,很多操作系统还会根据阻塞原因的不同、再分为多个阻塞队列
索引方式
和链接的区别是
都有执行指针
就绪表指针、阻塞表指针
进程的特征
进程是资源分配、接受调度的基本单位
异步性会导致并发程序执行结果的不确定性
进程的状态与转换
进程的状态
进程就是程序的一次执行
为了方便对各个进程的管理,操作系统需要将进程合理的划分为几种状态
对运行态来说
根据核数来确定几个运行态
对于就绪来说
进程已经有除了处理机之外所有需要的资源,一旦获取处理机。即可立刻进行运行状态开始运行
对于阻塞态来说
等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机中最昂贵的部件,为了提高CPU的利用率,需要先将其他进程需要的资源分配到位,才能得到CPU的服务
操作系统需要完成创建进程。操作系统为该进程分配所需内存空间等系统资源,并为其创建、初始化PCB
进程开始运行前,需要进行相应的处理
还有进程运行结束(由于bug导致的)需要撤销进程
撤销进程的完成需要操作系统撤销进程相关的工作,完成将分配给进程的资源回收,撤销进程PCB等工作
进程状态转换
不能由阻塞态直接转换为运行态,也不能从就绪态转化为阻塞态(因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出这种请求
然后最后就是终止态
进程控制
什么是进程
进程控制的主要功能是对系统中的所有进程实施有效的管理措施,它具有创建新进程、撤销已有进程、实现进程转换等功能
进程控制简单理解就是实现进程状态转换
如何实现进程控制
创建进程:分配初始化PCB、分配系统资源
创建后会变成就绪态PCB内容和对应队列
就绪态道运行态需要恢复进程运行环境、修改PCB内容和相应队列
运行态到阻塞态需要保存进程运行环境、修改PCB内容和相应队列
阻塞态变就绪态需要修改PCB内容和对应队列。如果等待得是资源,则还会为进程分配系统资源
运行态到终止态需要回收进程拥有得资源、撤销PCB
运行态到就绪态需要(进程切换)保存进程运行环境、修改PCB内容和相应队列
原语
实现进程控制,特点是执行期间不允许中断,只能一气呵成
不可中断得操作叫原子操作
原语采用关中断指令和开中断指令实现,只允许在核心态下执行得特权命令
相关原语
进程控制会导致进程状态得转换
1.更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
a.所有的进程控制原语一定都会修改进程状态标志
b.剥夺当前运行进程的CPU使用权必然需要保存其运行环境
c.某进程开始运行前必然要恢复期运行环境
2.将PCB插入合适的队列
3.分配/回收资源
撤销原语:
就绪态/阻塞态/运行态---终止态---无
阻塞原语:
运行态---阻塞态
唤醒原语:
阻塞态--就绪态
阻塞原语唤醒原语需要成对使用
切换原语:运行态---阻塞态/就绪态
就绪态---运行态
进程通信
什么是进程通信
就是进程之间进行信息交换
进程是分配系统资源得单位(包括内存地址空间),因此各个进程拥有得内存地址空间相互独立
为了保证安全,进程之间不能直接访问
但可以信息交换在进程之间,为保证进程间得安全通信,操作系统提供了一些方法
共享存储
这两个进程对共享空间得访问必须是互斥的(互斥访问通过操作系统提供得工具实现)
操作系统只负责提供共享空间和同步互斥工具
基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、
限制多,是一种低级通信方式
基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
管道通信
管道就是指用于连接读写进程序得共享文件,又叫pipe文件,就是在内存中开辟一个固定大小得缓冲区
管道只能采用半双工通信,某个时间段只能实现单向的传输。要实现双向同时通信,需要设置两个管道
各个进程要互斥得访问管道
进程之间得传输数据只有在管道得数据写满后才可以传送或者写入
数据以字符流得形式写入管道,当管道写满,写进程得write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走,管道变空,此时读进程得read()系统调用将被阻塞
如果没有写满,不能读、没有读空,不允许写
数据一旦被读出,就会从管道中被抛弃,意味着读进程最多只能一个,否则可能出现读错数据的情况
消息传递
进程间的数据交换以格式化的消息为单位。进程通过为操作系统提供的“发送消息/接受消息”两个原语进行数据交换
格式化的消息分为消息头和消息体
消息传递又可以分为直接通信方式、间接通信方式
直接通信方式(把消息直接挂到接受进程的消息缓冲队列上
间接通信方式(信箱通信方式
线程概念和多线程模型
什么是线程
引入线程前
进程是程序执行流的最小单位
引入后
线程是程序执行流的最小单位
线程是基本的cpu执行单元
也是最小的程序执行流的最小单元
进程里有线程
引入线程后,不仅是进程之间可以并发,进程内的各线程之间也可并发,从而进一步提高了系统的并发性,使得一个进程内可以并发处理各种任务
进程只作为除了cpu之外的系统资源的分配单元(打印机、内存地址空间等都是分配给进程的)
线程进制的变化
同一进程内的线程的切换不需要切换进程的运行环境
线程的属性
线程控制块也是为了管理线程所创建的数据结构
线程的实现方式
用户级线程
用户级线程由应用程序通过线程库实现
所有的线程管理工作都有应用程序负责(包括线程切换
用户线程,线程切换可以在用户态下完成,无需操作系统干预
在用户看来,是有多线程。但操作系统内核看来,不会意识到线程的存在(用户极线程对用户不透明,对操作系统透明
用户级线程即使从用户视角能看到的线程
内核级线程
又叫内核支持的线程
内核级线程的管理工作由操作系统内核完成的。线程调度、切换等工作都由内核负责,因此内核级线程的切换必须在核心态下才能完成
内核级线程就是从操作系统内核视角看到的能看的线程
线程的实现方式
在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m个内核级线程上(n>=m)
操作系统只看见内核级线程,因此只有内核级线程才是处理机分配的单位
多线程模型
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题
多对一
多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程
优点
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点
当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行
一对一
一个用户及线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点
当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行
缺点
一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
多对多
n用户及线程映射到m个内核级线程(n>=m)。每个用户进程对应m个内核级线程。
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。