[OS] 线程相关知识点
操作系统中引入进程的目的,是为了描述和实现多个程序的并发执行,以改善资源利用率以及提高系统吞吐量。
那为什么还需要引入线程呢?下面我们先来回顾一下什么是进程:
进程有两个基本属性:
·资源的拥有者:给每个进程分配一虚拟地址空间,保存进程影像,控制一些资源(文件、I/O设备),有状态、优先级、调度。
·调度单位:进程是一个执行轨迹。
这两个属性构成了进程并发执行的基础。
因此使用进程来实现并发运行时,系统则必须完成以下操作:
创建进程:
当进程被创建时,系统要为它分配PCB表及其它必要的资源,如内存等。
撤销进程:
当进程被撤消时,系统要收回这些资源及PCB表等,因此系统必须付出一定的开销。
进程切换:
当进程运行时,进程的切换现象更会大量存在,由于要保留当前执行进程的CPU现场和为选中执行的进程重布现场,更需较大的开销。
缺点:时间空间开销大,限制并发程度的提高
线程的引入目的:减少进程切换和创建开销,提高执行效率和节省资源。
实现:将进程的资源申请和调度属性分开。即进程作为资源的申请和拥有者,但不作为调度的基本单位,这样,就产生了线程的概念。
线程:是进程中的一个实体,是独立调度和分派的基本单位。
从下图可以看出单线程进程和多线程进程的区别:
从上图可以看出线程的一些基本性质:
线程是CPU运行的一个基本单元,包括程序计数器、寄存器集和栈空间。
一个线程与它的对等线程共享代码段、数据段以及操作系统资源。
一个传统重量级的进程只有单个控制线程。
多线程编程的好处:
·响应度高:如果一个交互程序采用多线程,那么即使其部分阻塞或执行较冗长的操作,该程序仍能继续执行,从而增加了对用户的响应程度。例如,多线程Web浏览器在用一个线程装入图像时,能通过另一个线程与用户交互。
·资源共享:线程默认共享它们所属进程的内存和资源。代码和数据共享的优点是它能允许一个应用程序在同一地址空间有多个不同的活动线程。
·经济:进程创建所需的内存和资源的分配比较昂贵。由于线程能共享它们所属进程的资源,所以创建和切换线程会更为经济。
·多处理器体系结构的利用:多线程的优点之一是能充分使用多处理器体系结构,以便每个进程能并行运行在不同处理器上。不管有多少CPU,单线程进程只能运行在一个CPU上。在多CPU上使用多线程加强了并发功能。
用户级线程和内核级线程区别:
·线程的调度与切换时间
用户级线程的切换通常发生在一个应用进程的多个线程之间,无须通过中断进行OS的内核,且切换规则也简单,因此其切换速度特别快。而内核级线程的切换时间相对比较慢。
·系统调用
用户级线程调用系统调用时,内核不知道用户级线程的存在,只是当作是整个进程行为,使进程等待并调度另一个进程执行,在内核完成系统调用而返回时,进程才能继续执行。而内核级线程则以线程为单位进行调度,当线程调度系统调用时,内核将其作为线程的行为,因此阻塞该线程,可以调度该进程中的其他线程执行。
·线程执行时间
如果用户设置了用户级线程,系统调用是以进程为单位进行的,但随着进程中线程数目的增加,每个线程得到的执行时间就少。而如果设置的是内核级线程,则调度以线程为单位,因此可以获得良好的执行时间。
多线程问题
·系统调用fork()和exec()
如果程序中的一个线程调用fork(),新进程会复制所有线程,还是单个线程?
Case 1:如果fork()之后立即调用exec(),没有必要复制所有线程。因为exec参数所指定的程序会替换整个过程。
Case 2:不调用exec(),应该复制所有线程。
·取消
线程取消就是在线程结束前终止线程的任务。
比如多线程并发执行搜索数据库,其中一个获取到结果,那么其他的线程就可以取消。
实现线程取消有两种方法:
(1)异步取消:一个线程立即终止目标线程。
(2)延迟取消:允许目标线程不断地检查它是否应终止,允许目标线程有机会以有序的方式终止自己。
·信号处理
信号在UNIX系统中用来通知进程某个特定的事件发生了。
信号都具有相同的模式:
(1)信号是由特定事件的发生所产生的。
(2)产生的信号要发送到进程。
(3)一旦发送,信号必须加以处理。
在单线程程序中信号处理比较直接,信号总是发送给进程;但对于多进程程序,发送信号就比较复杂,因为进程可能有多个线程,因此,信号发送有以下选择:
(1)发送信号到信号所应用的进程。
(2)发送信号到进程内的每个线程。
(3)发送信号到进程内的某些固定线程。
(4)规定一个特定线程以接收进程的所有信号。
发送信号的方法依赖于产生信号的类型。
·线程池
线程池的主要思想是在进程开始时创建一定数量的线程,并放入到池中以等待工作。当服务器收到请求时,它会唤醒池中的一个线程(如果有可用的线程),并将要处理的请求传递给它。一旦线程完成了服务,它会返回到池中再等待工作。如果池中没有可用的线程,那么服务器会一直等待直到有空线程为止。
使用线程池的优点:
(1)通常用现有线程处理请求要比等待创建新的线程要快。
(2)线程池限制了在任何时候可用线程的数量。这对那些不能支持大量并发线程的系统非常重要。
·线程特定数据
允许每一个线程有自己的数据副本。
·调度程序激活