《Linux内核设计与实现》第八周读书笔记——第四章 进程调度
《Linux内核设计与实现》第八周读书笔记——第四章 进程调度
第4章 进程调度
调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行态进程之间分配有限的处理器时间资源的内核子系统。调度程序没有太复杂的原理,最大限度地利用处理器时间的原则是只要有可以执行的进程,那么就总会有进程正在执行,但是只要系统中可运行的进程的数目比处理器的个数多,就注定某一给定时刻会有一些进程不能执行,这些进程在等待运行,在一组处于可运行状态的进程中,选择―个来执行,是调度程序所需完成的基本工作。-
4.1 多任务
-
多任务操作系统:同时并发地交互执行多个进程的操作系统
多任务操作系统会使多个进程处于堵塞或者睡眠状态。这些任务尽管位于内存,但是并不处于可运行状态。这些进程利用内核堵塞自己,直到某一事件发生。
多任务系统可以划分为两类:非抢占式和抢占式。
抢占:强制挂起。
时间片:分配给每个可运行进程的处理器时间段。
4.2 Linux 的进程调度
- 从1991年Linux的第1版到后来的2.4内核系列,Linux的调度程序都相当简陋,设计近乎原始,当然它很容易理解,但是它在众多可运行进程或者多处理器的环境下都难以胜任,正因为如此,在Linux 2.5开发系列的内核中,调度程序做了大手术,开始采用了一种叫做O(1)调度程序的新调度程序——它是因为其算法的行为而得名的。
- 它解决了先前版本Linux调度程序的许多不足,引入了许多强大的新特性和性能特征,这里主要要感谢静态时间片算法和针对每一处理器的运行队列,它们帮助我们摆脱了先前调度程序设计上的限制。
- O(1)调度器虽然在拥有数以十计(不是数以百计)的多处理器的环境下尚能表现出近乎完美的性能和可扩展性,但是时间证明该调度算法对于调度那些响应时间敏感的程序却有一些先天不足,这些程序我们称其为交互进程一它无疑包括了所有需要用户交互的程序,正因为如此,O(1)调度程序虽然对于大服务器的工作负载很理想,但是在有很多交互程序要运行的桌面系统上则表现不佳,因为其缺少交互进程,自2.6内核系统开发初期,开发人员为了提高对交互程序的调度性能引入了新的进程调度算法,其中最为著名的是“反转楼梯最后期限调度算法,该算法吸取了队列理论,将公平调度的概念引入了Linux调度程序。并且最终在2.6.23内核版本中替代了O(1)调度算法,它此刻被称为“完全公平调度算法”,或者简称CFS。
4.3 策略
1.I/O消耗型和处理器消耗型的进程
- I/O消耗型进程
- 进程的大部分时间用来提交I/O请求或者等待I/O请求
- 多数用户图形界面(GUI)都属于I/O密集型
- 处理器耗费型
- 时间大多数用在执行代码上
- 例如MATLAB
- 往往要延长运行时间并降低调度频率
2.进程优先级
调度算法中最基本的一类就是基于优先级的调度,这是一种根据进程的价值和其对处理器时间的需求来对进程分级的想法。
通常做法:
优先级高的进程先运行,低的后运行,相同优先级的进程按轮转方式进行调度(一个接一个,重复进行)。
优先级分为两类:
- 第一种是用nice值(―20~+19)
- 默认值为0;数值越大意味着优先级越低;可以通过 ps-el查看系统进程列表并找到NI标记列对应的优先级
第二种范围是实时优先级(0~99):
- 越高的实时优先级级数意味着进程优先级越高
3.时间片
时间片:一个数值,它表明进程在被抢占前所能持续运行的时间。
调度策略必须确定一个默认的时间片。
Linux的CFS调度器并没有直接划分时间片到进程,而是将处理器的使用比例划分给了进程。
4.调度策略的活动
4.4 Linux调度算法
4.4.1 调度器类
- Linux调度器是以模块方式提供的,这样做的目的是允许不同类型的进程可以有针对性地选择调度算法。这种模块化结构被称为调度器类。
- 它允许多种不同的可动态添加的调度算法并存,调度属于自己范畴的进程。
- 每个调度器都有一个优先级,基础的调度器代码定义在sched_fair.c文件中,它会按照优先级顺序遍历调度类,拥有一个可执行进程的最高优先级的调度器类胜出,去选择下面要执行的那一个程序。完全公平调度(CS)是一个针对普通进程的调度类,在Linux中称为SCHED_NORMAL。
4.4.2 Unix 系统中的进程调度
4.4.3 公平调度
4.5 Linux调度的实现
4.5.1 时间记账
- 1.调度器实体结构
- 2.虚拟实时
4.5.2 进程选择
- 1.挑选下一个任务
- 2.向树中加入进程
4.5.3 调度器入口
进程调度的主要入口点是schedule(),它定义在文件kernel/sched.c中。
4.5.4 睡眠和唤醒
4.6 抢占和上下文切换
由定义在kernel/sched.c中的context_switch()函数负责处理。当一个新的进程被选出来准备投入运行的时候,schedule()就会调用该函数。它完成了下面两项基本工作:
调用声明在<asm/mmu_contesxt.h>中的switch_mm(),该函数负责把虚拟内存从上一个进程映射切换到新进程中。
调用声明在<asm/system.h>中的switch_to(),该函数负责从上一个进程的处理器状态切换到新进程的处理器状态。
4.6.1用户抢占
发生在:
从系统调用返回用户空间时。
从中断处理程序返回用户空间时。
4.6.2内核抢占
只要没有持有锁,内核就可以发生抢占。
发生在:
中断处理程序正在执行,且返回内核空间之前。
内核代码再一次具有可抢占性的时候。
如果内核空间中的任务显式地调用schedule()。
如果内核中的任务阻塞。(也会调用schedule())。
4.7 实时调度策略
4.8 与调度相关的系统调用
4.8.1 与调度策略和优先级相关的系统调用
- sched_setscheduler()和 sched_getscheduler()分别用于设置和获取进程的调度策略和实时优先级。与其他的系统调用相似,它们的实现也是由许多参数检查、初始化和清理构成的。其实最重要的工作在于读取或改写进程task_struct的policy和rt_priority的值。
- sched_setscheduler()和 sched_getscheduler()分别用于设置和获取进程的实时优先级。这两个系统调用获取封装在sched_param特殊结构体的rt_priority中。实时调度策略的的最大优先级:是MAX_ USERRT_PRIO减1。最小优先级等于1。
- 对于―个普通的进程,nice函数可以将给定进程的静态优先级增加一个给定的量。只有超级用户才能在调用它时使用负值,从而提高进程的优先级。nice函数会调用内核的set_user_nice函数,这个函数会设置进程的的task_struct的static_prio值。