第八节 进程的切换和系统的一般执行过程
By 20135203齐岳
本周的主要内容:
- Linux中进程调度的基本概念与相关知识
- schedule函数如何实现进程调度
- Linux进程的执行过程(一般情况与特殊情况)
- 宏观描述Linux系统执行
进程切换的主要代码switch_to
进程的调度时机与进程的切换
不同类型进程的不同调度需求
第一种分类:
-
I/O-bound:频繁进行I/O,并且需要花费很多时间等待I/O完成
-
CPU-bound:计算密集,需要大量的CPU时间进行运算
第二种分类:
-
批处理进程:不必与用户交互,常在后台进行;不必很快响应(典型的批处理系统:编译程序、科学计算)。
-
实时进程:有实时需求,不应被低优先级进程阻塞,响应时间短、要稳定(典型的实时进程:视频/音频、机械控制等)。
-
交互式进程:需要经常与用户交互,因此要花很多时间等待用户输入操作,响应时间要快,平均延迟要低(典型的交互式程序:shell、文本编辑程序、图形应用程序)。
Linux中的进程调度
调度策略:是决定什么时候以怎样的方式选择一个新进程运行的规则。Linux中的调度是多种策略和调度算法的组合。
Linux既支持普通的分是进程。也支持实时进程。Linux的调度基于分时和优先级。
Linux根据进程的优先级进行排队
-
根据特定的算法计算出进程的优先级,用一个值表示,这个值表示把进程如何适当的分配给CPU。
-
Linux中进程的优先级是动态的,调度程序会根据进程行为的周期性调整进程的优先级。(较长时间未分配到CPU的进程优先级升高,已在CPU上运行了较长时间的进程优先级下降)
内核中的调度算法相关代码使用了类似OOD中的策略模式,这些算法从实现的角度看仅仅是从运行队列中选择一个新进程,选择的过程中运用了不同的策略而已。不需要理解这种策略,对我们对于内核的理解并没有帮助。对于理解操作系统的工作机制,反而是进程的调度时机与进程的切换机制更为关键。
schedule函数
schedule函数:实现调度,在队列中自傲一个进程把CPU分配给它。
调用方法:
- 直接调用schedule()
- 松散调用,根据need_resched标记
进程调度的时机
-
中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule()。
-
内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度(内核线程是只有内核态而没有用户态的特殊进程)。
-
用户态进程只能被动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。
进程上下文切换相关代码分析
进程的切换
进程切换(任务切换、上下文切换):为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,
挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;而进程切换是在不同的进程之间进行调度。
进程上下文包含了进程执行需要的所有信息
-
用户地址空间:包括程序代码,数据,用户堆栈等
-
控制信息:进程描述符,内核堆栈等
-
硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同,中断:保存现场&恢复线程;进程调度:switc_to的机制)
schedule()函数实现方法
schedule()函数选择一个新的进程来运行,并调用context _ switch进行上下文的切换,这个宏调用switch _ to来进行关键上下文切换
-
next = pick _ next _ task(rq, prev);//封装了使用的某种进程调度策略,选择一个进程作为next
-
context_switch(rq, prev, next);//实现进程上下文切换
-
switch_to切换寄存器的状态和堆栈,利用两个参数:prev指向当前进程,next指向被调度的进程
#define switch_to(prev, next, last) do { unsigned long ebx, ecx, edx, esi, edi; asm volatile( "pushfl\n\t" #保存当前进程的flags "pushl %%ebp\n\t" #当前进程的堆栈基址压栈 //以下这两句实际上是实现了内核堆栈的切换,之后的所有压栈动作都是在next的内核堆栈中实现 "movl %%esp,%[prev_sp]\n\t" #把当前的栈底保存到prev_sp "movl %[next_sp],%%esp\n\t" #把下一个进程的栈顶放入esp寄存器当中 "movl $1f,%[prev_ip]\n\t" #保存当前进程的eip,在恢复当前进程的时候从这里恢复 "pushl %[next_ip]\n\t" #把next进程的起点压入栈,next进程的栈顶就是它的起点 //如果是进程切换这里一般是$1f,如果是新创建的子进程这里是ret_from_fork __switch_canary //这里使用jmp,因此是通过寄存器传递参数($1f);如果是call的话直接ret "jmp __switch_to\n" #通过寄存器传递参数 "1:\t" #prev进程的起始点 //恢复prev进程的上下文执行环境 "popl %%ebp\n\t" #ebp出栈 "popfl\n" #flags出栈 /* output parameters */ : [prev_sp] "=m" (prev->thread.sp), #当前进程内核堆栈的栈底 [prev_ip] "=m" (prev->thread.ip), #当前进程的eip "=a" (last), /* clobbered output registers: */ "=b" (ebx), "=c" (ecx), "=d" (edx), "=S" (esi), "=D" (edi) __switch_canary_oparam /* input parameters: */ : [next_sp] "m" (next->thread.sp), #下一个内核堆栈的栈底 [next_ip] "m" (next->thread.ip), #下一个进程执行的起点 //为进程切换做准备 [prev] "a" (prev), [next] "d" (next) __switch_canary_iparam : /* reloaded segment registers */ "memory"); } while (0)
以自己的理解并用图示表示如下:
Linux系统的一般执行过程
一般进程切换的过程
正在运行的用户态进程X切换到运行用户态进程Y的过程:
- 正在运行的用户态进程X
- 发生中断——save cs:eip/esp/eflags(当前进程CPU的状态压入用户态进程X的内核堆栈) load cs:eipss:esp(加载中断服务例程和内核堆栈)。
- 进入中断处理进程,首先SAVE_ALL,保存现场
- 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换
- 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
- restore_all 恢复进程X的执行状态
- iret - pop cs:eip/ss:esp/eflags from kernel stack
- 继续运行用户态进程Y
几种特殊情况
-
通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;
-
内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,比 最一般的情况略简略;
-
创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;
-
加载一个新的可执行程序后返回到用户态的情况,如execve;
Linux系统架构和执行过程概览
操作系统的基本概念
任何计算机系统都包含一个基本的程序集合,称为操作系统。
-
内核(进程管理,进程调度,进程间通讯机制,内存管理,中断异常处理,文件系统, I/O
系统,网络部分) -
其他程序(例如函数库、 shell程序、系统程序等等)
操作系统的目的
-
与硬件交互,管理所有的硬件资源
-
为用户程序(应用程序)提供一个良好的执行
环
从CPU的角度看Linux的系统执行
- 从shell中得到一个命令,一个字符串c,c=gets()是一个系统调用,从用户态的堆栈进入内核
- CPU等待用户输入命令的过程,会切换到其他的进程执行,涉及到进程调度。
- 在键盘上敲击了一个命令,键盘发生I/O中断,调用中断处理程序。此时得到了一个输入的参数,则会唤醒刚才由于等待而进入阻塞状态的进程进入就绪状态。
-
中断处理过程会出现进程调度的时机,它可能会把进程X作为next进程来执行,这时进程管理就会切换到进程X。然后gets系统调用就获得了需要从键盘中读取的数据,然后返回到用户态。
-
重复这个过程,完成不同的操作指令
从内存的角度看Linux的系统执行
物理内存和虚拟之间的映射关系:
实验——跟踪调试schedule函数
-
进入虚拟机环境,启动内核,并进入调试状态
-
在schedule处设置断点,c继续执行。
- 单步执行直到遇到__schedule函数,进入其中查看
- 继续执行,发现context_switch函数
- 设置断点后,进入其内部查看,发现内核切换的重点代码
(具体代码运行过程可与上文对照并结合分析一并查看便于理解。)
参考资料
【原创作品转载请注明出处】
- 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000