Linux内核学习笔记三——进程调度
进程调度:
在可运行态进程之间分配有限处理器时间资源的内核子系统。
一 调度策略
1 进程类型
I/O消耗型进程:大部分时间用来提交I/O请求或是等待I/O请求,经常处于可运行状态,但运行时间短,等待请求过程时处于阻塞状态。如交互式程序。
处理器消耗型进程:时间大都用在执行代码上,除非被抢占否则一直不停的运行。
综合型:既是I/O消耗型又是处理器消耗型。
调度策略要在:进程响应迅速(响应时间短)和最大系统利用率(高吞吐量)之间寻找平衡。
2 调度概念
优先级:基于进程价值和对处理器时间需求进行进程分级的调度。
时间片:表明进程被抢占前所能持续运行的时间,规定一个默认的时间片。时间片过长导致系统交互性的响应不好,
程序并行性效果差;时间片太短增大进程切换带来的处理器耗时。矛盾!
时间片耗尽进程运行到期,暂时不可运行状态。直到所有进程时间片都耗尽,重新计算进程时间片。
Linux调度程序提高交互式程序优先级,提供较长时间片;实现动态调整优先级和时间片长度机制。
进程抢占:Linux系统是抢占式,始终运行优先级高的进程。
3 调度算法
可执行队列:runqueue;给定处理器上可执行进程的链表,每个处理器一个。每个可执行进程都唯一归属于一个可执行队列。
运行队列是调度程序中最基本的数据结构:
struct runqueue { spinlock_t lock; /* 保护运行队列的自旋锁*/ unsigned long nr_running; /* 可运行任务数目*/ unsigned long nr_switches; /* 上下文切换数目*/ unsigned long expired_timestamp; /* 队列最后被换出时间*/ unsigned long nr_uninterruptible; /* 处于不可中断睡眠状态的任务数目*/ unsigned long long timestamp_last_tick; /* 最后一个调度程序的节拍*/ struct task_struct *curr; /* 当前运行任务*/ struct task_struct *idle; /* 该处理器的空任务*/ struct mm_struct *prev_mm; /* 最后运行任务的mm_struct结构体*/ struct prio_array *active; /* 活动优先级队列*/ atomic_t nr_iowait; /* 等待I/O操作的任务数目*/ …… };
提供了一组宏来获取给定CPU的进程执行队列:
#define cpu_rq(cpu) //返回给定处理器可执行队列的指针
#define this_rq() //返回当前处理器的可执行队列
#define task_rq(p) //返回给定任务所在的队列指针
在操作处理器任务队列时候要用锁:
__task_rq_lock
……
__task_rq_unlock
4 schedule
系统要选定下一个执行的进程通过调用schedule函数完成。
调度时机:
l 进程状态转换的时刻:进程终止、进程睡眠;
l 当前进程的时间片用完时(current->counter=0);
l 设备驱动程序调用;
l 进程从中断、异常及系统调用返回到用户态时;
睡眠和唤醒:
休眠(被阻塞)的进程处于一个特殊的不可执行状态。休眠有两种进程状态:
TASK_INTERRUPTIBLE:接收到信号就被唤醒
TASK_UNINTERRUPTIBLE:忽略信号
两种状态进程位于同一个等待队列上,等待某些事件,不能够运行。
进程休眠策略:
//q是我们希望睡眠的等待队列
DECLARE_WAITQUEUE(wait, current);
add_wait_queue(q, &wait);
//condition 是我们在等待的事件
while (!condition)
{
//将进程状态设为不可执行休眠状态 or TASK_UNINTERRUPTIBLE
set_current_state(TASK_INTERRUPTIBLE);
if(signal_pending(current))
//调度进程
schedule();
}
//进程被唤醒条件满足 进程可执行状态
set_current_state(TASK_RUNNING);
//将进程等待队列中移除
remove_wait_queue(q, &wait);
进程通过执行下面几个步骤将自己加入到一个等待队列中:
1) 调用DECLARE_WAITQUEUE()创建一个等待队列的项。
2) 调用add_wait_queue()把自己加入到队列中。该队列会在进程等待的条件满足时唤醒它。
当然我们必须在其他地方撰写相关代码,在事件发生时,对等待队列执行wake_up()操作。
3) 将进程的状态变更为 TASK_INTERRUPTIBLE或TASK_UNINTERRUPTIBLE。
4) 如果状态被置为TASK_INTERRUPTIBLE,则信号唤醒进程。这就是所谓的伪唤醒(唤醒不是因为事件的发生),因此检查并处理信号。
5) 检查条件是否为真;如果是的话,就没必要休眠了。如果条件不为真,调用schedule()。
6) 当进程被唤醒的时候,它会再次检查条件是否为真。如果是,它就退出循环,如果不是,它再次调用schedule()并一直重复这步操作。
7) 当条件满足后,进程将自己设置为TASK_RUNNING并调用remove_wait_queue()把自己移出等待队列。
二 抢占和上下文切换
进程切换schedule函数调用context_switch()函数完成以下工作:
l 调用定义在<asm/mmu_context.h>中的switch_mm(),该函数负责把虚拟内存从上一个进程映射切换到新进程中。
l 调用定义在<asm/system.h>中的switch_to(),该函数负责从上一个进程的处理器状态切换到新进程的处理器状态。
这包括保存、恢复栈信息和寄存器信息。在前面看到schedule函数调用有很多种情况,完全依靠用户来调用不能达到
很好的效果。内核需要判断什么时候调用schedule,内核提供了一个need_resched标志来表明是否需要重新执行一次调度:
l 当某个进程耗尽它的时间片时,scheduler_tick()就会设置这个标志;
l 当一个优先级高的进程进入可执行状态的时候,try_to_wake_up()也会设置这个标志。
每个进程都包含一个need_resched标志,这是因为访问进程描述符内的数值要比访问一个全局变量快
(因为current宏速度很快并且描述符通常都在高速缓存中)。
1 用户抢占
内核即将返回用户空间时候,如果need_resched标志被设置,会导致schedule函数被调用,此时发生用户抢占。
用户抢占在以下情况时产生:
l 从系统调返回用户空间。
l 从中断处理程序返回用户空间。
2 内核抢占
只要重新调度是安全的,那么内核就可以在任何时间抢占正在执行的任务。
什么时候重新调度才是安全的呢?只要没有持有锁,内核就可以进行抢占。锁是非抢占区域的标志。由于内核是支持SMP的,
所以,如果没有持有锁,那么正在执行的代码就是可重新导入的,也就是可以抢占的。
为了支持内核抢占所作的第一处变动就是为每个进程的thread_info引入了preempt_count计数器。该计数器初始值为0,
每当使用锁的时候数值加1,释放锁的时候数值减1。当数值为0的时候,内核就可执行抢占。从中断返回内核空间的时候,
内核会检查need_resched和preempt_count的值。如果need_resched被设置,并且preempt_count为0的话,这说明
有一个更为重要的任务需要执行并且可以安全地抢占,此时,调度程序就会被调用。
内核抢占会发生在:
l 当从中断处理程序正在执行,且返回内核空间之前。
l 当内核代码再一次具有可抢占性的时候。
l 如果内核中的任务显式的调用schedule()。
l 如果内核中的任务阻塞(这同样也会导致调用schedule())。