Xv6代码阅读报告之进程调度

Xv6代码阅读报告-Topic3

@肖剑楠 20111013223

Xv6代码阅读报告-Topic3

1. 序

Xv6为了实现CPU多进程化需要解决一系列问题。1. 如何在进程间切换？2. 如何让这一切换变得透明？3. 需要锁机制来避免竞争。4. 内存、资源的自动释放。
Xv6通过实现上下文切换（Context Switching），时间中断处理，锁，睡眠与唤醒等机制基本解决了上述问题。主要代码包括swtch.S, defs.h, proc.h, proc.c, mmu.h等文件。
下面按模块对上述文件逐一分析。

2. 上下文切换

2.1 defs.h

在一切的一切之前，我们先看一下defs.h的结构体的定义以及函数的声明。
该文件中集中声明了一系列函数以及结构体，对于本章节之后需要讨论的部分，需要关注struct context, struct proc等结构体。
struct context在proc.h(40-56)中定义。其结构实际上是五个寄存器的值。也就是在上下文切换时，主要做的事情就是保存并更新寄存器值。同时根据惯例，调用者会保存%eax,%ecx,%edx的值。

struct context {
  uint edi;
  uint esi;
  uint ebx;
  uint ebp;
  uint eip;
};

顺便将proc和pipe的结构也分析一下。
struct proc 在proc.h(60-75)中定义，通过一个结构体记录每个进程的状态。

struct proc {
  uint sz;                     // 进程的内存大小（以byte计）
  pde_t* pgdir;                // 进程页路径的线性地址。
  char *kstack;                // 进程的内核栈底
  enum procstate state;        // 进程状态
  volatile int pid;            // 进程ID
  struct proc *parent;         // 父进程
  struct trapframe *tf;        // 当前系统调用的中断帧
  struct context *context;     // 进程运行的入口
  int killed;                  // 当非0时，表示已结束
  struct file *ofile[NOFILE];  // 打开的文件列表
  struct inode *cwd;           // 进程当前路径
  char name[16];               // 进程名称
};

pipe依赖对结构体spinlock，cpu的定义，见spinlock.h及proc.h(11-24)。
spinlock的作用在于当进程请求得到一个正在被占用的锁时，将进程处于循环检查，等待锁被释放的状态。

struct spinlock {
  uint locked;       // 锁是否处于锁住状态

  // For debugging:
  char *name;        // 锁名称
  struct cpu *cpu;   // 占有该锁的CPU信息
  uint pcs[10];      // 占有该锁的指令栈
};

pipe的结构在pipe.h(12-19)中定义，

struct pipe {
  struct spinlock lock; 
  char data[PIPESIZE];  // 保存pipe的内容，PIPESIZE为512
  uint nread;     // 读取的byte长度
  uint nwrite;    // 写入的byte长度
  int readopen;   // 是否正在读取
  int writeopen;  // 是否正在写入
};

2.2 swtch.S

该文件的作用在于使用汇编代码实现了swtch函数，

.globl swtch
swtch:
  # 将需要保存的context地址读取到%esp中，新context地址读取到%edx中
  # 4(%esp)对应的是需要保存的context
  # 8(%esp)对应的是新的context
  movl 4(%esp), %eax
  movl 8(%esp), %edx

  # 将寄存器中过期的数值压栈
  pushl %ebp
  pushl %ebx
  pushl %esi
  pushl %edi

  # 交换栈
  movl %esp, (%eax) # 保存需要保存的context地址
  movl %edx, %esp   # 读取新的context信息

  # 加载新的context信息
  popl %edi
  popl %esi
  popl %ebx
  popl %ebp
  ret

3. 进程调度

进程调度的主要函数集中在proc.c中，就让我们从这个文件开始说起吧。
对于单个CPU来说，scheduler是最主要的函数。当CPU初始化之后，即调用scheduler()，循环从进程队列中选择一个进程执行；当进程结束时，将控制权通过swtch()移交给scheduler。

void
scheduler(void)
{
  struct proc *p;

  for(;;){
    // 在每次执行一个进程之前，需要调用sti()函数开启CPU的中断
    sti();

    // 遍历进程表找到一个进程执行
    acquire(&ptable.lock); // 获取进程表的锁，避免其他CPU更改进程表
    for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){
      // 如果进程的状态为不可运行，则略过
      if(p->state != RUNNABLE)
        continue;

      // 切换到选择的进程，释放进程表锁，当进程结束时，再重新获取
      proc = p;
      switchuvm(p);
      p->state = RUNNING;
      swtch(&cpu->scheduler, proc->context);
      switchkvm();

      // Process is done running for now.
      // It should have changed its p->state before coming back.
      proc = 0;
    }
    release(&ptable.lock);
  }
}

在每次Loop之后，都要及时释放进程表锁，这样可以避免当进程表中暂时没有可以运行的程序时，进程表会一直被该CPU锁死，其他CPU便不能访问。其中一种情况是，当进程等待IO时，不是RUNNABLE的，而CPU处于idle状态，一直在占有进程表锁，IO信号无法到达。

sched()切换至CPU context，在切换context之前，进行一系列判断，以避免出现冲突。

void
sched(void)
{
  int intena;

  // 是否获取到了进程表锁
  if(!holding(&ptable.lock))
    panic("sched ptable.lock");
  // 是否执行过pushcli
  if(cpu->ncli != 1)
    panic("sched locks");
  // 执行的程序应该处于结束或者睡眠状态
  if(proc->state == RUNNING)
    panic("sched running");
  // 判断中断是否可以关闭
  if(readeflags()&FL_IF)
    panic("sched interruptible");

  intena = cpu->intena;
  // 上下文切换至scheduler
  swtch(&proc->context, cpu->scheduler);
  cpu->intena = intena;
}

yield()函数将CPU主动让出一个调度周期(scheduling round)，这个函数在xv6的当前版本中，仅在trap()中调用，见trap.c(100)。实际应用在于当一个进程正在使用CPU，同时中断处于打开状态，需要查看nlock。

void
yield(void)
{
  // 获取进程表锁
  acquire(&ptable.lock);
  // 将进程状态设为可运行，以便下次遍历时可以被唤醒
  proc->state = RUNNABLE;
  // 执行sched函数，准备将CPU切换到scheduler context
  sched();
  // 释放进程表锁
  release(&ptable.lock);
}

sleep和wakeup是两个互补的函数，共同作用实现改变进程执行顺序，
sleep函数有两个参数 void *chan和struct spinlock *lk。

void
sleep(void *chan, struct spinlock *lk)
{
  if(proc == 0)
    panic("sleep");

  if(lk == 0)
    panic("sleep without lk");

  // 释放锁lk
  if(lk != &ptable.lock){  //DOC: sleeplock0
    acquire(&ptable.lock);  //DOC: sleeplock1
    release(lk);
  }

  // 更改状态为SLEEPING，并切换至CPU context
  proc->chan = chan;
  proc->state = SLEEPING;
  sched();

  // Tidy up.
  proc->chan = 0;

  // 重新获得刚刚释放的lk锁
  if(lk != &ptable.lock){  //DOC: sleeplock2
    release(&ptable.lock);
    acquire(lk);
  }
}

值得注意的是，使进程进入睡眠需要两个锁，lk和ptable.lock，由于之前已经得到了ptable.lock，所以wakeup在此期间不会执行，直至进程完全进入睡眠状态，所以lk这个锁可以释放。

wakeup函数的主体部分位于wakeup1函数中。

void
wakeup(void *chan)
{
  // 先获取ptable.lock，确保sleep不会执行，避免出现missed wakeup
  acquire(&ptable.lock);
  wakeup1(chan);
  // 唤醒结束，释放ptable.lock
  release(&ptable.lock);
}

wakeup1函数完成了唤醒的主要工作。wakeup1之所以与wakeup作为两个独立的函数，是因为除了被wakeup调用之外，还在exit中调用，后面会详细讲到。

static void
wakeup1(void *chan)
{
  struct proc *p;
  // 遍历进程表，当发现有符合运行条件的程序时，将其标记为RUNNABLE
  for(p = ptable.proc; p < &ptable.proc[NPROC]; p++)
    if(p->state == SLEEPING && p->chan == chan)
      p->state = RUNNABLE;
}

wait函数用于父进程等待子进程结束，如果没有子进程，则返回-1，否则返回已经结束的子进程的pid。

int
wait(void)
{
  struct proc *p;
  int havekids, pid;
  // 获取进程表锁
  acquire(&ptable.lock);
  for(;;){
    // 遍历查找是否有处于zombie状态的子进程
    havekids = 0;
    for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){
      if(p->parent != proc)
        continue;
      // 如果发现有子进程
      havekids = 1;
      // 如果进程状态为zombie，则将其释放并返回该子进程的pid
      if(p->state == ZOMBIE){
        // Found one.
        pid = p->pid;
        kfree(p->kstack);
        p->kstack = 0;
        freevm(p->pgdir);
        p->state = UNUSED;
        p->pid = 0;
        p->parent = 0;
        p->name[0] = 0;
        p->killed = 0;
        release(&ptable.lock);
        return pid;
      }
    }

    // 如果没有子进程则直接返回
    if(!havekids || proc->killed){
      release(&ptable.lock);
      return -1;
    }

    // 如果有子进程处于睡眠状态，则将父进程置于睡眠状态
    sleep(proc, &ptable.lock);  //DOC: wait-sleep
  }
}

其中，当仍有子进程睡眠时，并没有释放ptable.lock，是因为释放操作放在了sleep函数中，且满足了sleep函数的调用条件，事先获得ptable.lock。

exit()完成了进程结束时的资源释放以及子进程处理等工作。其中只进行了一次acquire操作，这样可以使进程结束的操作原子化；同时可能存在多次的wakeup1操作，这样减少了很多时间。结束后，没有主动调用release，是因为sched进行context switching的时候需要获得ptable.lock，释放在scheduler中进行。

void
exit(void)
{
  struct proc *p;
  int fd;

  if(proc == initproc)
    panic("init exiting");

  // 关闭之前打开的文件
  for(fd = 0; fd < NOFILE; fd++){
    if(proc->ofile[fd]){
      fileclose(proc->ofile[fd]);
      proc->ofile[fd] = 0;
    }
  }
  iput(proc->cwd);
  proc->cwd = 0;

  acquire(&ptable.lock);

  // 唤醒父进程，一边父进程将处于zombie状态的该进程回收
  wakeup1(proc->parent);

  // 将子进程移交给initproc
  for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){
    if(p->parent == proc){
      p->parent = initproc;
      // 如果子进程处于zombie状态，则唤醒其新父亲initproc来料理后事
      if(p->state == ZOMBIE)
        wakeup1(initproc);
    }
  }

  // 移交给scheduler，等待父进程处理
  proc->state = ZOMBIE;
  sched();
  panic("zombie exit");
}

4. 管道

xv6中实现管道的结构体pipe已经在前面关于defs.h的分析中提及。此处直接分析pipe.c。

pipealloc实现了pipe的创建，并将pipe关联到两个文件上f0, f1。如果创建成功，返回0；否则返回-1。

int
pipealloc(struct file **f0, struct file **f1)
{
  struct pipe *p;

  p = 0;
  *f0 = *f1 = 0;
  // 如果f0,f1不存在则返回-1
  if((*f0 = filealloc()) == 0 || (*f1 = filealloc()) == 0)
    goto bad;
  if((p = (struct pipe*)kalloc()) == 0)
    goto bad;
  // 
  // 初始化pipe
  p->readopen = 1;
  p->writeopen = 1;
  p->nwrite = 0;
  p->nread = 0;
  initlock(&p->lock, "pipe");
  (*f0)->type = FD_PIPE;
  (*f0)->readable = 1;
  (*f0)->writable = 0;
  (*f0)->pipe = p;
  (*f1)->type = FD_PIPE;
  (*f1)->readable = 0;
  (*f1)->writable = 1;
  (*f1)->pipe = p;
  return 0;

 // 如果创建失败，则将进度回滚，释放占用的内存、解除对文件的占有
 bad:
  if(p)
    kfree((char*)p);
  if(*f0)
    fileclose(*f0);
  if(*f1)
    fileclose(*f1);
  return -1;
}

pipeclose实现了关闭pipe的处理。

void
pipeclose(struct pipe *p, int writable)
{
  // 获取管道锁，避免在关闭的同时进行读写操作
  acquire(&p->lock);
  // 判断是否有未被读取的数据
  if(writable){
    // 如果存在，则唤醒pipe的读进程；否则唤醒写进程
    p->writeopen = 0;
    wakeup(&p->nread);
  } else {
    p->readopen = 0;
    wakeup(&p->nwrite);
  }
  // 当pipe的读写都已结束时，释放资源；否则释放pipe锁
  if(p->readopen == 0 && p->writeopen == 0) {
    release(&p->lock);
    kfree((char*)p);
  } else
    release(&p->lock);
}

pipewrite实现了管道的写操作。

int
pipewrite(struct pipe *p, char *addr, int n)
{
  int i;

  acquire(&p->lock);
  // 逐字节写入
  for(i = 0; i < n; i++){
    // 如果pipe已经写满
    while(p->nwrite == p->nread + PIPESIZE) {  //DOC: pipewrite-full
      // 唤醒读进程，写进程进入睡眠，并返回-1
      if(p->readopen == 0 || proc->killed){
        release(&p->lock);
        return -1;
      }
      wakeup(&p->nread);
      sleep(&p->nwrite, &p->lock);  //DOC: pipewrite-sleep
    }
    p->data[p->nwrite++ % PIPESIZE] = addr[i];
  }
  // 写完之后唤醒读进程
  wakeup(&p->nread);  //DOC: pipewrite-wakeup1
  release(&p->lock);
  return n;
}

piperead实现了pipe的读操作。

int
piperead(struct pipe *p, char *addr, int n)
{
  int i;

  acquire(&p->lock);
  // 如果pipe已经读空，并且正在写入，则进入睡眠状态
  while(p->nread == p->nwrite && p->writeopen){  //DOC: pipe-empty
    if(proc->killed){
      release(&p->lock);
      return -1;
    }
    sleep(&p->nread, &p->lock); //DOC: piperead-sleep
  }
  for(i = 0; i < n; i++){  //DOC: piperead-copy
    if(p->nread == p->nwrite)
      break;
    addr[i] = p->data[p->nread++ % PIPESIZE];
  }
  // 读取完毕，唤醒写进程
  wakeup(&p->nwrite);  //DOC: piperead-wakeup
  release(&p->lock);
  // 返回读取的字节长度
  return i;
}

5. 进程调度流程

进程切换：当CPU启动之后，执行scheduler函数，无限循环。在每个周期里，从进程表中找到一个RUNNABLE的进程，切换为进程的上下文，此时开始执行函数。当函数运行结束时，调用return函数，此时切换为CPU的上下文，开始下一循环。
进程唤醒与睡眠：如果一个程序需要等待IO，则CPU会将其设置为睡眠状态，此时不能被执行。当IO信号到达时，执行的进程会将IO信号对应的进程设置为RUNNABLE，即唤醒。下一个scheduler周期的时候，该进程就可能会被执行，处理IO信号。
进程表锁：对于多处理器架构而言，需要用到进程表的时候都需要事先获得表的锁，当结束之后再释放，这样保证了对进程表操作的原子化，可以避免多处理器的竞争问题。

6. Pipe实现概述

Pipe的主要部分实际上是一小段规定长度的连续数据存储，读写操作将其视为无限循环长度的内存块。
初始化时，将给定的文件输入、输出流与该结构体关联；关闭时，释放内存，解除文件占用。
读写操作时，分别需要判断是否超出读写的范围，避免覆盖未读数据或者读取已读数据；如果写操作未执行完，则需通过睡眠唤醒的方式来完成大段数据的读取。

7. 阅读心得

由于这部分的代码主要由C代码实现，因为相对来说比第一次的阅读任务简单一些。有两个难点，一需要了解依赖的各结构体信息，并通过实际看代码认清每个属性的作用；二需要将多个函数结合着看，才能理解进程表锁的管理机制。xv6的实现机制并不复杂，主观脑洞大开结合着sched.pdf，就比较容易理解。

posted @ 2014-11-10 19:49 Travis X 阅读(4032) 评论(0) 收藏举报

刷新页面返回顶部

Travis X