MIT 6.S081入门lab5 懒惰分配

MIT 6.S081入门lab5 懒分配

一、参考资料阅读与总结

1.xv6 book书籍阅读( Chapter 4 Section 4.6)

4.6 Page-fault Exceptions

  • xv6对异常情况的处理:用户空间终止进程;内核空间停止内核执行。

  • 缺页错误常常被用于写时复制方法,例如COW-fork。

  • 缺页错误的类型:
    Load Page Faults: 无法转换的虚拟地址位于一条加载(读)指令中。Scause:13;
    Store Page Faults: 无法转换的虚拟地址位于一条存储(写)指令中。Scause:15;
    Instruction Page Faults: 无法转换的虚拟地址位于一条执行指令中。Scause:12;
    缺页错误类型码scause寄存器;虚拟地址stval寄存器

  • 由于fork在子进程关闭/exec 后,其整份的内存拷贝其其实是多余的,但是直接粗暴的共享内存回导致父子进程的相互干扰,这时我们就需要利用缺页错误来实现灵活的共享内存

  • fork改进思想: 开始时父子进程共享内存页,但是为只读模式 -> 尝试写入 ,出现缺页错误 -> 内核复制该页并进行映射 ->开放读写权限并更新进程页表 ->恢复指令运行;

  • 懒惰分配Lazy Allocation实现: 用户调用sbrk请求内存 -> sbrk标记进程大小增长(不分配)-> 缺页错误 -> 分配物理内存并更新页表。

  • 按需调页Demand Paging: 需要装载页进入内存,但是内存不足时,内核逐出evict物理页到磁盘并标记无效 -> 其他进程读取该页时,触发缺页异常,产生缺页错误 -> RAM中找到空间,从磁盘读入, 改写PTE为有效后更新页表 -> 重新执行读写指令。

  • 其他功能:自动增长栈和内存映射文件等。

4.7 Real World

  • 现实很多操作系统将内核的映射也加入用户页表,通过PTE标志位实现隔离机制;
  • 能够提升效率,但是内核代码会相当复杂。

二、涉及函数

本次实验原始代码基本是lab3和lab2的代码,这里就不输出相关函数了,核心是设计

三、课程视频观看笔记

  • 目标:使用缺页错误实现虚拟内存分配

  • 虚拟内存的优势:隔离;一定程度的间接性(trampoline和guard page);
    目前的映射是动态的,利用缺页错误,可以将这种映射动态化;

  • 内核需要响应缺页错误所需要的数据:
    错误的虚拟地址(pte) -> stval寄存器;
    缺页地址错误的类型(R、W、X) - >scause;
    引起错误地址的指令地址 -> sepc;

  • 缺页地址在sbark()中的应用 (增加):由于应用很难预测程序的大小,因此申请的内存往往是超出的
    懒分配的实现: 增加p->sz -> 缺页错误: va < p->sz 分配页面,初始化,映射 -> 重执行;

  • 由于是lazy分配,因此在uvmunmap时候会报未分配错误,但是由于是使用-分配机制,实际上其pte就是没有分配的,继续就可以了。本质是修改了设计,将之前的不变量变为了变量。

  • 按需补0: 对于全局变量而言,由于是0,因此只需要在单一页物理地址补0(只读),并将所需要的BSS中全部映射到这一页。在调用这些全局变量时,利用缺页错误进行重新申请分配。其本质是推迟花费;

  • 注:缺页错误比单纯保存到内存开销更大,由于其要进入内核;

  • COW-fork:只有在父/子进程对页进行修改(R)时候,才对相应的物理页进行复制,并重新映射(修改页表);内核可以使用pte的RSW标记只读的错误触发来源(fork)
    在释放的时候要注意,读取物理页面的ref,当ref为0的时候才进行释放

  • 按需调页: exec中,在读取内存时,只完成虚拟地址的分配,只有在触发页面错误时,才进行物理内存的分配,加载并重新映射pte;在页面错误时,把页面从文件读取到内存中,重新映射并运行原始内存;本质是对于内存的节省
    扩展: 如果内存耗尽,逐出页面到文件系统中,进行重新分配,重启指令;
    驱逐页面的策略:LRU:最近最久使用;先驱逐非脏页(没有修改的页(只读));时钟算法实现了每隔一段时间重置内存(最近使用的时间段);

  • mmap内存映射文件: 使用内存读写文件,通常是是急读写,mmap将文件内容从硬盘读取入内存,ummap取消映射操作,之后操作系统将其内容从内存写回到硬盘;通常是是使用vma结构体实现对读取要求的存储,在触发缺页错误时候进行操作;在现代操作系统中,可以使用文件锁来保证对文件访问的单一性

  • 总结: pagetable +traps == 虚拟内存

四、完成lab及其代码

  • Eliminate allocation from sbrk

    kernel/sysproc.c
    ..
    uint64
    sys_sbrk(void)
    {
      int addr;
      int n;
      struct proc *p = myproc();
    
      if(argint(0, &n) < 0)
    	return -1;
      addr = p->sz;
      if (n < 0) { //缩小直接消除
    	uvmdealloc(p->pagetable, p->sz, p->sz + n);
      }
      p->sz += n;
      // if(growproc(n) < 0)
      //   return -1;
      return addr; //注意这里返回的一定是原始addr 因为新的addr还没有分配,只是sz增加了
    }
    
  • Lazy allocation

    kerenl/trap.c
    ...
    void
    usertrap(void)
    {
      if(r_scause() == 8){
      ...
    	} else if((which_dev = devintr()) != 0){
    	// ok
      } else if(r_scause() ==  13 || r_scause() == 15) {
    	printf("usertrap(): page fault trap: signal() %d at address %p\n", r_scause(), r_stval());
    	if (vmlazyalloc(p, r_stval()) != 0) { //直接写成函数,放入vm.c中,更规范化
    	  p->killed = 1;
    	}
      } else {
      ...
      }
      ...
      }
    
    kernel/def.h
    // vm.c
    int             vmlazyalloc(struct proc *, uint64);
    
    kernel/vm.c
    // Remove npages of mappings starting from va. va must be
    // page-aligned. The mappings must exist.
    // Optionally free the physical memory.
    void
    uvmunmap(pagetable_t pagetable, uint64 va, uint64 npages, int do_free)
    {
      uint64 a;
      pte_t *pte;
    
      if((va % PGSIZE) != 0)
    	panic("uvmunmap: not aligned");
    
      for(a = va; a < va + npages*PGSIZE; a += PGSIZE){
    	if((pte = walk(pagetable, a, 0)) == 0)
    	  //panic("uvmunmap: walk");
    	  continue; // 由于为动态分配,因此无需panic为其产生panic。
    	if((*pte & PTE_V) == 0)
    	  // panic("uvmunmap: not mapped");
    	  continue; // 由于为动态分配,因此无需panic为其产生panic。
    	if(PTE_FLAGS(*pte) == PTE_V)
    	  panic("uvmunmap: not a leaf");
    	if(do_free){
    	  uint64 pa = PTE2PA(*pte);
    	  kfree((void*)pa);
    	}
    	*pte = 0;
      }
    }
    
    ..
    
    // validate and potentially allocate physical page
    // for a process's virtual address
    // return 0 on OK, -1 if any error
    int vmlazyalloc(struct proc *p, uint64 va) {
      uint64 ka = (uint64)kalloc(); //分配相应内存
      if (ka == 0) {
    	printf("usertrap(): kalloc() failed, out of memory.\n");
    	return -1;
    	} else {
    	memset((void *) ka, 0, PGSIZE); //清空内存
    	if (mappages(p->pagetable, PGROUNDDOWN(va), PGSIZE, ka, PTE_W|PTE_X|PTE_R|PTE_U) != 0) { //给予相应的映射(内存pte)
    	  printf("usertrap(): map pages failed\n");
    	  kfree((void *)ka);
    	  return -1;
    	}
      }
      return 0;
      } 
    
  • Lazytests and Usertests 修改代码,根据hint, 增加判断,并修改原始代码由于固定内存映射而导致的报错

    kernel/vm.c
    ...
    // Look up a virtual address, return the physical address,
    // or 0 if not mapped.
    // Can only be used to look up user pages.
    uint64
    walkaddr(pagetable_t pagetable, uint64 va)
    {
      pte_t *pte;
      uint64 pa;
    
      if(va >= MAXVA)
    	return 0;
    
      pte = walk(pagetable, va, 0);
      if(pte == 0 || (*pte & PTE_V) == 0) { //在遇到虚拟未分配的地址时进行分配
    	if (vmlazyalloc(myproc(), va) != 0)
    	  return 0;
      }
      if((*pte & PTE_V) == 0)
    	return 0;
      if((*pte & PTE_U) == 0)
    	return 0;
      pa = PTE2PA(*pte);
      return pa;
    }
    ...
    // Given a parent process's page table, copy
    // its memory into a child's page table.
    // Copies both the page table and the
    // physical memory.
    // returns 0 on success, -1 on failure.
    // frees any allocated pages on failure.
    int
    uvmcopy(pagetable_t old, pagetable_t new, uint64 sz)
    {
      pte_t *pte;
      uint64 pa, i;
      uint flags;
      char *mem;
    
      for(i = 0; i < sz; i += PGSIZE){
    	if((pte = walk(old, i, 0)) == 0)
    	  // panic("uvmcopy: pte should exist");
    	  continue; //跳过动态内存分配的区块
    	if((*pte & PTE_V) == 0)
    	  // panic("uvmcopy: page not present");
    	  continue; //跳过动态内存分配的区块
    	pa = PTE2PA(*pte);
    	flags = PTE_FLAGS(*pte);
    	if((mem = kalloc()) == 0)
    	  goto err;
    	memmove(mem, (char*)pa, PGSIZE);
    	if(mappages(new, i, PGSIZE, (uint64)mem, flags) != 0){
    	  kfree(mem);
    	  goto err;
    	}
      }
      return 0;
    
    / validate and potentially allocate physical page
    // for a process's virtual address
    // return 0 on OK, -1 if any error
    int vmlazyalloc(struct proc *p, uint64 va) {
      pte_t pte;
    
      if (va >= p->sz || va < p->trapframe->sp) { //超出范围 ,这里注意一定要等于,不然会报错,等于是可以接受的
    	return -1;
      }
      uint64 ka = (uint64)kalloc();
      if (ka == 0) {
    	printf("usertrap(): kalloc() failed, out of memory.\n");
    	return -1;
    	} else {
    	memset((void *) ka, 0, PGSIZE);
    	// vmprint(p->pagetable);
    	if (mappages(p->pagetable, PGROUNDDOWN(va), PGSIZE, ka, PTE_W|PTE_X|PTE_R|PTE_U) != 0) {
    	  printf("usertrap(): map pages failed\n");
    	  kfree((void *)ka);
    	  return -1;
    	}
    	// vmprint(p->pagetable);
      }
      return 0;
      } 
    
    kernel/sysproc.c
    uint64
    sys_sbrk(void)
    {
      int addr;
      int n;
      struct proc *p = myproc();
    
      if(argint(0, &n) < 0)
    	return -1;
      addr = p->sz;
      if (n < 0) {
    	uvmdealloc(p->pagetable, p->sz, p->sz + n); //减少内存的时候进行立即减少
      }
      p->sz += n;
      // if(growproc(n) < 0)
      //   return -1;
      return addr;
    }
    
    kernel/syscall.c
    // Retrieve an argument as a pointer.
    // Doesn't check for legality, since
    // copyin/copyout will do that.
    int
    argaddr(int n, uint64 *ip)
    {
      *ip = argraw(n);
      struct proc *p = myproc();
      uint64 va = *ip, pa = walkaddr(p->pagetable, va);
      if (pa == 0) { //存在未被分配的区域
    	if (vmlazyalloc(p, va) != 0) { //进行分配
    	  p->killed = 1;
    	}
      }
      return 0;
    }
    

参考文献

2020版xv6手册:https://pdos.csail.mit.edu/6.S081/2020/xv6/book-riscv-rev1.pdf
xv6手册与代码笔记:https://zhuanlan.zhihu.com/p/351939252
xv6阅读笔记:https://ghostasky.github.io/2022/07/12/XV6/
xv6手册中文版:http://xv6.dgs.zone/tranlate_books/book-riscv-rev1/c4/s6.html
28天速通MIT 6.S081操作系统公开课:https://zhuanlan.zhihu.com/p/627573247
MIT6.s081操作系统笔记:https://juejin.cn/post/7013843036996108325
MIT 6.S081 操作系统 LAB5:Lazy allocation:https://www.cnblogs.com/traver/p/15749324.html
xv6 lab5 lazy page allocation:https://www.cnblogs.com/mlmz/p/16092443.html


posted @ 2024-03-04 19:50  David_Dong  阅读(109)  评论(1编辑  收藏  举报