MIT JOS学习笔记03:kernel 02(2016.11.08)
未经许可谢绝以任何形式对本文内容进行转载!
本篇接着上一篇对kernel的分析。
(5)pte_t * pgdir_walk(pde_t *pgdir, const void *va, int create)
这个函数是整个JOS操作系统页式内存管理最重要的函数。在这个函数中,JOS的设计者要求我们对于给定的一个页目录“pgdir”,返回线性地址(这是虚拟地址)“va”对应的页表入口地址。先用MIT自己的一张图来解释下整个地址转换的过程:
在本函数中,返回值就是上图Page Table中的<PPN Flags>,整个过程显然需要两次查表,一次是查Page Directory,另一次是查Page Table。但是有一个问题是,虚拟地址“va”对应的页目录项可能为空(NULL),即对应的二级页表(Page Table)尚未创建,这时我们就要根据create参数来决定是否分配一张二级页表。这里有个必须强调的细节:无论是页目录(Page Directory,即一级页表)还是页表(Page Table,即二级页表),保存的都是物理地址而不是虚拟地址。因为整个地址的转换实际上是由qemu模拟的mmu(Memory Management Unit,内存管理单元)硬件实现的,如果保存的是虚拟地址,就增加了mmu查表的次数,显然会影响kernel的速度。但是,kernel访问表和表项时又只能通过虚拟地址,这时我们可以用“kern/pmap.h”中的另一个函数page2kva()。
具体实现的代码如下:
1 pte_t * 2 pgdir_walk(pde_t *pgdir, const void *va, int create) 3 { 4 // Fill this function in 5 6 //test output 7 //cprintf(">> pgdir_walk() was called!\n"); 8 9 pte_t *result; 10 if (pgdir[PDX(va)] == (pte_t)NULL) { //yet to create 11 if (create == 0) 12 return NULL; 13 else { 14 struct Page *tmp = page_alloc(ALLOC_ZERO); 15 if (tmp == NULL) 16 return NULL; //failed to alloc 17 else { 18 tmp->pp_ref++; 19 pgdir[PDX(va)] = page2pa(tmp) | PTE_P | PTE_W |PTE_U; //save the physical address of newly allocated page in page dir 20 result = page2kva(tmp); //translate into an virtual address for kernel use 21 } 22 } 23 } 24 else 25 result = page2kva(pa2page(PTE_ADDR(pgdir[PDX(va)]))); 26 27 return &result[PTX(va)]; 28 }
(6)struct Page * page_lookup(pde_t *pgdir, void *va, pte_t **pte_store)
我们先暂时跳过page_insert()函数,因为page_insert()需要调用到page_lookup()和page_remove()。在本函数中,JOS的设计者要求我们对于给定的一个页目录“pgdir”,返回虚拟地址“va”映射到的物理页框对应的Page结构。我们可以通过pgdir_walk()函数来实现。
在pgdir_walk()中,我们可以得到Page Table中的<PPN Flags>,其中高20位的PPN就对应着一个物理页框。所以我们可以调用pgdir_walk()查找虚拟地址“va”对应的页表入口地址,如果返回为NULL,说明“va”尚未映射到任何一个物理页框上,也就没有对应的Page结构,如果返回不为NULL,我们只需要用PTE_ADDR()宏抹掉低12位的标志位,然后用pa2page()函数就能得到映射到的物理页框对应的Page结构。在这个过程中,如果参数pte_store不为NULL,则把pgdir_walk()得到的页表入口地址用pte_store传递回给调用者(注意pte_store是指向pte_t *的指针)。
具体实现的代码如下:
1 struct Page * 2 page_lookup(pde_t *pgdir, void *va, pte_t **pte_store) 3 { 4 // Fill this function in 5 6 //test output 7 //cprintf(">> page_lookup() was called!\n"); 8 9 pte_t *pte = pgdir_walk(pgdir, va, 0); 10 if (pte == NULL) 11 return NULL; 12 13 if (pte_store != 0) 14 *pte_store = pte; 15 16 return pa2page(PTE_ADDR(pte[0])); 17 }
(7)void page_remove(pde_t *pgdir, void *va)
page_remove()函数主要是用来断开虚拟地址“va”当前在页目录“pgdir”中的映射。要实现这一功能,我们需要用page_lookup()查找是否存在“va”对应的Page结构,如果不存在,我们需要用0抹掉该页表中对应的表项(尽管不存在对应的表项,但是还是抹掉以防万一),然后使“va”对应的TLB(Translation Lookaside Buffer,现在一般翻译为“快表”)失效;如果存在,我们需要尝试调用page_decref()减少该Page结构的pp_ref(即页面引用次数),这一过程中如果页面引用次数降为0,则由page_decref()释放该页面(放回page_free_list链表中),之后还需要用0抹掉该页表中对应的表项,最后同样地也需要让TLB失效。
具体实现的代码如下:
1 void 2 page_remove(pde_t *pgdir, void *va) 3 { 4 // Fill this function in 5 6 //test output 7 //cprintf(">> page_remove() was called!\n"); 8 9 pte_t *pte; 10 struct Page *page = page_lookup(pgdir, va, &pte); 11 12 if (page != NULL) 13 page_decref(page); 14 15 pte[0] = 0; 16 tlb_invalidate(pgdir, va); 17 }
(8)int page_insert(pde_t *pgdir, struct Page *pp, void *va, int perm)
现在我们可以回到page_insert()函数上来了。JOS的设计者要求我们对于给定的页目录“pgdir”,把虚拟地址“va”映射到给定的物理页框对应的Page结构“pp”上,同时设置低12位的标志位为“perm”。
为了实现这一功能,我们需要用page_lookup()查找“va”在“pgdir”中是否已经映射到了某一个Page结构上,如果否,说明可以直接建立“va”到“pp”的映射;如果是,就有两种可能:
1. “va”已经映射到了“pp”上
2. “va”映射到了“pp”以外的Page结构上
对于第一种情况,我们只需要修改低12位的标志位即可。对于第二种情况,我们需要调用page_remove()断开原有的映射,然后再建立新的映射。注意,所谓的建立映射,实质上就是修改Page Table中对应的<PPN Flags>项,该项可以用pgdir_walk()得到。
具体实现的代码如下:
1 int 2 page_insert(pde_t *pgdir, struct Page *pp, void *va, int perm) 3 { 4 // Fill this function in 5 6 //test output 7 //cprintf(">> page_insert() was called!\n"); 8 9 struct Page *page = page_lookup(pgdir, va, NULL); 10 pte_t *pte; 11 12 if (page == pp) { //re-insert into the same place 13 pte = pgdir_walk(pgdir, va, 0); 14 pte[0] = page2pa(pp) | perm | PTE_P; 15 return 0; 16 } 17 18 if (page != NULL) //remove original page if existed 19 page_remove(pgdir, va); 20 21 pte = pgdir_walk(pgdir, va, 1); 22 if (pte == NULL) 23 return -E_NO_MEM; 24 25 pte[0] = page2pa(pp) | perm | PTE_P; 26 pp->pp_ref++; 27 28 return 0; 29 }
到此mem_init()中所有需要我们实现的函数都完成了,我们继续分析mem_init()的功能。
我们之前分析过page_init()的功能,在mem_init()中调用了这个函数初始化了page_free_list链表。随后mem_init()调用了下面三个检查我们的实现是否正确的函数:
1 check_page_free_list(1); 2 check_page_alloc(); 3 check_page();
如果实现正确,在make qemu的时候console会显示“check_page_alloc() succeeded!”和“check_page() succeeded!”两行提示。
在这之后,JOS的设计者要求我们建立共计三块的物理页框对应的Page结构到虚拟地址的映射。
第一部分,建立pages[]数组所在的物理页框到虚拟地址UPAGES的映射,且标志位设置为“内核只读,用户只读”(PTE_U)。具体实现的代码如下:
1 for (i = 0; i < ROUNDUP(npages*sizeof(struct Page), PGSIZE); i += PGSIZE) 2 page_insert(kern_pgdir, pa2page(PADDR(pages) + i), (void *)(UPAGES + i), PTE_U);
第二部分,建立bootstack所在的物理页框到虚拟地址KSTACKTOP的映射,且标志位设置为“内核可读可写,用户无权限”(PTE_W)。具体实现的代码如下:
1 for (i = 0; i < KSTKSIZE; i += PGSIZE) 2 page_insert(kern_pgdir, pa2page(PADDR(bootstack) + i), (void *)(KSTACKTOP-KSTKSIZE + i), PTE_W);
第三部分,建立物理地址[0, 2^32 - KERNBASE)所在的物理页框到虚拟地址[KERNBASE, 2^32)的映射,且标志位设置为“内核可读可写,用户无权限”(PTE_W)。具体实现的代码如下:
1 for (i = 0; i < 0xFFFFFFFF - KERNBASE; i += PGSIZE) { 2 page_insert(kern_pgdir, pa2page(i % (npages*PGSIZE)), (void *)(KERNBASE + i), PTE_W); 3 pa2page(i % (npages*PGSIZE))->pp_ref--; //this statement is to keep pp_ref == 0 in page_free_list 4 }
这里需要解释一下上面代码的第三行。为什么我们要对pp_ref进行自减操作?在后面JOS会调用check_kern_pgdir()和check_page_installed_pgdir()检查mem_init()函数实现是否正确,其中,check_page_installed_pgdir()里会模拟物理页框对应的Page结构的分配。这里就会出现一个问题:我们在第三部分的映射中已经修改了所有Page结构的引用次数pp_ref,而check_page_installed_pgdir()中的assert()断言默认所有Page结构一开始都是没有被引用的(即pp_ref == 0),所以我们需要额外去修改pp_ref(个人认为JOS的设计者在实现check_page_installed_pgdir()的时候没有考虑好)。
到此整个mem_init()的功能,或者说,页式虚拟内存管理就完全实现了。下一篇会开始介绍console和monitor。