BUAA_OS lab2 难点梳理
实验重点
所列出的实验重点为笔者在进行lab2过程中认为需要深刻理解的部分。
-
进行内存访问的流程
-
熟悉mips内存映射布局,即理解mmu.h内图
-
二级页表的理解和实现
以下将参考指导书逻辑,对于重难点进行梳理。
内存访问
首先,简易梳理内存访问流程。
-
TLB根据虚拟地址查找
-
若存在,在cache中查找;若不存在,按照页表查询,再查cache,更新tlb
-
若cache命中则ok;若未命中,进行页面替换
内存布局及初始化步骤的理解
lab2主要涉及的内存布局图如下:
-
kuseg:用户态可用地址,需要mmu进行地址转换
-
kseg0:内核地址,转换不需要mmu,只需要将最高位清0
与内存布局密切相关的,就是初始化部分的各个函数,包括创建二级页表的部分。
我们以mips_vm_init()展开理解初始化的各个步骤。
1 void mips_vm_init() 2 { 3 extern char end[]; 4 extern int mCONTEXT; 5 extern struct Env *envs; 6 7 Pde *pgdir; 8 u_int n; 9 10 /* Step 1: Allocate a page for page directory(first level page table). */ 11 pgdir = alloc(BY2PG, BY2PG, 1); 12 printf("to memory %x for struct page directory.\n", freemem); 13 mCONTEXT = (int)pgdir; 14 15 boot_pgdir = pgdir; 16 17 /* Step 2: Allocate proper size of physical memory for global array `pages`, 18 * for physical memory management. Then, map virtual address `UPAGES` to 19 * physical address `pages` allocated before. For consideration of alignment, 20 * you should round up the memory size before map. */ 21 pages = (struct Page *)alloc(npage * sizeof(struct Page), BY2PG, 1); 22 printf("to memory %x for struct Pages.\n", freemem); 23 n = ROUND(npage * sizeof(struct Page), BY2PG); 24 boot_map_segment(pgdir, UPAGES, n, PADDR(pages), PTE_R);; 25 /* Step 3, Allocate proper size of physical memory for global array `envs`, 26 * for process management. Then map the physical address to `UENVS`. */ 27 envs = (struct Env *)alloc(NENV * sizeof(struct Env), BY2PG, 1); 28 n = ROUND(NENV * sizeof(struct Env), BY2PG); 29 boot_map_segment(pgdir, UENVS, n, PADDR(envs), PTE_R); 30 31 printf("pmap.c:\t mips vm init success\n"); 32 }
-
首先,调用alloc函数为pgdir开出一块空间。在此需要理解,alloc函数的本质就是将freemem上移,以表示预留空间。在执行完这一条alloc后,freemem的值由end[](0x80400000)增加为0x80401000
-
然后,调用alloc函数为pages开出一块空间。需要注意的是,pages是用来记录各物理页信息的Page结构体数组,可以根据某Page在pages中的偏移量,间接求出对应的物理页地址。此时,freemem再次增加。与pgdir不同的是,紧接着又调用了boot_map_segment()函数。其作用下文中再叙述。
-
最后,与第二步相似,为envs先alloc再map。
接下来,我们看一下boot_map_segment()是用来干啥的。
1 void boot_map_segment(Pde *pgdir, u_long va, u_long size, u_long pa, int perm) 2 { 3 int i, va_temp; 4 Pte *pgtable_entry; 5 6 /* Step 1: Check if `size` is a multiple of BY2PG. */ 7 8 if(size%BY2PG!=0){ 9 return; 10 } 11 12 /* Step 2: Map virtual address space to physical address. */ 13 /* Hint: Use `boot_pgdir_walk` to get the page table entry of virtual address `va`. */ 14 15 for(i=0;i<size;i+=BY2PG){ 16 pgtable_entry=boot_pgdir_walk(pgdir,va+i,1); 17 *pgtable_entry=(pa+i)|perm|PTE_V; 18 } 19 return; 20 }
可以看出,boot_map_segment()的作用就是将[va, va+size)的虚拟地址和[pa, pa+size)的物理地址建立映射关系。通俗来讲,就是将虚拟地址va对应的页表项写入需要对应的pa的值,并设置标志位。
具体实现为,通过boot_pgdir_walk()获取地址为va+i对应的页表项,然后修改它的值。
那么自然而然,我们再来看一下boot_pgdir_walk()是怎么找到va+i对应的页表项地址的。
1 static Pte *boot_pgdir_walk(Pde *pgdir, u_long va, int create) 2 { 3 4 Pde *pgdir_entryp; 5 Pte *pgtable, *pgtable_entry; 6 7 /* Step 1: Get the corresponding page directory entry and page table. */ 8 /* Hint: Use KADDR and PTE_ADDR to get the page table from page directory 9 * entry value. */ 10 pgdir_entryp = pgdir+PDX(va); //获取一级页表项的虚拟地址 11 pgtable=KADDR(PTE_ADDR(*pgdir_entryp)); //获取二级页表入口的虚拟地址 12 /* Step 2: If the corresponding page table is not exist and parameter `create` 13 * is set, create one. And set the correct permission bits for this new page 14 * table. */ 15 if((*pgdir_entryp & PTE_V)==0 && create){ //如果没有二级页表,且需要创建 16 pgtable = alloc(BY2PG,BY2PG,1); //创建二级页表 17 *pgdir_entryp = PADDR(pgtable)|PTE_V; //将指向该二级页表的一级页表项的值设置为其物理地址 18 } 19 /* Step 3: Get the page table entry for `va`, and return it. */ 20 pgtable_entry=pgtable+PTX(va); //返回指向对应二级页表项地址的指针 21 return pgtable_entry; 22 23 }
该函数的具体行为已体现在注释中了,不再赘述。
看到这个boot_pgdir_walk()函数在寻找二级页表项的时候,可能会感觉被虚拟和物理地址的转换绕晕了,那么就来捋一下它究竟是根据什么地址找到的页表项吧。
首先需要明确,在想要访问页表的时候,无论是一级还是二级,都用的虚拟地址;而一级页表中存的二级页表地址和二级页表中存的页地址,都是物理地址。
明确这一点之后,以下这句就不难理解了。pgdir中存的是物理地址,但需要转化成虚拟地址访问。其他类似。
pgtable=KADDR(PTE_ADDR(*pgdir_entryp));
另外,我们会发现,在需要访问的二级页表不存在时,同样调用了alloc,上移freemem,为新页开出空间。这是因为,我们采用的二级页表是动态的,需要哪个就装入哪个,而不是将所有二级页表都放入内存,因为这样太占空间了。
到此位置,初始化部分就完成一大半了,这时候只需要再调用page_init()函数,将此时freemem以下的部分都设置p->pp_ref=1,即该物理页被使用了。因此,根据freemem上移的顺序,物理内存的最底端为pgdir,其次为pages,envs,后来alloc的页等等。
页面置换
在完成初始化之后,进行之后的页面插入、删除、分配、置换就变得容易多了。接下来,就以page_insert()函数来梳理一下后期相关的页面操作。
1 int 2 page_insert(Pde *pgdir, struct Page *pp, u_long va, u_int perm) 3 { 4 u_int PERM; 5 Pte *pgtable_entry; 6 PERM = perm | PTE_V; 7 /* Step 1: Get corresponding page table entry. */ 8 pgdir_walk(pgdir, va, 0, &pgtable_entry); 9 10 if (pgtable_entry!=0 &&(*pgtable_entry&PTE_V)!= 0) { 11 if (pa2page(*pgtable_entry) != pp) { 12 page_remove(pgdir, va); 13 } else { 14 tlb_invalidate(pgdir, va); 15 *pgtable_entry = (page2pa(pp) | PERM); 16 return 0; 17 } 18 } 19 20 /* Step 2: Update TLB. */ 21 22 /* hint: use tlb_invalidate function */ 23 tlb_invalidate(pgdir,va); 24 25 /* Step 3: Do check, re-get page table entry to validate the insertion. */ 26 27 int x = pgdir_walk(pgdir, va, 1, &pgtable_entry); 28 /* Step 3.1 Check if the page can be insert, if can鈥檛 return -E_NO_MEM */ 29 if(x==-E_NO_MEM){ 30 return -E_NO_MEM; 31 } 32 // printf("0x%x\n",PTE_ADDR(pgdir[0])); 33 /* Step 3.2 Insert page and increment the pp_ref */ 34 *pgtable_entry=(page2pa(pp)|PERM); 35 pp->pp_ref+=1; 36 return 0; 37 }
第一步是使用pgdir_walk()函数,获取va所对应的二级页表项。由此看来,pgdir_walk()与之前初始化部分提到的boot_pgdir_walk()作用基本相同呢。然不同之处在于,在调用page_insert()时,内存初始化部分已经完成,空闲页表已经使用page_free_list串起来了,因此再分配新页面的时候,直接取出空页即可。
之后的步骤,就是对内存访问的具体步骤的实现了。
1 . . 感言
至此,lab2的部分基本就结束了。回想完成lab2的时候,脑子还是一团浆糊,对于许多操作都很不理解。如今回头写总结,才发现主要就是对于初始化部分的具体行为理解不清。