windows内核内存管理

一、几个基本的概念

1.存储器的金字塔结构

存储器从下之上依次是磁盘/flash、DRAM(内存)、L2-cache、L1-cache、寄存器，越在上面的存储器访问速度越快，同时价格也越昂贵，每一级都可以看做是下一级的缓存，内存是磁盘的缓存，cache是内存的缓存。

2.地址空间

地址空间就是一个非负正数的有序集合，如果是连续的即线性地址空间，从硬件的角度看就是处理器所能访问的存储器空间，与地址线的位数相关，物理地址空间就是物理存储器的访问空间（按字节访问）

3.页

将物理内存和虚拟内存按页来划分，页的大小也有所不同，ARM中支持1M的大页，4k或64k的细页，x86下支持4M的大页，利用页表来表征整个地址空间，当采用二级页表时，存在一个页目录，用来索引对应页表所在的物理地址，PTE页表项占4个字节，当采用4k大小的页时，一个虚拟地址可以划分为：

31 22 21 12 11 0

| 页目录索引 | 页表索引 | 页内偏移 |

硬件页表项PTE

31 22 0

| 物理页帧号 | 物理页属性和访问控制 |

二、地址转译

地址的转译是有虚拟地址至物理地址，处理器内使用的是虚拟地址，经过MMU转译为物理地址，例如DMA使用的就是物理地址，因为它在MMU之后，转译的过程是MMU与OS配合完成的，OS负责维护页表，MMU负责翻译，要明确一点是MMU使用的是物理地址。首先根据页目录的物理地址（x86在CR3中）和页目录索引查找到页目录表项PDE，其中记录了对应页表的物理地址，如果该页表在物理内存中（页表也可以被换出到磁盘中），PDE表项的格式与硬件PTE基本一致，然后根据页表索引找到对应的页表项PTE，最后根据其中的物理页帧号和页内偏移计算得到物理地址。

具体的翻译过程用一个例子来说明：

例如：一个虚拟地址为0x50001，页目录索引为0x0,页表索引为0x50，页内偏移为0x1，首先找到PDE（windows的虚拟地址空间PDE_0的VA = 0xc0300000）,PDE物理地址 = CR3 + 0x0(页目录索引)*4，PDE表项内容为0x00700 067，查找PTE，PTE物理地址 = 0x700 + 0x50(页表索引)*4，（PTE的虚拟地址为0xc0000140),PTE表项的内容为0x00e63 047，则最终转译的物理地址 = 0xe63 000 + 0x1 = 0xe63001

三、虚拟内存的原理

如何在物理内存有限的情况下例如只有32MByte,可以使系统寻址4G的地址空间，物理内存资源是一种共享的稀缺资源，因此虚拟地址空间的页并不是都有对应的物理内存页面，将某一时刻处理器不访问的虚拟页面以页的方式保存在磁盘上，当需要读写时再将其换入至物理内存中。

四、进程虚拟地址空间

x86体系结构下，一个进程的虚拟地址空间为4G，主要包括了进程的私有地址空间和系统地址空间两部分，windows中0x0--0x7fff ffff作为进程私有，0x8000 0000 -- 0xffff ffff为系统地址空间。

1.大页和小页

采用大页的好处是在TLB中可以缓存更大的地址空间，增加了缓存命中的概率，不好的一点是页面粗粒度造成的不安全访问，例如.data（读写）和.text（只读）都放在同一个具有读写权限的页面内，则有可能造成.text的内容误写，可能导致系统崩溃。

采用小页的好处是细粒度管理内存，更加灵活，更少的内部碎片，但同时PFN更多，管理的开销要更大一些。

因此为了安全可靠，选用小页，4K page

2.延迟计算

(1)先保留再提交内存

当一个线程申请大块的虚拟内存时，现在虚拟地址空间中保留一段范围，为一块虚拟内存建立虚拟地址描述符（VAD），当真正访问这段地址空间时，再建立PTE，也就是在物理内存中分配有效的页面。一个应用例子就是每个线程的用户栈在创建时首先会保留1MB的空间，只有在虚拟页面被访问时才会提交。在VAD中记录了地址范围的大小，以及读写权限，当建立PTE时就根据VAD中记录的信息（读写权限）来填充PTE。

(2)写时复制 copy-on-wirte

i.当两个进程共享一个写时复制的物理页面时，如果其中一个进程中的线程要对共享页面进行写操作，则产生一个内存管理错误（一个异常），内存管理器为其分配一个新的读写物理页面，并且将原始共享页面的内容复制到新的物理页面中，并将虚拟地址映射更新为新的物理页面，控制权返回线程，线程执行写操作，此时新的物理页面属于该进程私有，其他进程是看不到的，也就是说写时复制为执行写操作的进程创建了一份私有的拷贝。

ii.POSIX子系统利用写时拷贝来创建子进程的地址空间，首先父进程创建一个子进程，子进程的地址空间是共享父进程的地址空间，将地址空间标记为写时拷贝，只有子进程执行写操作时，才会拷贝相应的页面给子进程私有使用。

3.内存区对象

section object，每一个打开的文件都有一个内存区对象指针，根据文件类型的不同（数据文件或可执行文件）指向不同的控制区域（虚拟地址空间内），控制区域包括子内存区，例如一个可执行文件的子内存区就是.data，.text，.bss等，同时这个控制区域又指向了一些原型PTE，通过这些原型PTE可映射到该内存区对象所映射的实际物理页面。

当内存区对象指向一个很大的数据文件时，线程只访问其中的一部分，就只映射该内存区中的一部分，这部分被称为内存区视图。

内存区对象的应用，映像加载器利用它加载可执行文件，缓存管理器利用它来访问缓存文件中的数据，这两者都是针对打开的文件，共享内存的应用是内存区对象与物理内存关联。

虚拟页有三种状态，已提交的，保留的和未分配的。

4.windows的四种内存保护机制

(1)系统空间的全局数据结构和内存池只有在内核模式下才可以访问，用户线程无法访问这些页面

(2)每个用户进程都有自己的私有地址空间，这部分空间是其他进程无法访问的

(3)地址转译过程中的隐式保护，一个标记为只读的页在对其进行写操作时会产生页面访问错误

(4)共享内存区对象具有标准的windows访问控制列表，对于没有权限的进程，是无法访问共享内存区的

5.进程页表

一个进程有自己的页目录，这个页目录就指向了对应的页表，进程的系统空间都是共享的，因此页表也是共享系统空间页表项，一个进程在创建时会初始化地址空间，也就是初始化页表，第一阶段就是创建系统空间的页表项，就是将页目录的PDE指向系统空间的页表，然后是打开一个可执行文件建立一个内存区对象，再映射至进程的私有空间，实质上是先保留地址空间，当进程执行时根据读写页面的需要创建PTE，进程的会话空间页表也是共享的，即指向已有的会话页表。进程的页目录和页表所在的物理页被映射至0xc0300 000和0xc000 0000

6.TLB

TLB就是缓存了虚拟页至物理页的映射，本质上就是一个cache，进程切换时会刷新TLB，但是系统空间的TLB项不会刷新，因为进程的系统空间是共享的

7.页面错误处理

页面处理的错误有两种，(1)访问了没有物理页映射的虚拟地址 (2)以错误的方式访问

8.原型PTE

首先原型PTE是一种无效PTE，目的是让所有可能需要共享页面的进程的PTE都指向原型PTE来解决页面错误，原型PTE是伴随这共享页面的内存区一起创建的，当共享内存页面是有效时，进程都直接用自己的PTE来访问。

当共享内存页面无效时，如果没有原型PTE，那如果一个进程访问该共享页面将其换入内存中，那内存管理器要将所有共享该内存页的进程的页表进行更新，告诉他们共享内存页有效了，这样做比较费力。

现在使用原型PTE，当进程访问的共享页无效时，则将该PTE指向共享页的原型PTE，如果进程A再次访问该页，共享页又被换入内存中，此时要更新原型PTE指向新的物理页，当进程B再次访问共享页时，此时因为原型PTE已经得到更新，则内存管理器更新进程B的页表，使其PTE指向新的物理页。

原型PTE的精髓还是延迟计算，就是当一个共享页从新被换入内存时，不必去更新所有曾经访问过该共享页的进程页表，而是等到进程真正访问时再去更新。

9.换页策略

(1)最近最少使用

(2)先进先出将驻留在内存中最久的页面换出

(3)时钟算法

posted @ 2014-03-25 18:48 胡炜阅读(1663) 评论(0) 收藏举报

刷新页面返回顶部

胡炜

windows内核 内存管理

公告

windows内核内存管理