虚拟存储器
虚拟存储器是硬件异常、硬件地址翻译、主存、磁盘文件和内核软件的完美交互,它为每个进程提供了一个大的一直的和私有的地址空间。
三个重要能力:
- 它将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,高效的使用了主存
- 它为每个进程提供了一致的地址空间,从而简化了存储器管理
- 它保护了每个进程的地址空间不被其他进程破坏
物理和虚拟寻址
物理寻址:计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组,每字节都有一个唯一的物理地址,根据物理地址访问存储器称为物理寻址。
虚拟寻址:虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。使用虚拟寻址时,CPU通过生成一个虚拟地址VA来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址(这个过程叫做地址翻译,相关硬件为存储器管理单元MMU)。
地址空间
地址空间:非负整数地址的有序集合。
线性地址空间:地址空间中的整数是有序的,我们总是假设使用的是线性地址空间。
虚拟地址空间:在一个带虚拟存储器的系统中,CPU从一个有 N=2^n 个地址的地址空间中生成虚拟地址,这个地址空间成为称为虚拟地址空间。
地址空间的大小:由表示最大地址所需要的位数来描述。如一个包含N=2^n个地址的虚拟地址空间就叫做一个n位地址空间。现代系统典型地支持32位或者64位虚拟地址空间。
物理地址空间:与系统中物理存储器的M个字节相对应。
虚拟存储器的基本思想:允许每个对象有多个独立的地址,其中每个地址都选自一个不同的地址空间。主存中每个字节都有一个选自虚拟地址空间的虚拟地址和一个选自物理地址空间的的物理地址。
虚拟存储器作为缓存的工具
虚拟存储器——虚拟页VP,每个虚拟页大小为P=2^平字节
物理存储器——物理页PP,也叫页帧,大小也为P字节。
任意时刻,虚拟页面的集合都被分为三个不相交的子集:
- 未分配的:VM系统还没分配/创建的页,不占用任何磁盘空间。
- 缓存的:当前缓存在物理存储器中的已分配页
- 未缓存的:没有缓存在物理存储器中的已分配页
DRAM的缓存结构
特点:
- 不命中处罚很大
- 是全相联的——任何虚拟页都可以放在任何的物理页中。
- 替换算法精密
- 总是使用写回而不是直写
页表
页表是一个将虚拟页映射到物理页的数据结构。
每次地址翻译硬件将一个虚拟地址转化为物理地址时都会读取页表。
操作系统负责维护页表的内容,以此在磁盘与DRAM之间来回传送页。
页表就是一个页表条目(PTE)的数组,虚拟地址空间中的每个页在页表中一个固定偏移量处都有一个PTE,每个PTE由有效位和一个n位地址字段组成。
如果设置了有效位:
地址字段表示DRAM中相应的物理页的起始位置,这个物理页中缓存了该虚拟页
如果没有设置有效位:
空地址:表示该虚拟页未被分配。
不是空地址:这个地址指向该虚拟页在磁盘上的起始位置。
缺页
缺页:就是指DRAM缓存不命中。
缺页异常:会调用内核中的缺页异常处理程序,选择一个牺牲页。
页:虚拟存储器的习惯说法,就是块。
交换=页面调度:磁盘和存储器之间传送页的活动
按需页面调度:直到发生不命中时才换入页面的策略,所有现代系统都使用这个。
局部性
局部性原则保证了在任意时刻,程序将往往在一个较小的活动页面集合上工作,这个集合叫做工作集或者常驻集。在初始开销,也就是将工作集页面调度到存储器中之后,接下来对这个工作集的引用将导致命中,而不会产生额外的磁盘流量。
颠簸:工作集大小超出物理存储器的大小,这时页面将不断地换进换出。
虚拟存储器作为存储器管理的工具
- 操作系统为每个进程提供了一个独立的页表,也就是一个独立的虚拟地址空间。
- 抖个虚拟页面可以映射到同一个共享物理页面上。
- 存储器映射:将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法。
VM简化了链接和加载、代码和数据共享,以及应用程序的存储器分配。
虚拟存储器作为存储器保护的工具
PTE的三个许可位:
- SUP:表示进程是否必须运行在内核模式下才能访问该页
- READ:读权限
- WRITE:写权限
地址翻译
地址翻译是一个N元素的虚拟地址空间VAS中的元素和一个M元素的物理地址空间PAS中元素之间的映射。
当页面命中时,CPU硬件执行的步骤:
- 处理器生成一个虚拟地址,传给MMU
- MMU生成PTE地址,并从高速缓存/主存请求得到它
- 高速缓存/主存向MMU返回PTE
- MMU构造物理地址,并把它传给高速缓存/主存
-
高速缓存/主存返回所请求的数据字给处理器
处理缺页要求硬件和操作系统内核协作完成:
- 处理器生成一个虚拟地址,传给MMU
- MMU生成PTE地址,并从高速缓存/主存请求得到它
- 高速缓存/主存向MMU返回PTE
- PTE中有效位为0,所以MMU触发了一次异常,传递CPU中控制到操作系统内核中的缺页异常处理程序
- 缺页处理程序确定出物理存储器中的牺牲页,如果这个页面已经被修改了,则把它换出到磁盘
- 缺页处理程序页面调入到新的页面,并更新存储器中的PTE
- 缺页处理程序返回到原来的进程,再次执行导致缺页的指令。CPU将引起缺页的虚拟地址重新发送个MMU。因为虚拟页面现在缓存在物理存储器中,所以就会命中,之后主存将所请求字返回给处理器
结合高速缓存和虚拟存储器
- 首先,在既使用SRAM高速缓存又使用虚拟存储器的系统中,大多数系统选择物理寻址
- 主要思路是地址翻译发生在高速缓存之前
- 页表目录可以缓存,就像其他的数据字一样
利用TLB加速地址翻译
TLB:翻译后备缓冲器,是一个小的、虚拟存储的缓存,其中每一行都保存着一个由单个PTE组成的块。
步骤:
- CPU产生一个虚拟地址
- MMU从TLB中取出相应的PTE
- MMU将这个虚拟地址翻译成一个物理地址,并且将它发送到高速缓存/主存
- 高速缓存/主存将所请求的数据字返回给CPU
多级页表
多级页表:采用层次结构,用来压缩页表。
二级页表从两个方面减少了存储器要求:
- 如果一级页表中的一个PTE是空的,那么相应的二级页表就根本不存在,这代表一种巨大的潜在节约
- 只有一级页表才需要总是在主存中;虚拟存储器系统可以在需要是创建、页面调入或调出二级页表,这就减少了主存的压力;只有最经常使用的二级页表才需要缓存在主存中