20135210——信息安全系统设计基础第十四周学习总结
第九章 虚拟存储器
虚拟存储器是硬件异常、硬件地址翻译、主存、磁盘文件和内核软件的完美交互,它为每个进程提供了一个大的、一致的和私有的地址空间。
通过一个很清晰的机制,虚拟存储器提供了三个重要的能力:
(1)它将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,它高效地使用了主存。
(2)它为每个进程提供了一致的地址空间,从而简化了存储器管理。
(3)它保护了每个进程的地址空间不被其他进程破坏。
9.1 物理和虚拟寻址
1.物理地址
计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组,每字节都有一个唯一的物理地址PA。
根据物理地址寻址的是物理寻址。
2.虚拟地址
虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。
使用虚拟寻址时,CPU通过生成一个虚拟地址VA来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址。
CPU芯片上叫做存储器管理单元的专用硬件,利用存放在主存中的查询表来动态翻译虚拟地址,该表的内容是由操作系统管理。
9.2 地址空间
一个非整数地址的有序集合:{0,1,2,...}。
如果地址空间中的整数是连续的,那么我们说它是一个线性地址空间。
在一个带虚拟存储器的系统中,CPU从一个有N = 2 ^ n个地址空间中生成虚拟地址,这个地址空间称为虚拟地址空间:{0,1,2,3,...,N-1}。
一个地址空间的大小是由表示最大地址所需要的倍数来描述的。
一个系统还有一个物理地址空间,它与系统中物理存储器的M字节相对应:{0,1,2,...M-1}。
地址空间清楚地区分了数据对象(字节)和它们的属性(地址)。
虚拟存储器的基本思想:允许每个数据对象有多个独立的地址,其中每个地址都选自一个不同的地址空间。
9.3 虚拟存储器作为缓存的工具
虚拟存储器——虚拟页VP,每个虚拟页大小为P=2^平字节
物理存储器——物理页PP,也叫页帧,大小也为P字节。
任意时刻,虚拟页面的集合都被分为三个不相交的子集:
未分配的:VM系统还没分配/创建的页,不占用任何磁盘空间。
缓存的:当前缓存在物理存储器中的已分配页
未缓存的:没有缓存在物理存储器中的已分配页
9.3.1 DRAM缓存的组织结构
DRAM缓存的组织结构,需要知道,这种缓存结构:不命中处罚很大是全相联的,任何虚拟存储页都可以放置在任何的物理页中,替换算法精密,
DRAM缓存总是使用写回(write back)。
9.3.2 页表
页表是一个数据结构,存放在物理存储器中,将虚拟页映射到物理页。
页表就是一个页表条目PTE的数组。
页表将虚拟地址映射为物理地址,每个页表项(PTE),有一个有效位,标识该地址是否在内存的缓存中,还有物理页号或磁盘地址:有效位+n位地址字段。
页命中,收到虚拟地址时,根据该虚拟地址查找页表,如果有效位有效,则说明在内存中,则利用该地址构造物理地址。
9.3.3缺页
缺页:就是指DRAM缓存不命中。
缺页异常:会调用内核中的缺页异常处理程序,选择一个牺牲页。
页:虚拟存储器的习惯说法,就是块
交换=页面调度:磁盘和存储器之间传送页的活动
按需页面调度:直到发生不命中时才换入页面的策略,所有现代系统都使用这个。
9.4 虚拟存储器作为存储器管理的工具
操作系统为每个进程提供了一个独立的页表,也就是一个独立的虚拟地址空间。
抖个虚拟页面可以映射到同一个共享物理页面上。
存储器映射:将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法。
传统的文件系统,这样通过存储器的映射,高效的把数据加载到存储器中。
简化链接:用户栈总是从虚拟地址0xbfffffff向下伸展。程序总是从虚拟地址0x08048000处开始,共享对象总是加载在从虚拟地址0x4000000处开始的区域。
简化共享:一般,每个进程都有自己私有的代码,数据,堆,栈区域,是不和其他进程共享页面的。然而,在一些情况下,还是需要进程来共享代码,数据,如内核代码,C的库函数。
OS通过将不同进程中适当的虚拟页面映射到相同的物理页面,从而安排多个进程共享这部分代码的一个拷贝。
简化存储器分配:当一个运行在用户进程中的程序要额外堆空间时,OS分配一个适当数字,如k个连续的虚拟地址空间,并且将它们映射到物理存储器中任意位置的k个任意的物理页面(不必要连续,可以是分散地分配)。
简化加载:映射一个连续虚拟页面的集合到任意一个文件中的任意一个位置的概念叫做存储器映射(memory mapping)。
9.5 虚拟存储器作为存储器保护的工具
SUP:表示进程是否必须运行在内核模式下才能访问该页
READ:读权限
WRITE:写权限
9.6 地址翻译
得到虚拟地址之后,分为两部分,前部分虚拟页号,后部分偏移地址,根据虚拟页号在页表中找到物理页号,偏移地址不变,直接物理页号和偏移地址构成物理地址。
该模块位于cpu内。地址翻译就是一个N元素的虚拟地址空间VAS中的元素和一个M元素的物理地址空间PAS中元素之间的映射。
每次翻译虚拟地址时,都需要到内存访问页表,为了加快速度,在cpu内直接再弄一个缓存表,缓存TBE的内容,称为TLB。
翻译整个过程:地址翻译单元从虚拟地址中拿到虚拟页号,检查TLB,看是否存在TPE的缓存,如果有返回,若没有,查询主存的页表,页表可以实现多级,拿到物理页号,如没有产生中断,调入地址,内核重新发送解析指令,最终返回物理地址;得到物理地址之后,将物理地址发给L1缓存,L1没有L2、L3、主存。
MMU利用VPN选择适当的PTE;PPO=VPO。
1.当页面命中时,CPU动作:处理器生成虚拟地址,传给MMU,MMU生成PTE地址,并从高速缓存/主存请求得到他,高速缓存/主存向MMU返回PTE,
MMU构造物理地址,并把它传给高速缓存/主存,高速缓存/主存返回所请求的数据给处理器。
2.处理缺页时:处理器生成虚拟地址,传给MMU,MMU生成PTE地址,并从高速缓存/主存请求得到他,高速缓存/主存向MMU返回PTE,PTE中有效位为0,触发缺页异常
确定牺牲页,调入新页面,更新PTE,返回原来的进程,再次执行导致缺页的指令,会命中。
9.6.1 结合高速缓存和虚拟存储器来看
首先,在既使用SRAM高速缓存又使用虚拟存储器的系统中,大多数系统选择物理寻址
主要思路是地址翻译发生在高速缓存之前
页表目录可以缓存,就像其他的数据字一样。
9.6.2 利用TLB加速地址翻译
TLB:翻译后备缓冲器,是一个小的、虚拟存储的缓存,其中每一行都保存着一个由单个PTE组成的块
步骤:
CPU产生一个虚拟地址
MMU从TLB中取出相应的PTE
MMU将这个虚拟地址翻译成一个物理地址,并且将它发送到高速缓存/主存
高速缓存/主存将所请求的数据字返回给CPU
9.6.3 多级页表
多级页表——采用层次结构,用来压缩页表。
1.以两层页表层次结构为例,好处是:
如果一级页表中的一个PTE是空的,那么相应的二级页表就根本不会存在
只有一级页表才需要总是在主存中,虚拟存储器系统可以在需要时创建、页面调入或调出二级页表,只有最经常使用的二级页表才缓存在主存中。
9.7 Linux虚拟存储器系统
一个区域:已经存在着的(已分配)虚拟存储器的连续片。
区域的概念重要在:它允许虚拟地址空间中存在间隙。
内核为系统中的每个进程维护一个单独的任务结构(源代码中的task_struct)
任务结构中的元素包含或者指向内核运行该进程所需要的所有信息。
一个具体区域的区域结构包括以下字段:
- vm_start:指向区域的起始处
- vm_end:指向区域的结束处
- vm_prot:描述这个区域包含的所有页的读写许可权限
- vm_flags:描述这个区域的页面是是共享的还是私有的
- vm_next:指向链表中的下一个区域
9.8 存储器映射
9.8.1共享对象和私有对象
1.共享对象
共享对象对于所有把它映射到自己的虚拟存储器进程来说都是可见的
即使映射到多个共享区域,物理存储器中也只需要存放共享对象的一个拷贝。
2.私有对象
私有对象运用的技术:写时拷贝
在物理存储器中只保存有私有对象的一份拷贝
9.9 动态存储器分配
碎片:虽然有未使用的存储器,但是不能用来满足分配请求时,发生这种现象。
1.内部碎片
发生在一个已分配块比有效载荷大的时候
易于量化。
2.外部碎片
发生在当空闲存储器合计起来足够满足一个分配请求,但是没有一个单独的空间块足以处理这个请求时发生
难以量化,不可预测。
隐式空闲链表
堆块的格式:由一个字的头部,有效荷载,和可能的额外填充组成。
放置已分配的块
1.首次适配:从头开始搜索空闲链表,选择第一个合适的空闲块
2.下一次适配:从上一次搜索的结束位置开始搜索
3.最佳适配:检索每个空闲块,选择适合所需请求大小的最小空闲块
- 如果空闲块已经最大程度的合并,而仍然不能生成一个足够大的块,来满足要求的话,分配器就会向内核请求额外的堆存储器,要么是通过调用nmap,要么是通过调用sbrk函数;
- 分配器都会将额外的存储器转化成一个大的空闲块,将这个块插入到空闲链表中,然后将被请求的块放置在这个新的空闲块中。
- 减少分配时间的方法,称为分离存储,维护多个空闲链表,其中每个链表中的块有大致相等的大小。
合并空闲块:合并是针对于假碎片问题的,任何实际的分配器都必须合并相邻的空闲块。
有两种策略:立即合并 和 推迟合并。
显式空闲链表:
隐式的,分配时间是块总数的线性时间,隐式空闲链表。
但是显式的,是空闲块数量的线性时间,双向链表,有前驱和后继,比头部脚部好使。
排序策略:后进先出,按照地址顺序维护
分离的空闲链表
分离存储,是一种流行的减少分配时间的方法。一般思路是将所有可能的块大小分成一些等价类/大小类。
分配器维护着一个空闲链表数组,每个大小类一个空闲链表,按照大小的升序排列。
有两种基本方法:
1.简单分离储存:每个大小类的空闲链表包含大小相等的块,每个块的大小就是这个大小类中最大元素的大小。
2.分离适配:每个空闲链表是和一个大小类相关联的,并且被组织成某种类型的显示或隐式链表,每个链表包含潜在的大小不同的块,这些块的大小是大小类的成员。
这种方法快速并且对存储器使用很有效率。
9.10 垃圾收集
垃圾收集器是一种动态存储分配器,它自动释放程序不再需要的已分配块,这些块被称为垃圾,自动回收堆存储的过程叫做垃圾收集。
Mark%Sweep垃圾收集器由标记(mark)阶段和清除(sweep)阶段组成。
标记阶段标记出根节点的所有可达的和已分配的后继,而后面的清除阶段释放每个被标记的已分配块。典型地,块头部中空闲的低位中的一位来表示这个块是否被标记了。