学习笔记
,第九章 虚拟存储器
虚拟存储器是计算机系统最重要的概念之一,它是对主存的一个抽象
三个重要能力:
它将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,高效的使用了主存
它为每个进程提供了一致的地址空间,从而简化了存储器管理
它保护了每个进程的地址空间不被其他进程破坏
第一节 物理和虚拟寻址
1.物理地址
计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组,每字节都有一个唯一的物理地址PA。
根据物理地址寻址的是物理寻址。
2.虚拟地址
虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。
使用虚拟寻址时,CPU通过生成一个虚拟地址VA来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址(这个过程叫做地址翻译,相关硬件为存储器管理单元MMU)
第二节 地址空间
1.地址空间
地址空间是一个非负整数地址的有序集合:
{0,1,2,……}
2.线性地址空间
地址空间中的整数是连续的。
3.虚拟地址空间
CPU从一个有 N=2^n 个地址的地址空间中生成虚拟地址,这个地址空间成为称为虚拟地址空间。
4.地址空间的大小
由表示最大地址所需要的位数来描述。
N=2^n:n位地址空间
主存中的每个字节都有一个选自虚拟地址空间的虚拟地址和一个选自物理地址空间的物理地址。
第三节 虚拟存储器作为缓存的工具
虚拟存储器——虚拟页VP,每个虚拟页大小为P=2^平字节
物理存储器——物理页PP,也叫页帧,大小也为P字节。
任意时刻,虚拟页面的集合都被分为三个不相交的子集:
未分配的:VM系统还没分配/创建的页,不占用任何磁盘空间。
缓存的:当前缓存在物理存储器中的已分配页
未缓存的:没有缓存在物理存储器中的已分配页
1.DRAM缓存的组织结构
需要知道,这种缓存结构:
不命中处罚很大
是全相联的——任何虚拟页都可以放在任何的物理页中。
替换算法精密
总是使用写回而不是直写。
2.页表
页表是一个数据结构,存放在物理存储器中,将虚拟页映射到物理页。
页表就是一个页表条目PTE的数组,组成为:
有效位+n位地址字段
1.如果设置了有效位:
地址字段表示DRAM中相应的物理页的起始位置,这个物理页中缓存了该虚拟页
2.如果没有设置有效位:
(1)空地址:
表示该虚拟页未被分配
(2)不是空地址:
这个地址指向该虚拟页在磁盘上的起始位置。
3.缺页
几个定义:
缺页:就是指DRAM缓存不命中。
缺页异常:会调用内核中的缺页异常处理程序,选择一个牺牲页。
页:虚拟存储器的习惯说法,就是块
交换=页面调度:磁盘和存储器之间传送页的活动
按需页面调度:直到发生不命中时才换入页面的策略,所有现代系统都使用这个。
4.虚拟存储器中的局部性
局部性原则保证了在任意时刻,程序将往往在一个较小的活动页面集合上工作,这个集合叫做工作集/常驻集。
所以只要程序有良好的时间局部性,虚拟存储器系统就能工作的相当好。
不好?
颠簸:工作集大小超出了物理存储器的大小。
第四节 虚拟存储器作为存储器管理的工具
操作系统为每个进程提供了一个独立的页表,也就是一个独立的虚拟地址空间。
抖个虚拟页面可以映射到同一个共享物理页面上。
存储器映射:将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法。
VM简化了链接和加载、代码和数据共享,以及应用程序的存储器分配。
第五节 虚拟存储器作为存储器保护的工具
这里需要知道PTE的三个许可位:
SUP:表示进程是否必须运行在内核模式下才能访问该页
READ:读权限
WRITE:写权限
第六节 地址翻译
具体符号见上图
地址翻译就是一个N元素的虚拟地址空间VAS中的元素和一个M元素的物理地址空间PAS中元素之间的映射。
页面基址寄存器PTBR指向当前页表。
MMU利用VPN选择适当的PTE。
PPO=VPO。
1.当页面命中时,CPU动作:
处理器生成虚拟地址,传给MMU
MMU生成PTE地址,并从高速缓存/主存请求得到他
高速缓存/主存向MMU返回PTE
MMU构造物理地址,并把它传给高速缓存/主存
高速缓存/主存返回所请求的数据给处理器。
2.处理缺页时:
处理器生成虚拟地址,传给MMU
MMU生成PTE地址,并从高速缓存/主存请求得到他
高速缓存/主存向MMU返回PTE
PTE中有效位为0,触发缺页异常
确定牺牲页
调入新页面,更新PTE
返回原来的进程,再次执行导致缺页的指令,会命中
一、结合高速缓存和虚拟存储器来看
首先,在既使用SRAM高速缓存又使用虚拟存储器的系统中,大多数系统选择物理寻址
主要思路是地址翻译发生在高速缓存之前
页表目录可以缓存,就像其他的数据字一样
二、利用TLB加速地址翻译
TLB:翻译后备缓冲器,是一个小的、虚拟存储的缓存,其中每一行都保存着一个由单个PTE组成的块
步骤:
CPU产生一个虚拟地址
MMU从TLB中取出相应的PTE
MMU将这个虚拟地址翻译成一个物理地址,并且将它发送到高速缓存/主存
高速缓存/主存将所请求的数据字返回给CPU
三、多级页表
多级页表——采用层次结构,用来压缩页表。
1.以两层页表层次结构为例,好处是:
如果一级页表中的一个PTE是空的,那么相应的二级页表就根本不会存在
只有一级页表才需要总是在主存中,虚拟存储器系统可以在需要时创建、页面调入或调出二级页表,只有最经常使用的二级页表才缓存在主存中。
2.多级页表的地址翻译:
四、端对端的地址翻译
这一部分看懂书上的例题。
第七节 案例研究
一、Core i7地址翻译
在这里,PTE有三个权限位:
R/W位:确定内容是读写还是只读
U/S位:确定是否能在用户模式访问该页
XD位:禁止执行位,64位系统中引入,可以用来禁止从某些存储器页取指令
还有连个缺页处理程序涉及到的位:
A位,引用位,实现页替换算法
D位,脏位,告诉是否必须写回牺牲页
二、Linux虚拟存储器系统
Linux为每个进程维持了一个单独的虚拟地址空间,如图:
内核虚拟存储器包括:内核中的代码和数据结构。
一部分区域映射到所有进程共享的物理页面
另一部分包含每个进程都不相同的数据。
一、Linux虚拟存储器区域
区域:就是已分配的虚拟存储器的连续片。
区域的例子:
代码段
数据段
堆
共享库段
用户栈
……
每个存在的虚拟页面都保存在某个区域中。内核为系统中的每个进程维护一个单独的任务结构task_struct:
一个具体区域的区域结构包括:
vm_start:指向起始处
vm_end:指向结束处
vm_prot:描述这个区域包含的所有页的读写许可权限
vm_flags:是共享的还是私有的
vm_next:指向下一个区域
二、Linux缺页异常处理
1.虚拟地址A是否合法?
不合法,触发段错误,终止进程
合法,进入下一条
2.存储器访问是否合法?即,是否有权限?
不合法,触发保护异常,终止程序
合法,进入下一条
3.这时,是针对合法的虚拟地址进行合法的操作。所以:选择一个牺牲页面,如果被修改过就换新的并更新页表。
第八节 存储器映射
即指Linux通过将一个虚拟存储器区域与一个磁盘上的对象关联起来,以初始化这个虚拟存储器区域的内容的过程。
映射对象:
1.Unix文件系统中的普通文件
2.匿名文件(全都是二进制0)
一、共享对象和私有对象
1.共享对象
共享对象对于所有把它映射到自己的虚拟存储器进程来说都是可见的
即使映射到多个共享区域,物理存储器中也只需要存放共享对象的一个拷贝。
2.私有对象
私有对象运用的技术:写时拷贝
在物理存储器中只保存有私有对象的一份拷贝
fork函数就是应用了写时拷贝技术,至于execve函数:
二、使用mmap函数的用户级存储器映射
1.创建新的虚拟存储器区域
#include <unistd.h>
#include <sys/mman.h>
void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);
成功返回指向映射区域的指针,若出错则为-1
参数含义:
start:这个区域从start开始
fd:文件描述符
length:连续的对象片大小
offset:距文件开始处的偏移量
prot:访问权限位,具体如下:
PROT_EXEC:由可以被CPU执行的指令组成
PROT_READ:可读
PROT_WRITE:可写
PROT_NONE:不能被访问
flag:由描述被映射对象类型的位组成,具体如下:
MAP_ANON:匿名对象,虚拟页面是二进制0
MAP_PRIVATE:私有的、写时拷贝的对象
MAP_SHARED:共享对象
2.删除虚拟存储器:
include
include <sys/mman.h>
int munmap(void *start, size_t length);
成功返回0,失败返回-1
从start开始删除,由接下来length字节组成的区域。
第九节 动态存储器分配
1.堆:
是一个请求二进制0的区域,紧接在未初始化的bss区域后开始,并向上(更高的地址)生长。有一个变量brk指向堆的顶部
2.分配器的两种基本风格:
a.显示分配器-malloc和free
b.隐式分配器/垃圾收集器
一、malloc和free函数:
系统调用malloc函数,从堆中分配块:
#include <stdlib.h>
void *malloc