第十四周学习报告

第九章

一个系统中的进程是与其他进程共享共享CPU和主存资源。虚拟存储器是硬件异常,硬件地址翻译,主存,磁盘文件和内存软件的完美交互,它为每个进程提供了一个大的、一致的、和私有的地址空间:

存储器虚拟机提供三个能力:1.它将主存看成一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,它高效地,使用了主存;2.它为每个进程提供了一致的地址空间,从而简化了存储器管理;3.它保护了每个进程的地址空间不被其他进程破坏

 

9.1物理和虚拟寻址

CPU的访问存储器的最自然的方式就是使用物理地址

CPU通过生成一个虚拟地址来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址。将一个虚拟地址转换为物理地址的任务叫做地址翻译。

 

9.2地址空间

地址空间是非负的整数地址有序集合;如果地址空间中的整数是连续的,那么我们说它是一个线性地址空间;

一个地址空间的大小是由表示最大地址所需要的位数来描述的。

 

9.3虚拟存储器作为缓存的工具

虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。每字节都有一个唯一的虚拟地址,这个唯一的虚拟地址是作为到数组的索引的。

虚拟页面的集合分为三个不相交的子集:

未分配的

缓存的

未缓存的

1.DRAM缓存的组织结构

使用术语SRAM缓存来表示位于CPU和主存之间的L1、L2、和L3高速缓存,并且用术语DRAM表示虚拟存储器系统的缓存,它在主存中缓存虚拟页

2.页表

页表将虚拟页映射到物理页。每次地址翻译硬件将一个虚拟地址转换为物理地址时都会读取页表。操作系统负责维护页表的内容,以及在磁盘与DRAM之间来回传送页。

页表就是一个页表条目的数组。虚拟地址空间中的每个页在页表中一个固定偏移量处都有一个PTE

3.页命中

4.缺页

DRAM缓存不命中称为缺页

块也被称作页。在磁盘和存储器之间传送页的活动叫做交换或者页面调度。页从磁盘换入DRAM和从DRAM换出磁盘。一直等待。当有不命中发生时才换入页面的策略叫做按需页面调度。

5.分配页面

6.局部性

局部性原则保证了在任意时刻,程序将往往在一个较小的活动页面集合上工作,这个集合叫做工作集,或者常驻集。

如果工作集的大小超过了物理存储器的大小,那么程序将产生一种不幸的状态,叫做颠簸,这时页面将不断的换进换出。

 

9.4虚拟存储器作为存储器管理的工具

VM简化了链接和加载、代码、和数据共享、以及应用程序的存储器分配。

简化链接

简化加载

简化共享

简化存储器分配

 

9.5存储器作为存储器保护的工具

  • SUP:表示进程是否必须运行在内核模式下才能访问该页
  • READ:读权限
  • WRITE:写权限

如果一条指令违反了这些许可条件,那么CPU就触发一个一般保护故障,将控制传递给一个内核中的异常处理程序。Unix外壳一般将这种异常报告为“段错误”。

 

9.6地址翻译

CPU中的一个控制寄存器,页表基址寄存器。N位的虚拟地址包含两个部分:一个p位的虚拟页面偏移,和一个n-p位的虚拟页号。

地址翻译就是一个N元素的虚拟地址空间VAS中的元素和一个M元素的物理地址空间PAS中元素之间的映射。

页面基址寄存器PTBR指向当前页表。

MMU利用VPN选择适当的PTE

PPO=VPO

1.结合高速缓存和虚拟存储器

主要思路是地址翻译发生在高速缓存查找之前

2.利用TLB加速地址翻译

TLB是一个小的、虚拟寻址的缓存,其中每一行都保存着一个由单个PTE组成的块。TLB通常有高度的相连性。

这里的关键点是所有的地址翻译步骤都在芯片MMU中执行,所以很快。

3.多级页表

压缩页表的常用方法是使用层次结构的页表:这种方法减少了存储器要求,第一,如果一级页表中的一个PTE是空的,那么相应的二级页表就根本不会存在的,这代表一种潜在节约;第二,只有一级页表才需要总是在主存中,虚拟存储器系统在可以需要时创建、页面调入或调出二级页表,这就减少了主存的压力。只有经常使用的二级页表才需要缓存在主存中。

4.端到端的地址翻译

 

9.7案例研究

  • 1.R/W位:确定内容是读写还是只读
  • U/S位:确定是否能在用户模式访问该页
  • XD位:禁止执行位,64位系统中引入,可以用来禁止从某些存储器页取指令

还有连个缺页处理程序涉及到的位:

  • A位,引用位,实现页替换算法
  • D位,脏位,告诉是否必须写回牺牲页

Linux虚拟存储器区域

Linux缺页异常处理

内核虚拟存储器包括:内核中的代码和数据结构。

一部分区域映射到所有进程共享的物理页面

另一部分包含每个进程都不相同的数据。

 

9.8存储器映射

Linux通过一个虚拟存储器区域与一个磁盘上的对象关联起来,以初始化这个虚拟存储器区域的内容,这个过程称为存储器映射。

1.unix文件系统中的普通文件

2.匿名文件

3.一旦一个虚拟页面被初始化了,它就在一个由内核维护的专门的交换文件之间换来换去。交换文件也叫做交换空间或者交换区域。很重要的一点是,交换空间都限制着当前运行的进程能够分配的虚拟页面的总数。

1.先看共享对象

共享对象&私有对象:私有对象使用一种写时拷贝的巧妙技术映射到虚拟存储器

共享区域&私有区域

 

2.再看fork函数

删除已存在的用户区域

映射私有区域

映射共享区域

设置程序计数器PC

3.再看execve函数

 

9.9动态存储器分配

动态存储器分配器维护着一个进程的虚拟存储器区域,称为堆。系统之间细节不同

分配器将堆视为一组不同大小的块集合为维护。每个块就是一个连续的虚拟存储器片,要么已经分配,要么是空闲的。

显式分配器&隐式分配器

要求:

  • 处理任意请求序列
  • 立即响应请求
  • 只使用堆
  • 对齐块

不修改已分配的块

目标:

  • 最大化吞吐率(吞吐率:每个单位时间里完成的请求数)
  • 最大化存储器利用率——峰值利用率最大化

碎片:

虽然有未使用的存储器,但是不能用来满足分配请求时,发生这种现象。

1.内部碎片

发生在一个已分配块比有效载荷大的时候

易于量化。

2.外部碎片

发生在当空闲存储器合计起来足够满足一个分配请求,但是没有一个单独的空间块足以处理这个请求时发生

难以量化,不可预测。

四、隐式空闲链表

堆块的格式:

由一个字的头部,有效荷载,和可能的额外填充组成。

放置已分配的块——放置策略

1.首次适配

从头开始搜索空闲链表,选择第一个合适的空闲块

2.下一次适配

从上一次搜索的结束位置开始搜索

3.最佳适配

检索每个空闲块,选择适合所需请求大小的最小空闲块

六、申请额外的堆存储器

用到sbrk函数:

成功则返回旧的brk指针,出错为-1

通过将内核的brk指针增加incr来扩展和收缩堆。

七、合并空闲块

合并是针对于假碎片问题的,任何实际的分配器都必须合并相邻的空闲块。

有两种策略:

  • 立即合并
  • 推迟合并

八、带边界的合并

这个合并的意思是,因为头部的存在,所以向后合并是简单的,但是向前合并是不方便的,所以���在块的最后加一个脚部,作为头部的副本,就方便了合并,具体四种情况如下:

 

空闲块总是需要脚部的。

九、实现简单的分配器

这里课本上给了一个详细的例子,关于如何实现一个简单分配器的设计,有几点是需要注意的:

  • 序言块和结尾块:序言块是初始化时创建的,而且永不释放;结尾块是一个特殊的块,总是以它为结束。
  • 有一个技巧,就是将重复使用的,操作复杂又有重复性的,这些可以定义成宏,方便使用也方便修改。
  • 需要注意强制类型转换,尤其是带指针的,非常复杂。
  • 因为规定了字节对齐方式为双字,就代表块的大小是双字的整数倍,不是的舍入到是。

十、显式空闲链表

1.区别

1)分配时间

隐式的,分配时间是块总数的线性时间

但是显式的,是空闲块数量的线性时间。

2)链表形式

隐式——隐式空闲链表

显式——双向链表,有前驱和后继,比头部脚部好使。

2.排序策略:

  • 后进先出
  • 按照地址顺序维护

十一、分离的空闲链表

分离存储,是一种流行的减少分配时间的方法。一般思路是将所有可能的块大小分成一些等价类/大小类。

分配器维护着一个空闲链表数组,每个大小类一个空闲链表,按照大小的升序排列。

有两种基本方法:

1.简单分离存储

每个大小类的空闲链表包含大小相等的块,每个块的大小就是这个大小类中最大元素的大小。

1)操作

如果链表非空:分配其中第一块的全部

如果链表为空:分配器向操作系统请求一个固定大小的额外存储器片,将这个片分成大小相等的块,并且连接起来成为新的空闲链表。

2)优缺点

优点:时间快,开销小

缺点:容易造成内部、外部碎片

2.分离适配

每个空闲链表是和一个大小类相关联的,并且被组织成某种类型的显示或隐式链表,每个链表包含潜在的大小不同的块,这些块的大小是大小类的成员。

这种方法快速并且对存储器使用很有效率。

其中每个大小类都是2的幂

这样,给定地址和块的大小,很容易计算出它的伙伴的地址,也就是说:一个块的地址和它的伙伴的地址只有一位不同。

优点:快速检索,快速合并。

垃圾收集器是一种动态存储分配器,它自动释放程序不再需要的已分配块,这些块被称为垃圾,自动回收堆存储的过程叫做垃圾收集。

垃圾收集器将存储器视作一张有向可达图,只有当存在一条从任意根节点出发并到达p的有向路径时,才说节点p是可达的,而不可达点就是垃圾。

有两个阶段:

  • 标记:标记出根节点的所有可达的和已分配的后继
  • 清楚:释放每个未被标记的已分配块。

 

参考资料:后面分配器的设计部分参考闫佳欣同学博客。

posted on 2015-12-13 20:01  20135325  阅读(191)  评论(0编辑  收藏  举报

导航