win32汇编系列（一）

进程如何使用内存？

毫无疑问，所有进程（执行的程序）都必须占用一定数量的内存，它或是用来存放从磁盘载入的程序代码，或是存放取自用户输入的数据等等。不过进程对这些内存的管理方式因内存用途不一而不尽相同，有些内存是事先静态分配和统一回收的，而有些却是按需要动态分配和回收的。

对任何一个普通进程来讲，它都会涉及到5种不同的数据段。稍有编程知识的朋友都能想到这几个数据段中包含有“程序代码段”、“程序数据段”、“程序堆栈段”等。不错，这几种数据段都在其中，但除了以上几种数据段之外，进程还另外包含两种数据段。下面我们来简单归纳一下进程对应的内存空间中所包含的5种不同的数据区。

代码段：代码段是用来存放可执行文件的操作指令，也就是说是它是可执行程序在内存中的镜像。代码段需要防止在运行时被非法修改，所以只准许读取操作，而不允许写入（修改）操作——它是不可写的。

数据段：数据段用来存放可执行文件中已初始化全局变量，换句话说就是存放程序静态分配[1]的变量和全局变量。

BSS段[2]：BSS段包含了程序中未初始化的全局变量，在内存中 bss段全部置零。

堆（heap）：堆是用于存放进程运行中被动态分配的内存段，它的大小并不固定，可动态扩张或缩减。当进程调用malloc等函数分配内存时，新分配的内存就被动态添加到堆上（堆被扩张）；当利用free等函数释放内存时，被释放的内存从堆中被剔除（堆被缩减）

栈：栈是用户存放程序临时创建的局部变量，也就是说我们函数括弧“{}”中定义的变量（但不包括static声明的变量，static意味着在数据段中存放变量）。除此以外，在函数被调用时，其参数也会被压入发起调用的进程栈中，并且待到调用结束后，函数的返回值也会被存放回栈中。由于栈的先进先出特点，所以栈特别方便用来保存/恢复调用现场。从这个意义上讲，我们可以把堆栈看成一个寄存、交换临时数据的内存区。

进程如何组织这些区域？

上述几种内存区域中数据段、BSS和堆通常是被连续存储的——内存位置上是连续的，而代码段和栈往往会被独立存放。有趣的是，堆和栈两个区域关系很“暧昧”，他们一个向下“长”（i386体系结构中栈向下、堆向上），一个向上“长”，相对而生。但你不必担心他们会碰头，因为他们之间间隔很大（到底大到多少，你可以从下面的例子程序计算一下），绝少有机会能碰到一起。

下图简要描述了进程内存区域的分布：

“事实胜于雄辩”，我们用一个小例子（原形取自《User-Level Memory Management》）来展示上面所讲的各种内存区的差别与位置。

#include<stdio.h>

#include<malloc.h>

#include<unistd.h>

int bss_var;

int data_var0=1;

int main(int argc,char **argv)

{

printf("below are addresses of types of process's mem"n");

printf("Text location:"n");

printf(""tAddress of main(Code Segment):%p"n",main);

printf("____________________________"n");

int stack_var0=2;

printf("Stack Location:"n");

printf(""tInitial end of stack:%p"n",&stack_var0);

int stack_var1=3;

printf(""tnew end of stack:%p"n",&stack_var1);

printf("____________________________"n");

printf("Data Location:"n");

printf(""tAddress of data_var(Data Segment):%p"n",&data_var0);

static int data_var1=4;

printf(""tNew end of data_var(Data Segment):%p"n",&data_var1);

printf("____________________________"n");

printf("BSS Location:"n");

printf(""tAddress of bss_var:%p"n",&bss_var);

printf("____________________________"n");

char *b = sbrk((ptrdiff_t)0);

printf("Heap Location:"n");

printf(""tInitial end of heap:%p"n",b);

brk(b+4);

b=sbrk((ptrdiff_t)0);

printf(""tNew end of heap:%p"n",b);

return 0;

}

它的结果如下

below are addresses of types of process's mem

Text location:

Address of main(Code Segment):0x8048388

____________________________

Stack Location:

Initial end of stack:0xbffffab4

new end of stack:0xbffffab0

____________________________

Data Location:

Address of data_var(Data Segment):0x8049758

New end of data_var(Data Segment):0x804975c

____________________________

BSS Location:

Address of bss_var:0x8049864

____________________________

Heap Location:

Initial end of heap:0x8049868

New end of heap:0x804986c

利用size命令也可以看到程序的各段大小，比如执行size example会得到

text data bss dec hex filename

1654 280 8 1942 796 example

但这些数据是程序编译的静态统计，而上面显示的是进程运行时的动态值，但两者是对应的。

通过前面的例子，我们对进程使用的逻辑内存分布已先睹为快。这部分我们就继续进入操作系统内核看看，进程对内存具体是如何进行分配和管理的。

从用户向内核看，所使用的内存表象形式会依次经历“逻辑地址”——“线性地址”——“物理地址”几种形式（关于几种地址的解释在前面已经讲述了）。逻辑地址经段机制转化成线性地址；线性地址又经过页机制转化为物理地址。（但是我们要知道Linux系统虽然保留了段机制，但是将所有程序的段地址都定死为0-4G，所以虽然逻辑地址和线性地址是两种不同的地址空间，但在Linux中逻辑地址就等于线性地址，它们的值是一样的）。沿着这条线索，我们所研究的主要问题也就集中在下面几个问题。

1. 进程空间地址如何管理？

2. 进程地址如何映射到物理内存？

3. 物理内存如何被管理？

以及由上述问题引发的一些子问题。如系统虚拟地址分布；内存分配接口；连续内存分配与非连续内存分配等。

   虽然80386处理器要较以前的处理器的功能大大增强，但这些功能只能在保护模式下才能全部得到发挥。在实模式下最大寻址空间只有1M,但在保护模式最大寻址空间可达4G，可以访问到所有的物理内存。同时由于引入虚拟内存的概念，在程序设计中可使用的地址空间为64TB。80386处理器采用了可扩充的分段管理和可选的分页管理机制，这两个存储管理机制由MMU(Memory Management Unit)部件来实现。因此，如果在80386下进行实模式编程，这时的80386处理器相当于一功能更强大，运行速度更快的8086处理器。80386提供对虚拟存储器的支持，虚拟存储器的理论基础就是：速度非常快的内存储器和海量的外存储器，所以它是一种软硬件结合的技术，它能够提供比物理内存大得多的存储空间。
   80386下的段具有三个属性：段基址，段界限，段属性，通常描述段的称作段描述符(Segment Descriptor),而描述符通常放在一个线性表中，这种线性表又分为：GDT(Global Descriptor Table),LDT(Local Descriptor Table),IDT(Interrupt Descriptor Table)，通常用一个叫做选择子的东西去确定使用上述三个线性表中哪一个描述符。程序中使用的地址空间就是虚拟地址空间，上面已经说过80386下虚拟地址空间可达到64TB(后面将解释为什么可以达到64TB)，虚拟地址空间由一个选择子和段内偏移组成，这是因为通过段的选择子我们可以得到该段的描述符，而在描述符中又说明了段的基址，段的界限及段的属性，再加上段的偏移就可以得到虚拟地址空间。不过请注意，这里并没有将段基址乘以16再加上偏移地址，这是保护模式与实式模式的区别之一。很明显，任何数据都必须装入到物理内存才能够被存储器处理，所以二维的虚拟地址空间必须转换成一维的物理地址。同时，由于每个任务都有自已的虚拟地址空间，为了防止多个并行任务将虚拟地址空间映射同一物理地址空间采用线性地址空间隔离虚拟地址和物理地址，线性地址空间由一维的线性地址构成，线性地址空间与物理地址空间对等，线性地址为32位，可寻址空间为4GB(物理地址空间最大也可以达到4GB，址址为32位，所以说线性地址空间与物理地址空间对等)。下面是80386虚拟地址空间与物理址空间的转换示意图：

        |----------|              |------------|       |--------|        |------------------|       |--------|
        | 虚拟地址 |------>|分段管理部件|------>|线性地址|---|--->|可选的分页管理部件|---|-->|物理地址|
        |----|-----|       |------------|       |--------|   |    |------------------|   |   |--------|
      |------|-------|                                       |                           |
      |              |                                       |---------------------------|
|----------|    |---------|
| 选择子 |    | 段内偏移|
|----------|    |---------|

   地址映射过程中，通过分段管理部件将虚拟地址空间转换成线性地址，这一步是必然存在的。如果在程序中启用了分页管理机制，那么线性地址还要经过分页管理部件的处理才得到最后的物理地址。如果没有采用分页管理机制，那么得到的线性地址就是物理地址。分页管理部件的主要的工作机制在于将线性地址和物理地址划分成大小相同的块，通过在建立两者之间的页表来建立对应关系。分段管理机制使用大小可变的存储块，使用分段管理机制适合处理复杂系统的逻辑分段。分页管理机制使用固定大小的块，所以它适合管理物理存储器，分页管理机制能够更有效地使用虚拟地址空间。
   80386支持多任务，因此对各个任务进行保护是非常必要的，对任务的保护可分为：同一任务内的保护，不同任务之间的保护。
   a.同一任务内的保护，在同一任务内定义有四种特权级别(Previlege Level)，将这些特权级别分配给段中的代码和数据，把最高的特权级别分配给最重要的数据和最可信任的代码，将较低级别的特权分给一般的代码和不重要的数据。特权级别用0~3来表示，用数字0表示最高特权级别，用数字3表示最低特权级别，在比较特权级别时不使用大于或小于，而是使用外层或里层来比较，很明显特权级别为0表示最里层，特别级别为3表示最外层。任何一个存储段(程序直接进行访问的代码段和数据段)都有一个特权级别，在一个程序试图访问这个存储时，就会进行特权级别的比较，如果小于或等于(如果等于表明同级，小于则表明是内层)处该存储段的特权级别就可以对该存储段进行访问。任务在特定时刻下的特权级别称为CPL(Current Previlege Level)，看一简单的结构示意图:

                   |---------|-------|
                   | CodeA | DataA | 特权级别为0
                   |---------|-------|
                   |---------|-------|
                   | CodeB | DataB | 特权级别为1
                   |---------|-------|
                   |---------|-------|
                   | CodeC | DataC | 特权级别为2
                   |---------|-------|
                   |---------|-------|
                   | CodeD | DataD | 特权级别为3
                   |---------|-------|

     CodeA可以访问DataA,CodeB,DataB,CodeC,DataC,CodeD,DataD
     CodeB可以访问Datab,CodeC,DataC,CodeD,DataD,但不可以访问CodeA,DataA
     CodeC可以访问DataC,CodeD,DataD,但不可以访问CodeA,DataA,CodeB,DataB
     CodeD处在最外层，只能访问同级的DataD,不可以访问CodeA,DataA,CodeB,DataB,CodeC,DataC
     通常应用程序放在最外层，但由于每个应用程序的虚拟地址空间不同，因此它们被隔离保护。这种特权级别的典型用法就是：将操作系统的核心放在0层，操作系统的其余部分放在1级，2级留给中间软件使用，3级放应用程序，这样的安排的好处在于：操作系统的核心因为放在0层，因此它可以访问任务中所有的存储段，而1级的部分操作系统可以访问除0级以外的所有存储段，应用程序只能访问自身的存储段。
   b.不同任务间的保护,通过把每个任务放在不同的虚拟地址空间来实现隔离保护，虚拟地址到物理地址之间的映射由每个任务中的映射函数来决定，随着任务切换，映射函数也跟着切换，这样可以保证任务A映射到物理内存中的区域与任务B映射到内存中的区域是不同的，尽管有可能它们的虚拟地址空间相同，但它们最终在物理内存中的位置是不同的，从而起到了保护作用。

现在我们来做一个形象的比喻：

|AA|BB|CC|DD|EE|FFFFFFFF|GG|HHH|II|JJ|KK|LL|MM|NN(这个是物理内存)
其中的|就好象一把刀把我们的腊肠分砍成了很多截
然后呢
又把AA这一截砍成很多小快
每一小快呢
贴上小标签,比如(FF是可写的,长度是8)
然后呢,我们的GDTR指向AA
再然后呢
我们的DS装着一个数,这个数是表示要找的小标签在AA里是第几个小快(选择子)
然后呢,就得到这个小标签上指的那快腊肠了
然后这快腊肠很长
我们再用一个叫偏移的东西来表示从这个腊肠开始到我们要啃的地方的长度
这样呢
就晓得老我们要找的实际地址老塞

posted on 2009-04-09 22:54 jasonM 阅读(662) 评论(1) 编辑收藏举报