[Pthread] Linux中的内存管理(四)--Heap

分类： Linux2008-09-06 14:52 1026人阅读评论(0) 收藏举报

前几次我们分析了Linux系统中用户进程的4G虚存大致分为了几个部分，介绍了3G用户空间中数据段，代码段等静态区域的虚存管理，重点分析了栈的使用。这次我们来分析一下虚存使用中另一个重要部分--堆。前面的介绍中，我们知道编译器，操作系统担负着大量栈分配管理的工作。不论是静态分配的栈空间还是用户动态分配的栈空间，在函数返回的时候就自动释放了。堆的使用比之栈而言更为灵活，允许程序员动态的分配并释放，但也意味着，堆的使用需要程序员更为小心。

4.5 堆的内存管理

在学习"数据结构"的时候，我们知道堆，栈都是基本的数据结构。但是在内存管理的时候，虽然我们常常将堆区和栈区放到一起来说，但其实他们在很多方面都存在着不同。栈区内确实是栈数据结构，并且由计算机硬件，操作系统，以及编译器配合完成，是计算机运行的基本数据结构。在汇编语言中，我们常说的"堆栈"，其实就是指的栈。堆区其实指的是在程序运行过程中动态分配的内存区域，它的管理通常在函数库中完成。之所以叫做堆是因为通常是使用堆这种数据结构来管理分配的内存。换句话说，其实也可以用任何的数据结构来管理，甚至是一个简单的链表。之所以用堆，是因为在速度，空间利用，和可调节性上，堆有着其自己的优势。

4.5.1 堆管理的相关库函数

在ISO C中规定了三个动态分配内存的函数，分别是：
        void *malloc(size_t size);
        void *calloc(size_t nmemb, size_t size);
        void *realloc(void *ptr, size_t size);
在这三个库函数中，大家最常用的就是malloc。调用malloc函数可以分配长度为size的内存空间,内存空间的数据没有初始化。其返回值就是指向这段被分配空间的指针。calloc和malloc相似,只不过返回的是一个有nmemb个元素的数组，每个元素的大小是size bytes。也就是分配了nmemb*size大小的内存空间，并将空间内的数据都初始化为0。
realloc是一个比较奇妙的函数，它能将ptr指向的内存块改为size bytes(ptr由先前malloc,calloc,realloc函数返回)。如果size比以前ptr指向的内存块大，则会增加分配一块内存，新增的内存块没有初始化。如果size比以前的内存小，则会删除一块内存。而保留下来的旧内存里的数据则不会有变化。如果ptr==NULL，则realloc等价于malloc函数，而如果size==0,则realloc等价于free(ptr)函数。realloc的返回值要特别注意。realloc的作用，是对ptr指向的内存大小进行重新调整，但是调整之后的内存空间和原来的内存空间可能不是同一内存地址。也就是说ptr指向的内存块因大小调整被移动了。所以要把realloc返回的地址指针重新赋值给ptr,即:
        ptr = realloc(ptr,size);

    free函数是被用于释放被分配内存的函数：
        void free(void *ptr);

4.5.2 堆管理的相关系统调用

malloc系列函数的实现与Linux中提供的两个基本调用是分不开的：
    int brk(void *end_data_segment);
    void *sbrk(intptr_t increment);
brk: brk()的作用和它的名字一样用于打破系统给进程设置的访存限制，用于设定进程的内存边界。如前文所述，堆是从虚存低地址向高地址增长。brk()用于设定堆访存的上限，也就是堆顶。就像是一个盖子，随着堆的分配释放而上下移动。在这个盖子之下的内存空间，操作系统都认为是合法的。与brk()相关的还有一个sbrk()函数，sbrk()不是系统调用，而是一个库函数。sbrk(+/-n)意味着将当前访存的上限增加/减少n个字节。

    void *mmap(void *addr, size_t len, int prot, int flags, int fildes, off_t off);
    int munmap(void *addr, size_t len);
mmap: mmap()的使用较brk()更为灵活，用途也更为广泛。可以将虚拟内存地址映射到文件，共享内存等，方便用户以访存的方式读写文件，完成进程间通信。当然映射后虚存地址就变为合法的了。所以在堆分配的时候，常常借用mmap能向进程添加可访问虚存空间的能力，加之并不需要读写文件等别的要求，所以一般用匿名映射(MAP_ANONYMOUS)来完成。munmap与之所做的事情相反，常用以释放mmap分配的虚存。

4.5.3 堆的内部管理

对于程序员而言,主要是通过malloc/free来使用动态分配的内存。malloc的实现方式有很多，Glibc中使用的是Doug Lea和Wolfram Gloger实现的版本(dlmalloc),此外还有phkmalloc，Solaris上的malloc等。当然你也完全可以自己实现一个简单的malloc。无论实现版本怎样malloc包含着两部分的内容:内存分配和内存管理。

4.5.3.1 堆空间内存分配

当malloc()分配内存的时候，首先会先调用上面提到的brk()或者mmap()来向操作系统申请一块内存。其实也就是让操作系统知道这块内存的虚存地址是有效的。在使用这些虚存地址的时候为其分配相应的物理内存，而不是报Segmentation fault.
    ...
    int *l = sbrk(0);
    k=l+1023;
    printf("k=%d,at %p/n",*k,k);
    ...
    运行程序将会抛出：
    Segmentation fault

    如果改为：
    ...
    int *l = sbrk(0);
    sbrk(1);
    k=l+1023;
    printf("k=%d,at %p/n",*k,k);
    ...
    程序将正常运行，并输出：
    k=100,at 0x804affc

第一段代码出错是因为程序访问了还没分配的内存，超过了当前堆的上限。第二段代码使用了sbrk(1)动态分配了内存，所以访问就成功了。注意虽然这里sbrk(1)，表面上只把当前堆增加了1个字节。但是因为系统的内存分配是以页为单位的，当前堆实际增加了4KB, 因此对k = l+1023的访问也是合法的。

brk()和mmap()虽然在内存分配的时候用途一样，但是各有各的优点，每次brk()的虚存空间是连续的，便于合并，重用，并更为节省页对齐浪费的空间，但是可能形成内存空洞(见下文)，适合较小的内存分配。mmap()不会像brk()那样形成空洞，但不能复用，合并。且开销和具体的平台相关，并会把分配的内存初始化为0，所以适合大空间的分配。在dlmalloc中，如果malloc分配的内存小于128KB, 使用brk()来增加进程使用的内存。如果分配的内存大于等于128KB，则使用mmap()来分配内存(128KB这个值在不同的平台上是可调的)。
    下面来看一个例子：
    ...
    int *heap_var = malloc(sizeof(int));　//较小的内存块分配请求
    int *large_var = malloc(256*1024);    //较大的内存块分配请求
    printf("Address of heap_var (Heap):%p/n",heap_var);
    printf("Address of large_var (Heap):%p/n",large_var);
    ...
    输出结果为：
    Address of heap_var (Heap):0x804a008
　　Address of large_var (Heap):0xb7db2008

    如果用strace命令跟踪，可以发现这段代码执行了如下的系统调用：
    brk(0x806b000)                          = 0x806b000
    mmap2(NULL, 266240, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0xb7db2000
我们可以清楚地看到，对于较小的内存分配，使用了brk()系统调用，对于较大的内存块分配请求，使用了mmap系统调用。并且我们发现这两个地址相差较远，所以堆区常又被分为两个部分，一个是brk分配的内存，通常位于低地址。另一个是mmap分配的内存，也叫地址映射区，通常位于高地址。当然用不同系统调用分配的内存，也可以混合管理，这取决于具体的实现。

4.5.3.2 堆空间的内存管理

接下来就是要对用brk和mmap分配好内存进行管理了。因为brk()，mmap()是系统调用，如果每次调用malloc动态分配内存都执行一次系统调用，那开销是比较大的。再者，如果每次申请的内存较小，但是系统分配的内存都是固定大小的倍数(一般是4KB,一页)，这样就会有大量的浪费。所以malloc一般会实现一个内存堆来管理这些内存,malloc分配的内存都会以若干chunk的方式放到内存堆中。每次用户调用malloc动态分配内存的时候，malloc会先到内存堆里进行查找，如果内存堆里没有合适的空闲chunk，再利用brk/malloc系统调用分配一大块内存，然后把新分配的大块内存放到内存堆中，并生成一块合适的chunk块返回给用户。当用户用free释放chunk的时候，可能并不立即使用系统调用释放内存，而是将释放的chunk作为空闲chunk加入内存堆中，和其他的空闲chunk合并，便于下次分配的时候再次使用。

一般说来，释放的chunk如果标记为mmap申请的，则使用munmap释放。如果是brk申请的，进一步判断堆顶之下的空闲chunk是否大于128KB，如果是，则使用brk()释放。如果小于128KB，仍由内存堆维护。这样对brk()的使用就会有个问题，当brk()释放的内存块在堆顶之下，且内存块到堆顶之间还有未释放的内存。那么这块内存的释放将不会成功，从而形成内存空洞。

malloc中为每块chunk都会分配一个数据结构用于管理，也就是chunk head。chunk head有多大？我们来看看malloc(0)时的情况。
    ...
    int *heap_var = malloc(0);
    int *heap_var1 = malloc(0);
    printf("Address of heap_var: %p/n",heap_var);
    printf("Address of heap_var1: %p/n", heap_var1);
    ...
    这段代码的输出为：
    Address of heap_var: 0x804a008
    Address of heap_var1: 0x804a018
两者指向的位置相差了16个字节，可以看出，对于malloc(0)，也会分配16个字节供chunk head使用，即便这个chunk内包含的内存大小为0。而在c99标准中则对malloc(0)的返回未定义。chunk head中记录的一个很重要的信息就是当前chunk的大小。当malloc一块chunk的时候，malloc的内存大小就存放在chunk head中，释放的时候通过地址指针，找到相应块的chunk_head，从而知道要释放的chunk大小。这也是为什么我们在malloc的时候需要指定分配内存的大小，而释放的时候只需要给出释放内存的地址指针就行了。如果free(p)时的指针不是malloc时得到的，那么malloc就会报Segmentation fault，或者./chunk: free(): invalid pointer。

4.5.4 堆物理内存的使用

堆的使用和栈的使用一样，都是虚存中的概念。堆物理内存的使用和栈也一样，采用了延迟分配策略。只有当真正使用虚存的时候才分配相应的物理内存。如：
    ...
    int *large_var = malloc(4*1024*1024);
    free(large_var);
    ...

查看/proc/pid/statm，第一列为虚拟内存大小，第二列是进程所使用的物理内存大小，都是以页面(4k)为单位。
    malloc之前: 342 78 63 1 0 27 0
    malloc之后；1367 86 70 1 0 1052 0
    free之后： 342 85 70 1 0 27 0
可以看到，malloc之后因为large_var没有被使用，所以虽然虚拟内存增加了1000多个页面(约4M)，但是物理内存只增加了几个页面。

    如果程序改为:
    ...
    int *large_var = malloc(4*1024*1024);
    memset(large_var,0,4*1024*1024);
    free(large_var);
    ...

再次查看/proc/pid/statm,结果为:
    malloc之前: 343 78 63 1 0 28 0
    malloc之后: 1368 1110 70 1 0 1053 0
    free之后:    343 85 70 1 0 28 0
因为用memset使用了分配的内存，所以这次不仅虚存增加了1000多个页面，物理内存相应也增加了1000多个页面。

4.5.5 内存泄漏
在堆的使用过程中，一个很重要的问题就是"内存泄漏"。也就是malloc出来的内存，在不使用之后，用户未能及时调用free释放。因为虚存没有释放，相应的物理内存也没有释放，内存泄漏的堆积最终将耗尽系统所有的内存。为了克服内存泄漏问题，Small Pointer, Garbage Collection等技术被大量的研究和使用。但最有效的办法还是在编写程序的时候时刻留意这个问题，小心处理每一次malloc操作。但是"内存泄漏"只是运行时问题，当进程结束的时候，操作系统就会收回所有分配给进程的内存。

小结:
1. 无论是堆，还是栈都是对虚存的操作和管理。
2. 系统调用brk()和mmap()用来动态分配虚存空间，也就是表明这些虚存地址是合法的，访问的时候，系统应为其分配物理内存，而不是报错。
3. 堆的本质是动态申请的虚存空间。理论上可以用任何方式去管理这块空间。但数据结构--"堆"是最常用的一种，所以这块分配的空间常称为被堆。
4. 和栈不一样，堆的管理是在用户函数库中进行，malloc/free等函数是堆的入口。
5. 每次分配的内存块大小都会被记录下来，释放的时候只需要指定要释放的内存地址就行了。这就是为什么malloc的时候要指定大小，free的时候不用。
6. 堆和栈一样，仍然使用了物理内存的延迟分配策略。

posted @ 2013-05-27 11:21 tangr206 阅读(253) 评论(0) 收藏举报

刷新页面返回顶部

tom

tangr206's blog

[Pthread] Linux中的内存管理(四)--Heap