代码改变世界

glibc内存管理

2012-08-02 20:53  ggzwtj  阅读(2434)  评论(0编辑  收藏  举报

X86平台LINUX进程内存布局如下:

上面个段的含义如下:

  • text:存放程序代码的,编译时确定,只读;
  • data:存放程序运行时就能确定的数据,可读可写;
  • bss:定义而没有初始化的全局变量和静态变量;
  • heap:一般由程序员分配,如果不释放的话在程序结束的时候可能被OS回收;
  • stack:有编译器自动分配释放,存放函数的参数、局部变量等;
  • Mmap:映射区域;

程序可以直接使用系统调用来管理heap和mmap,但更多的时候是使用C提供的malloc和free来动态地分配和释放内存。Linux上的stack的限制大致是8M,而在Windows上为2M。


C风格的内存管理程序:

  • 也就是malloc和free,主要是通过brk或者mmap添加额外的虚拟内存。对于那些需要保持长期存储的程序使用malloc来管理内存可能会非常令人失望,如果有大量的不固定的内存引用,经常难以知道他们如何被释放。

池式内存管理:

  • 应用程序可以更简单地管理内存;内存分配和回收更快;可以预先分配错误处理池,以便程序在常规内存被耗尽时仍然可以恢复;有非常易于使用的标准实现。
  • 内存池只适用于操作可以分阶段的程序;通常不能和第三方库很好滴合作;如果程序的结构发生变化则不得不修改内存池;必须记住需要从哪个池进行分配。

引用计数:

  • 不能忘记调用引用计数函数;无法释放作为循环数据结构的一部分;在多线程环境中更难也更慢。

垃圾回收:

  • 永远不必担心内存的双重释放或者对象的生命周期;
  • 无法干涉何时释放内存;比其他形式的内才能管理更慢;如果忘记将不再使用的指针设置为null,仍然会有内存泄露(《Effective Java》中有讲)。

内存管理器的设计目标:

  1. 最大化兼容性;
  2. 最大化可移植性(能很好地和OS交流);
  3. 浪费最小的空间(管理自身的数据结构也是需要内存的,还有一个需要注意的是碎片); 
  4. 最快的速度(2/8原则,主要用来优化热点);
  5. 最大化可调性(能适应多种分配的需求,或者是通过配置来适应);
  6. 最大化局部性(这里考虑的是CPU的cache和内存之间的关系);
  7. 最大化调试功能(作为程序员就不用说了);
  8. 最大化适应性(在不修改配置时候的适应性);

ptmalloc实现了malloc和free以及一组其他函数,以提供动态内存管理的支持。分配器处于用户程序和内核之间,用来响应用户的分配请求,向操作系统申请内存,然后将其返回给用户程序。为了保持高效的分配,分配器一般都会预先分配一大块内存,并通过某种算法管理。用户释放掉的内存也并不是立即就返回给操作系统。ptmalloc在设计的时候折中了高效性、高空间利用率、高可用性等设计目标。其设计假设如下:

  1. 用mmap来分配长生命周期的大内存;
  2. 特别大的内存分配总是使用mmap;
  3. 短生命周期的内存分配使用brk;
  4. 尽量只缓存小的、临时使用的内存,而大的内存则直接归还给系统;
  5. 小内存块只有在malloc和free的时候进行合并;
  6. 收缩堆的条件是当前free的快的大小加上前后能合并的chunk的大小大于64K,并且堆顶的大小达到阀值;
  7. 需要长期存储的程序不适合ptmalloc;

总体上的结构如下:

而实际存在数据的是Chunk,使用中的Chunk的结构如下:

其中:

  • P:表示前一个Chunk是否在使用中;
  • M:标志Chunk是从那个内存区域获得的虚拟内存;
  • A:标志是否是主分配区;

空闲的Chunk在内存中的结构如下:

在glibc中使用bin来管理空闲的chunk,细节就不说了。当空闲的chunk被链接到bin中的时候,ptmalloc会检查他前后的chunk是否也是空闲的,如果是的话,就会合并成一个大的chunk。bin的结构如下:

ptmalloc为了提高分配的速度,会把一些小的chunk先放到Fast bins中。fast bins中的chunk并不改变它的使用标志P,这样也就无法将他们合并,当用户分配小的内存的时候,ptmalloc首先会在fast bins中查找响应的空闲块,然后再去查找Unsorted bins中空闲的chunk。被合并后的chunk、或者是不能放在fast bins中的chunk会首先放在Unsorted bin中,如果在分配的时候在Unsorted bin中无法满足要求,则将Unsorted bin中的chunk加入到bins中。

因为在分配内存的时候是用低地址到高地址分配的,这样一个分配到的大的内存(用来模拟sub-heap)的上面很有可能是有一块空闲的内存,也就是Top chunk。Top chunk是在fast bin和bins之后才考虑的,所以这段区间并不在bins这些结构中。如果ptmalloc设法在top chunk中分配一段空间时且top chunk不够大,这时会重新分配一个新的sub-heap,并将top chunk迁移到新的sub-heap上。新的sub-heap与已有的sub-heap用单向链表连接起来。如下:

当要分配的空间足够大的时候,ptmalloc会使用mmap来直接使用内存映射来讲页映射到进程空间。这样分配的chunk在被free时将直接接触映射,再次对这样的内存区域的引用将会引起段错误。

Last remainder chunk是另外一种特殊的chunk,在分配一个small chunk的时候,如果在small bins中找不到合适的chunk,如果last remainder chunk的大小大于所需的small chunk大小。那么它将会分裂成两个,一个供用户使用,另一个变成了新的Last remainder chunk。


ptmalloc的响应用户内存分配请求的具体步骤:

  1. 获取主分配区的锁,如果失败就查找非主分配区,再不行就创建新的非主分配区;
  2. 将用户请求的大小转换为实际需要分配的chunk空间的大小;
  3. 如果chunk_size<=max_fast则转4,否则,跳转5;
  4. 尝试在fast bins中分配,如果成功则结束返回;
  5. 如果chunk_size<=512B则下一步,否则跳转6;
  6. 查找对应的small bins,如果找到则分配成功;否则转7;
  7. 合并fast bins中的chunk,遍历unsorted bin中的chunk,如果只有一个chunk,并且这个chunk在上次的分配中被使用过,并且所需分配的chunk大小属于smallbins,并且chunk的大小满足要求,则直接将该chunk进行切割,分配结束;否则将其放入bins;
  8. 在large bins中查找;如果失败转9;
  9. 如果top chunk满足要求,则从中分配出一块;否则转10;
  10. 如果是主分配区,调用sbrk增加top chunk的大小;否则分配一个新的sub-heap;或者直接使用mmap来分配;如果需要用mmap分配转11,否则转12;
  11. 使用mmap系统调用为程序的内存空间映射一块空间,然后将指针返回给用户程序;
  12. 判断是否第一次调用malloc,若是主分配区,则进行一次初始化工作。否则根据10的规则来分配。 

为了避免Glibc内存暴增,使用时需要注意一下几点:

  1. 后分配的内存先释放(top chunk的考虑);
  2. 不适合用于管理长生命周期的内存,特别是持续不定期分配和释放长生命周期的内存;
  3. 不要关闭ptmalloc的mmap分配阀值动态调整机制;
  4. 多线程分阶段执行的程序不适合使用ptmalloc(更适合使用内存池);
  5. 尽量减少程序的线程数量和避免频繁分配、释放内存;
  6. ptmalloc对内存泄露非常敏感;
  7. 防止程序分配过多的内存而使得程序被因为OOM被系统杀掉。