堆基本概念
堆基本概念
ptmalloc2 是目前 Linux 标准发行版中使用的堆分配器。
内存分配基本思想
- 堆管理器负责向操作系统申请内存,然后将其返回给用户程序,但是频繁的系统调用会造成大量的开销。为了保持内存管理的高效性,内核一般都会预先分配很大的一块连续的内存,然后让堆管理器通过某种算法管理这块内存。只有当出现了堆空间不足的情况,堆管理器才会再次与操作系统进行交互。
- 一般来说,用户释放的内存并不是直接返还给操作系统的,而是由堆管理器进行管理。这些释放的内存可以来响应用户新申请的内存的请求。
堆的基本操作
malloc
malloc
(memory allocation) 函数是 C 语言标准库中用于动态内存分配的一个基本函数。它分配一块至少为 size 字节的连续内存区域,并返回一个指向这块内存的指针
void *malloc(size_t size);
malloc
函数返回对应大小字节的内存块的指针。此外,该函数还对一些异常情况进行了处理:
- 当
n = 0
时,返回当前系统允许的堆的最小内存块。 - 当
n
为负数时,由于在大多数系统上,size_t
是无符号数(这一点非常重要),所以程序就会申请很大的内存空间,但通常来说都会失败,因为系统没有那么多的内存可以分配。
realloc
realloc
函数用于重新分配之前通过 malloc
,calloc
或 realloc
函数分配的内存区域。它可以改变内存块的大小,或者释放内存块,或分配新的内存块。
void *realloc(void *ptr, size_t size);
ptr
:指向需要重新分配的内存块的指针。size
:新的内存块的大小,以字节为单位。
有如下情况:
ptr
不为空,size = 0
,相当于释放原来的堆块。ptr
为空且size > 0
,相当于malloc
。ptr
不为空,size
大于原来的堆块大小则如果该堆块后面的堆块空闲则合并堆块,否则先释放原堆块,然后再申请一个更大的堆块,原堆块内容会被拷贝过去。ptr
不为空,size
不大于原来的堆块大小,如果切割后剩下的堆块大于等于MINSIZE
则切割并释放,然后返回原堆块。
calloc
calloc
(contiguous allocation) 函数是 C 语言标准库中用于动态内存分配的一个函数。与 malloc
相似,calloc
用于分配内存。该函数在分配时会清空 chunk
上的内容,这使得我们无法通过以往的重复存取后通过 chunk
上残留的脏数据的方式泄露信息(例如通过 bins
数组遗留的脏数据泄露 libc 基址等),同时该函数不从 tcache
中拿 chunk
,但是 free()
函数默认还是会先往 tcache
里放的,这无疑增加了我们利用的难度。
void *calloc(size_t nmemb, size_t size);
nmemb
:需要分配的元素个数。size
:每个元素的大小,以字节为单位。
总的分配的字节大小是 nmemb * size
。
注意:如果 size 的 IS_MAPPED 位置 1 则不清空数据。
if (chunk_is_mmapped (p))
{
if (__builtin_expect (perturb_byte, 0))
return memset (mem, 0, sz);
return mem;
}
free
可以看出,free 函数会释放由 p 所指向的内存块。这个内存块有可能是通过 malloc 函数得到的,也有可能是通过相关的函数 realloc 得到的。
此外,该函数也同样对异常情况进行了处理:
- 当 p 为空指针时,函数不执行任何操作。
- 当 p 已经被释放之后,再次释放会出现乱七八糟的效果,这其实就是 double free。
- 除了被禁用 (mallopt) 的情况下,当释放很大的内存空间时,程序会将这些内存空间还给系统,以便于减小程序所使用的内存空间。
mallopt
mallopt
函数通过控制堆的特定参数用于改变堆的分配策略。
int mallopt(int param,int value)
- param:指定要修改的动态内存分配参数。这个参数是一个整数,定义了哪一个特性将会被修改。例如,它可以是控制内存对齐、缓存大小或者相似行为的选项。
M_MXFAST
:设置malloc
用于小块内存分配的最大 fast bin 的大小。M_TRIM_THRESHOLD
:设置sbrk
释放内存回操作系统的阈值。M_TOP_PAD
:设置sbrk
请求额外内存时,上面的额外内存量。M_MMAP_THRESHOLD
:设置使用mmap
进行内存分配的阈值。M_MMAP_MAX
:设置可以使用mmap
进行内存分配的最大数目。
value
:新的值,针对 param 指定的特性。具体的值取决于 param,有些特性可能需要非零值来启用,零值来禁用,有些则需要具体的数值。- 返回值是一个整数,指示函数调用是否成功。
- 如果成功,返回非零值。
- 如果失败(例如,不支持的参数或值),返回零。
内存分配背后的系统调用
内存管理函数背后的系统调用主要是 (s)brk 函数以及 mmap, munmap 函数。
在 main arena 中通过 sbrk 扩展 heap,而在 thread arena 中通过 mmap 分配新的 heap。
(s)brk
对于堆的操作,操作系统提供了 brk 函数,glibc 库提供了 sbrk 函数,我们可以通过增加 brk 的大小来向操作系统申请内存。
初始时,堆的起始地址 start_brk 以及堆的当前末尾 brk 指向同一地址。根据是否开启 ASLR,两者的具体位置会有所不同
不开启 ASLR 保护时,start_brk 以及 brk 会指向 data/bss 段的结尾。
开启 ASLR 保护时,start_brk 以及 brk 也会指向同一位置,只是这个位置是在 data/bss 段结尾后的随机偏移处。
mmap
malloc 会使用 mmap 来创建独立的匿名映射段。匿名映射的目的主要是可以申请以 0 填充的内存,并且这块内存仅被调用进程所使用。
--转载自jelasin
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)