进程环境之C程序的存储空间布局
从历史上讲,C程序一直由下面几部分组成:
- 正文段。这是由CPU执行的机器指令部分。通常,正文段是可共享的,所以即使是频繁执行的程序(如文本编辑器、C编译器和shell等)在存储器中也只需有一个副本,另外,正文段常常是只读的,以防止程序由于意外而修改其自身的指令。
- 初始化数据段。(所有带有初始值的全局变量)通常将此段称为数据段,它包含了程序中需明确地赋初值的变量。例如,C程序中出现在任何函数之外的声明:
int maxcount = 99;
使此变量带有其初值存放在初始化数据段中。
- 非初始化数据段。(所有未带初始值的全局变量)通常将此段称为bss段,这一名称来源于一个早期的汇编运算符,意思是“block started by symbol”(由符号开始的块),在程序开始执行之前,内核将此段中的数据初始化为0或空指针。出现在任何函数外的C声明:
long sum[1000];
使此变量存放在非初始化数据段中。
- 栈。(局部变量和形参)自动变量以及每次函数调用时所需保存的信息都存放在此段中。每次调用函数时,其返回地址以及调用者的环境信息(例如某些机器寄存器的值)都存放在栈中。然后,最近被调用的函数在栈上为其自动变量和临时变量分配存储空间。通过这种方式使用栈,可以递归调用C函数。递归函数每次调用自身时,就使用一个新的栈帧,因此一个函数调用实例中的变量集不会影响另一个函数调用实例中的变量。
- 堆。通常在堆中进行动态存储分配。由于历史上形成的惯例,堆位于非初始化数据段和栈之间。
图7-3 典型的存储器安排
图7-3显示了这些段的一种典型安排方式(但并不要求非如此不可)。这是程序的逻辑布局。对于x86处理器上的Linux,正文段从0x08048000单元开始,栈底则在0xC0000000之下开始(在这种特定结构中,栈从高地址向低地址方向增长。但是栈并不一定要向低地址方向扩充,这是针对这种特定结构而言是向低地址方向扩充)。堆顶和栈底之间未用的虚地址空间很大。
a.out中还有若干其他类型的段,例如,包含符号表的段、包含调试信息的段以及包含动态共享库链接表的段等等。这些部分并不装载到进程执行的程序映像中。
从图7-3还可注意到,未初始化数据段的内容并不存放在磁盘上的程序文件中。其原因是,内核在程序开始运行前将它们都设置为0。需要存放在程序文件中的段只有正文段和初始化数据段。
size(1)命令报告正文段、数据段和bss段的长度(单位:字节)。例如:
[root@localhost apue]# size /usr/bin/cc /bin/sh text data bss dec hex filename 192895 2024 2068 196987 3017b /usr/bin/cc 695049 19356 19148 733553 b3171 /bin/sh
第4列和第5列分别以十进制和十六进制表示的三个段的总长度。
本篇博文内容摘自《UNIX环境高级编程》(第二版),仅作个人学习记录所用。关于本书可参考:http://www.apuebook.com/。