你的变量究竟存储在什么地方 && 全局内存【转】
节头部表 |
.strtab |
.line |
.debug |
.rel.data |
.rel.text |
.symtab |
.bss |
> .dataa (3) |
.rodata |
> .textt (1) |
ELF头 |
节 | 含义 |
.text | 已编译程序的机器代码 |
.rodata | 只读数据,如pintf和switch语句中的字符串和常量值 |
.data | 已初始化的全局变量 |
.bss | 未初始化的全局变量 |
.symtab | 符号表,存放在程序中被定义和引用的函数和全局变量的信息 |
.rel.text | 当链接器吧这个目标文件和其他文件结合时,.text节中的信息需修改 |
.rel.data | 被模块定义和引用的任何全局变量的信息 |
.debug | 一个调试符号表。 |
.line | 原始C程序的行号和.text节中机器指令之间的映射 |
.strtab | 一个字符串表,其内容包含.systab和.debug节中的符号表 |
#include<stdio.h> #include<string.h> #include<stdlib.h> int z = 9; int a; static int b =10; static int c; void swap(int* x,int* y) { int temp; temp=*x; *x=*y; *y=temp; } int main() { int x=4,y=5; swap(&x,&y); printf(“x=%d,y=%d,z=%d,w=%dn”,x,y,z,b); return 0; } |
变量 | 存储区域 |
a | .bss |
b | .data |
c | .bss |
x | stack |
y | stack |
temp | stack |
z | .data |
swap | .text |
main | .text |
x=…… | .rodata |
> > .filee "var.c" .globl z > .dataa #数据段 > .align 4 > .typee z, @object > .size z, 4 z: > .longg 9 > .align 4 > .typee b, @object > .size b, 4 b: > .longg 10 > .textt #代码段 .globl swap > .typee swap, @function swap: > pushll %ebp > movll %esp, %ebp > subl $4, %esp > movll 8(%ebp), %eax > movll (%eax), %eax > movll %eax, -4(%ebp) > movll 8(%ebp), %edx > movll 12(%ebp), %eax > movll (%eax), %eax > movll %eax, (%edx) > movll 12(%ebp), %edx > movll -4(%ebp), %eax > movll %eax, (%edx) > leave > ret > .size swap, .-swap > .sectionn .rodataa #只读段 .LC0: > .stringg "x=%d,y=%d,z=%d,w=%dn" > .textt #代码段 .globl main > .typee main, @function main: > pushll %ebp > movll %esp, %ebp > subl $40, %esp > andl $-16, %esp > movll $0, %eax > subl %eax, %esp > movll $4, -4(%ebp) > movll $5, -8(%ebp) > leall -8(%ebp), %eax > movll %eax, 4(%esp) > leall -4(%ebp), %eax > movll %eax, (%esp) > calll swap > movll b, %eax > movll %eax, 16(%esp) > movll z, %eax > movll %eax, 12(%esp) > movll -8(%ebp), %eax > movll %eax, 8(%esp) > movll -4(%ebp), %eax > movll %eax, 4(%esp) > movll $.LC0, (%esp) > calll printf > movll $0, %eax > leave > ret > .size main, .-main > .commm a,4,4 > .locall c > .commm c,4,4 > .sectionn .note.GNU-stack,"",@progbits > .identt "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)" |
字段名 | 含义 |
Num | 序号 |
Value | 符号地址。 可重定位目标文件:距定义目标文件的节的起始位置的偏移 可执行目标文件:一个绝对运行的地址 |
Size | 目标的大小 |
Type | 要么是数据,要么是函数,或各个节的表目 |
Bind | 符号是全局的还是本地的 |
Vis | 目前还没有查到资料,待以后改正 |
Ndx | 通过索引来表示每个节 ABS:不该被重定位的符号 UND:代表未定义的符号(在其他地方定义) COM:未初始化的数据目标 |
Name | 指向符号的名字 |
> …… .commm a,4,4 > .locall c > .commm c,4,4 > …… |
转载时请注明出处和作者联系方式:http://blog.csdn.net/absurd
作者联系方式:李先静 <xianjimli at hotmail dot com>
更新时间:2007-7-9
有 人可能会说,全局内存就是全局变量嘛,有必要专门一章来介绍吗?这么简单的东西,还能玩出花来?我从来没有深究它,不一样写程序吗?关于全局内存这个主题 虽然玩不出花来,但确实有些重要,了解这些知识,对于优化程序的时间和空间很有帮助。因为有好几次这样经历,我才决定花一章篇幅来介绍它。
正如大家所知道的,全局变量是放在全局内存中的,但反过来却未必成立。用static修饰的局部变量就是放在放全局内存的,它的作用域是局部的,但生命期是全局的。在有的嵌入式平台中,堆实际上就是一个全局变量,它占用相当大的一块内存,在运行时,把这块内存进行二次分配。
这里我们并不强调全局变量和全局内存的差别。在本文中,全局强调的是它的生命期,而不是它的作用域,所以有时可能把两者的概念互换。
一般来说,在一起定义的两个全局变量,在内存的中位置是相邻的。这是一个简单的常识,但有时挺有用,如果一个全局变量被破坏了,不防先查查其前后相关变量的访问代码,看看是否存在越界访问的可能。
在ELF格式的可执行文件中,全局内存包括三种:bss、data和rodata。其它可执行文件格式与之类似。了解了这三种数据的特点,我们才能充分发挥它们的长处,达到速度与空间的最优化。
1. bss
已经记不清bss代表Block Storage Start还是Block Started by Symbol。像这我这种没有用过那些史前计算机的人,终究无法明白这样怪异的名字,也就记不住了。不过没有关系,重要的是,我们要清楚bss全局变量有什么样特点,以及如何利用它。
通俗的说,bss是指那些没有初始化的和初始化为0的全局变量。它有什么特点呢,让我们来看看一个小程序的表现。
1 2 3 4 5 6 7 8 9 10 11 | int bss_array[1024 * 1024] = {0}; int main(int argc, char* argv[]) { return 0; } [root@localhost bss] # gcc -g bss.c -o bss.exe [root@localhost bss] # ll total 12 -rw-r--r-- 1 root root 84 Jun 22 14:32 bss.c -rwxr-xr-x 1 root root 5683 Jun 22 14:32 bss.exe |
变量bss_array的大小为4M,而可执行文件的大小只有5K。由此可见,bss类型的全局变量只占运行时的内存空间,而不占文件空间。
另外,大多数操作系统,在加载程序时,会把所有的bss全局变量全部清零,无需要你手工去清零。但为保证程序的可移植性,手工把这些变量初始化为0也是一个好习惯。
2. data
与bss相比,data就容易明白多了,它的名字就暗示着里面存放着数据。当然,如果数据全是零,为了优化考虑,编译器把它当作bss处理。通俗的说,data指那些初始化过(非零)的非const的全局变量。它有什么特点呢,我们还是来看看一个小程序的表现。
1 2 3 4 5 | int data_array[1024 * 1024] = {1}; int main( int argc, char * argv[]) { return 0; } |
[root@localhost data]# gcc -g data.c -o data.exe
[root@localhost data]# ll
total 4112
-rw-r--r-- 1 root root 85 Jun 22 14:35 data.c
-rwxr-xr-x 1 root root 4200025 Jun 22 14:35 data.exe
仅仅是把初始化的值改为非零了,文件就变为4M多。由此可见,data类型的全局变量是即占文件空间,又占用运行时内存空间的。
3. rodata
rodata的意义同样明显,ro代表read only,即只读数据(const)。关于rodata类型的数据,要注意以下几点:
l 常量不一定就放在rodata里,有的立即数直接编码在指令里,存放在代码段(.text)中。
l 对于字符串常量,编译器会自动去掉重复的字符串,保证一个字符串在一个可执行文件(EXE/SO)中只存在一份拷贝。
l rodata是在多个进程间是共享的,这可以提高空间利用率。
l 在有的嵌入式系统中,rodata放在ROM(如norflash)里,运行时直接读取ROM内存,无需要加载到RAM内存中。
l 在嵌入式linux系统中,通过一种叫作XIP(就地执行)的技术,也可以直接读取,而无需要加载到RAM内存中。
由此可见,把在运行过程中不会改变的数据设为rodata类型的,是有很多好处的:在多个进程间共享,可以大大提高空间利用率,甚至不占用RAM空间。同时由于rodata在只读的内存页面(page)中,是受保护的,任何试图对它的修改都会被及时发现,这可以帮助提高程序的稳定性。
4. 变量与关键字
static关键字用途太多,以致于让新手模糊。不过,总结起来就有两种作用,改变生命期和限制作用域。如:
l 修饰inline函数:限制作用域
l 修饰普通函数:限制作用域
l 修饰局部变量:改变生命期
l 修饰全局变量:限制作用域
const 关键字倒是比较明了,用const修饰的变量放在rodata里,字符串默认就是常量。对const,注意以下几点就行了。
l 指针常量:指向的数据是常量。如 const char* p = “abc”; p指向的内容是常量 ,但p本身不是常量,你可以让p再指向”123”。
l 常量指针:指针本身是常量。如:char* const p = “abc”; p本身就是常量,你不能让p再指向”123”。
l 指针常量 + 常量指针:指针和指针指向的数据都是常量。const char* const p =”abc”; 两者都是常量,不能再修改。