C++变量存储类别和内存四区
变量存储类别
变量声明/定义的一般形式:
存储类别 数据类型 变量名
存储类别指的是数据在内存中存储的方法。存储方法分为静态存储和动态存储两大类。标准C语言为变量、常量和函数定义了4种存储类型:extern、auto、static、register。根据变量的存储类别,可以知道变量的作用域和存储期。这4种存储类型可分为两种生存期限:永久的(在整个程序执行期都存在)和临时的(暂时保存在堆栈和寄存器中)。extern和static用来标识永久生存期限的“变量和函数”,而anto和register用来标识临时生存期限的"变量"。只有变量才有临时生存期限。一个变量和函数只能具有一个存储类型,也只能有一种生存期限。
内存中供用户使用的空间有三部分:
- 程序区:存放程序的可执行代码;
- 静态存储区:存放静态变量(全局变量和静态局部变量);
- 动态存储区:存放函数调用时调用函数的现场保护和返回地址、函数形参、自动局部变量;
变量的声明分为”定义性声明“(需建立存储空间,如:int a;)和”引用性声明“(不需建立存储空间,如extern a;)。广义上讲,声明包括定义,一般为叙述方便,把建立存储空间的声明称定义,而不不需建立存储空间的声明称声明。
auto
函数中的局部变量,如果不用关键字static加以声明,编译系统对它们是动态地分配存储空间的。函数的形参和在函数中定义的变量(包括在复合语句中定义的变量)都属此类。在调用该函数时,系统给形参和函数中定义的变量分配存储空间,数据存储在动态存储区中。在函数调用结束时就自动释放这些空间。如果是在复合语句中定义的变量,则在变量定义时分配存储空间,在复合语句结束时自动释放空间。因此这类局部变量称为自动变量(auto variable)。自动变量用关键字auto作存储类别的声明。
对自动变量赋初值,不是在编译时进行的,而是在函数调用时进行。对自动变量来说,若不赋初值,则它的值是一个不确定的值。
int Fun(int a) { auto int b, c=3; //定义b和c为整型的自动变量,auto可省略 b = c + a; return b; }
register
一般情况下,变量的值是存放在内存中的。当程序中用到哪一个变量的值时,由控制器发出指令将内存中该变量的值送到CPU中的运算器。经过运算器进行运算,如果需要存数,再从运算器将数据送到内存存放。为提高执行效率,C++允许将局部变量的值放在CPU中的寄存器中,需要用时直接从寄存器取出参加运算,不必再到内存中去存取。这种变量叫做寄存器变量,用关键字register作声明。寄存器变量的分配方式是动态分配的。
由于CPU中的通用寄存器数目有限,通常只把少数使用频繁的变量定义为寄存器变量。对超出寄存器数目的寄存器变量作一般自动变量处理。
只有局部自动变量和形式参数可作为寄存器变量,其他(如全局变量、局部静态变量等)不行。在程序中定义寄存器变量对编译系统只是建议性(而不是强制性)的。当今的优化编译系统能够识别使用频繁的变量,自动地将这些变量放在寄存器中。
extern
全局变量(外部变量)是在函数的外部定义的,它的作用域为从变量的定义处开始,到本程序文件的末尾。在此作用域内,全局变量可以为本文件中各个函数所引用。编译时将全局变量分配在静态存储区。有时需要用extern来声明全局变量,以扩展全局变量的作用域。
1) 在一个文件内声明全局变量
如果外部变量不在文件的开头定义,其有效的作用范围只限于定义处到文件终了。如果在定义点之前的函数想引用该全局变量,则应该在引用之前用关键字extern对该变量作外部变量声明,表示该变量是一个将在下面定义的全局变量。有了此声明,就可以从声明处起,合法地引用该全局变量,这种声明称为提前引用声明。
用extern声明外部变量时,类型名可写可不写。例如," extern int A , B ; " 也可写成 " extern A , B ; "。
2) 在多文件的程序中声明外部变量
如果一个程序包含两个文件,在两个文件中都要用到同一个外部变量num,不能分别在两个文件中各自定义一个外部变量num。正确的做法是:在任一个文件中定义外部变量num,而在另一文件中用extern对num作外部变量声明,即 " extern int num " 或 " extern num ";编译系统由此知道num是一个已在别处定义的外部变量,它先在本文件中找有无外部变量num,如果有,则将其作用域扩展到本行开始,如果本文件中无此外部变量,则在程序连接时从其他文件中找有无外部变量num,如果有,则把在另一文件中定义的外部变量num的作用域扩展到本文件,在本文件中可以合法地引用该外部变量num。
static
所有全局变量和用关键字static作存储类型说明的局部变量称为静态变量。静态变量存放在静态存储区,一旦为其分配了存储单元,它们在整个程序执行期间将固定地占用这些存储单元。若非必要,不要多用静态局部变量。
对全局变量,static使其局部化(局部于本文件),静态全局变量仅能为本源文件中各函数使用,不能为本源文件以外的其他源文件使用。
对局部变量,static使其由动态存储变为静态存储,静态局部变量仅能为本函数使用,其他函数不能使用和影响它们。静态局部变量是在编译时赋初值的,且只赋初值一次。如在定义局部变量时不赋初值的话,则对静态局部变量来说,编译时自动赋初值0(对数值型变量)或空字符(对字符变量)。
注:
内部函数也称静态函数,不能被其他文件中的函数使用。定义内部函数时,在函数名和函数类型的前面加static即可。
在C语言中,函数前如果无关键字extern,隐含其为外部函数。若需在其他文件的函数中调用此外部函数,只需在调用的文件中用extern声明该外部函数。
内存四区
栈区(stack)
由编译器自动分配释放,存放函数的参数值、局部变量的值等;其操作方式类似于数据结构中的栈。
堆区(heap)
一般由程序员分配释放(动态内存申请与释放),若程序员不释放,程序结束时可能由操作系统回收。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表。
全局区/静态区(static)
全局变量和静态变量的存储是放在一起的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域,该区域在程序结束后由操作系统释放;
常量区:字符串常量和其他常量的存储位置,程序结束后由操作系统释放。
程序代码区(code)
存放函数的二进制代码。
函数调用模型必须和程序四内存区综合起来考虑:
主调函数分配的内存(栈区、堆区、全局区)都可以在被调用函数中使用;
被调用函数中分配的内存,要分情况:在栈区中分配的内存,在主调函数中是不能使用的;
附加说明
C++prime时里面有句话(p201页):不要返回局部对象的指针和引用。(更具体的说不能返回栈中超过栈顶的对象的指针),如果该对象是通过new分配的(处于堆中),或者是static(处于数据段data),或者在函数的调用之前创建的局部对象,则可以返回这种对象的地址。
高洪臣 (Gavin Gao)
cggos@outlook.com
=======================================================================