C++内存管理——指针&&数组

C++/C程序中,指针和数组在不少地方可以相互替换着用,让人产生一种错觉,以为两者是等价的。但二者有着本质的区别:
数组:要么在静态存储区被创建(如全局数组),要么在上被创建。数组名对应着(而不是指向)一块内存,其地址与容量在生命期内保持不变,只有数组的内容可以改变。
指针:可以随时指向任意类型的内存块,它的特征是“可变”,所以我们常用指针来操作动态内存。指针远比数组灵活,但也更危险。
下面以字符串为例比较指针与数组的特性:

1.修改内容

实例1代码中,字符数组a的容量是6个字符,其内容为hello。a的内容可以改变,如a[0]= ‘X’。指针p指向常量字符串“world”(位于静态存储区,内容为world),常量字符串的内容是不可以被修改的。从语法上看,编译器并不觉得语句p[0]= ‘X’有什么不妥,但是该语句企图修改常量字符串的内容而导致运行错误。

View Code1
实例1 修改数组和指针内容 
char a[] = “hello”;
a[0] = ‘X’;cout << a << endl;
char *p = “world”; // 注意p指向常量字符串
p[0] = ‘X’; // 编译器不能发现该错误
cout << p << endl;

2.内容复制与比较

不能对数组名进行直接复制与比较。示例2中,若想把数组a的内容复制给数组b,不能用语句 b = a ,否则将产生编译错误。应该用标准库函数strcpy进行复制。同理,比较b和a的内容是否相同,不能用if(b==a) 来判断,应该用标准库函数strcmp进行比较。
  指针应用中,语句p = a 并不能把a的内容复制指针p,而是把a的地址赋给了p。要想复制a的内容,可以先用库函数malloc为p申请一块容量为strlen(a)+1个字符的内存,再用strcpy进行字符串复制。同理,语句if(p==a) 比较的不是内容而是地址,应该用库函数strcmp来比较。

View Code 2
实例2 数组和指针的内容复制与比较
// 数组…
char a[] = "hello";char b[10];
strcpy(b, a); // 不能用 b = a;
if(strcmp(b, a) == 0) // 不能用 if (b == a)

// 指针…
int len = strlen(a);
char *p = (char *)malloc(sizeof(char)*(len+1));
strcpy(p,a); // 不要用
p = a;if(strcmp(p, a) == 0) // 不要用 if (p == a)

3.计算内存容量

用运算符sizeof可以计算出数组的容量(字节数)。示例3-1中,sizeof(a)的值是12(注意别忘了'\0')。指针p指向a,但是sizeof(p)的值却是4。这是因为sizeof(p)得到的是一个指针变量的字节数,相当于sizeof(char*),而不是p所指的内存容量。C++/C语言没有办法知道指针所指的内存容量,除非在申请内存时记住它。注意当数组作为函数的参数进行传递时,该数组自动退化为同类型的指针。示例3-2中,不论数组a的容量是多少,sizeof(a)始终等于sizeof(char *)。

View Code 3
实例3-1 计算数组和指针的内存容量 
char a[] = "hello world";
char *p = a;
cout<< sizeof(a) << endl; // 12字节
cout<< sizeof(p) << endl; // 4字节
View Code 4
实例3-2 数组退化为指针 
void Func(char a[100])
{ 
cout<< sizeof(a) << endl; // 4字节而不是100字节
}


4.指针参数是如何传递内存的?

如果函数的参数是一个指针,不要指望用该指针去申请动态内存。示例4-1中,Test函数的语句GetMemory(str, 200)并没有使str获得期望的内存,str依旧是NULL,为什么?

View Code 5
实例4-1 试图用指针参数申请动态内存
void GetMemory(char *p, int num) 
{ 
p = (char *)malloc(sizeof(char) * num);
}
void Test1(void)
{ 
char *str = NULL; 
GetMemory(str, 100); // str 仍然为 NULL  
strcpy(str, "hello"); // 运行错误
}

 

毛病出在函数GetMemory中。编译器总是要为函数的每个参数制作临时副本,指针参数p的副本是 _p,编译器使 _p = p。如果函数体内的程序修改了_p的内容,就导致参数p的内容作相应的修改。这就是指针可以用作输出参数的原因。在本例中,_p申请了新的内存,只是把_p所指的内存地址改变了,但是p丝毫未变。所以函数GetMemory并不能输出任何东西。事实上,每执行一次GetMemory就会泄露一块内存,因为没有用free释放内存。

(每次执行GetMemory,_p就会申请新的内存,_p的地址就会改变,堆内存需要手动释放,而函数中没有free释放内存,所以每执行一次GetMemory就会泄露一块内存。)

如果非得要用指针参数去申请内存,那么应该改用“指向指针的指针”,见示例4-2

View Code6
实例4-2 用指向指针的指针申请动态内存
void GetMemory2(char **p, int num)
{ 
*p = (char *)malloc(sizeof(char) * num);
}
void Test2(void)
{ 
char *str = NULL; 
GetMemory2(&str, 100); // 注意参数是 &str,而不是str 
strcpy(str, "hello");  
cout<< str << endl; 
free(str);
}

 **p的内容是指针p的地址,&str是指针str的地址

由于“指向指针的指针”这个概念不容易理解,我们可以用函数返回值来传递动态内存。这种方法更加简单,见示例4-3

View Code 7
实例4-3  用函数返回值来传递动态内存
char *GetMemory3(int num)
{ 
char *p = (char *)malloc(sizeof(char) * num); //返回堆中的地址 
return p;
}
void Test3(void)
{ 
char *str = NULL; 
str = GetMemory3(100);  
strcpy(str, "hello"); 
cout<< str << endl; 
free(str);
}

 GetMemory3的返回值类型是char类型的指针,所以return p 返回的是指针p的地址。(char类型的指针是说指针所指向的内容是char类型)

 用函数返回值来传递动态内存这种方法虽然好用,但是常常有人把return语句用错了。这里强调不要用return语句返回指向“栈内存”的指针,因为该内存在函数结束时自动消亡,见示例4-4

View Code 8
实例4-4  return语句返回指向“栈内存”的指针
char *GetString(void)
{ 
char p[] = "hello world"; //返回栈中的地址 
return p; // 编译器将提出警告
}
void Test4(void)
{ 
char *str = NULL; 
str = GetString(); // str 的内容是垃圾 
cout<< str << endl;
}

 char p[] 是在栈中分配内存。

用调试器逐步跟踪Test4,发现执行str = GetString语句后str不再是NULL指针,但是str的内容不是“hello world”而是垃圾。因为char p[]在栈上分配空间,一旦函数结束,所分配的空间就会被释放了。

如果把示例4-4改写成示例4-5,会怎么样?

View Code 9
实例4-5 return语句返回常量字符串
char *GetString2(void)
{ 
char *p = "hello world"; 
return p;
}
void Test5(void)
{ 
char *str = NULL; 
str = GetString2(); 
cout<< str << endl;
}

函数Test5运行虽然不会出错,但是函数GetString2的设计概念却是错误的。因为GetString2内的“hello world”是常量字符串,位于静态存储区,它在程序生命期内恒定不变。无论什么时候调用GetString2,它返回的始终是同一个“只读”的内存块。

 5.char []与 char *的区别

以下面两个变量为例:

char a[]="hello";

char *b="hello";

 (1)数组对应着一块内存区域,而指针是指向一块内存区域数组的地址和容量在生命期里不会改变,只有数组的内容可以改变;而指针所指向的内存区域的大小可以随时改变,而且当指针指向常量字符串时,它的内容是不可以被修改的,否则在运行时会报错

数组a需要在内存中占用6个字节的空间,这段内存区通过名字a来标识。

指针b则需要4个字节的空间来存放地址,这4个字节用名字b来标识,其中存放的地址可以指向几乎任何地方,也可以哪里都不指向,即空指针。在这里,指针b指向某个连续的6字节的空间,即字符串"hello",该字符串存放在常量区,常量区的内容不能被修改。不能修改*b的值,比如b[2]='d'(将"hello"中第3个字符改为'd'),会导致程序崩溃。

(2)以a[2]和b[2]为例,二者都返回字符‘l’,但是编译器产生的执行代码却不一样。对于a[2],执行代码是从a的位置开始,向后移动2两个字节,然后取出其中的字符。对于b[2],执行代码是从p的位置取出一个地址,在其上加2,然后取出对应内存中的字符。

(3)char *b = "hello";实际上先是在文字常量区分配了一块内存放"hello",然后在栈上分配一地址给b并指向存放"hello"这块地址,然后改变常量"hello"自然会崩溃,然而char a[] = "hello",实际上"hello"分配内存的地方在栈区。在以后的存取中,在栈上的数组比指针所指向的字符串快。

(4)下面代码详细注明了各个变量所在的内存区:

//main.cpp
int a=0;    //全局初始化区
char *p1;   //全局未初始化区
main()
{
   int b;栈
   char s[]="abc";   //
   char *p2;         //
   char *p3="123456";   //123456\0在常量区,p3在栈上。
   static int c=0//全局(静态)初始化区
   p1 = (char*)malloc(10);
   p2 = (char*)malloc(20);   //分配得来得10和20字节的区域就在堆区。
   strcpy(p1,"123456");   //123456\0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方。
}

 


 

posted @ 2011-11-17 10:21  fly1988happy  阅读(2035)  评论(0编辑  收藏  举报