C/C++数组名与指针区别深入探索(转载)

转载自： C/C++数组名与指针区别深入探索

引言

　　指针是C/C++语言的特色，而数组名与指针有太多的相似，甚至很多时候，数组名可以作为指针使用。于是乎，很多程序设计者就被搞糊涂了。而许多的大学老师，他们在C语言的教学过程中也错误得给学生讲解："数组名就是指针"。很幸运，我的大学老师就是其中之一。时至今日，我日复一日地进行着C/C++项目的开发，而身边还一直充满这样的程序员，他们保留着"数组名就是指针"的误解。

　　想必这种误解的根源在于国内某著名的C程序设计教程。如果这篇文章能够纠正许多中国程序员对数组名和指针的误解，笔者就不甚欣慰了。借此文，笔者站在无数对知识如饥似渴的中国程序员之中，深深寄希望于国内的计算机图书编写者们，能以"深入探索"的思维方式和精益求精的认真态度来对待图书编写工作，但愿市面上多一些融入作者思考结晶的心血之作！

　　魔幻数组名

　　请看程序（本文程序在WIN32平台下编译）：

1. #include <iostream.h>
2. int main(int argc, char* argv[])
3. {
4. 　char str[10];
5. 　char *pStr = str;
6. 　cout << sizeof(str) << endl;
7. 　cout << sizeof(pStr) << endl;
8. 　return 0;
9. }
　　1、数组名不是指针

　　我们先来推翻"数组名就是指针"的说法，用反证法。

　　证明　数组名不是指针

　　假设：数组名是指针；

　　则：pStr和str都是指针；

　　因为：在WIN32平台下，指针长度为4；

　　所以：第6行和第7行的输出都应该为4；

　　实际情况是：第6行输出10，第7行输出4；

　　所以：假设不成立，数组名不是指针

　　2、数组名神似指针

　　上面我们已经证明了数组名的确不是指针，但是我们再看看程序的第5行。该行程序将数组名直接赋值给指针，这显得数组名又的确是个指针！

　　我们还可以发现数组名显得像指针的例子：

1. #include <string.h>
2. #include <iostream.h>
3. int main(int argc, char* argv[])
4. {
5. 　char str1[10] = "I Love U";
6. 　char str2[10];
7. 　strcpy(str2,str1);
8. 　cout << "string array 1: " << str1 << endl;
9. 　cout << "string array 2: " << str2 << endl;
10.　 return 0;
11. }
　　标准C库函数strcpy的函数原形中能接纳的两个参数都为char型指针，而我们在调用中传给它的却是两个数组名！函数输出：

string array 1: I Love U
string array 2: I Love U
　　数组名再一次显得像指针！

　　既然数组名不是指针，而为什么到处都把数组名当指针用？于是乎，许多程序员得出这样的结论：数组名（主）是（谓）不是指针的指针（宾）。

　　整个一魔鬼。

　　揭密数组名

　　现在到揭露数组名本质的时候了，先给出三个结论：

　　(1)数组名的内涵在于其指代实体是一种数据结构，这种数据结构就是数组；

　　(2)数组名的外延在于其可以转换为指向其指代实体的指针，而且是一个指针常量；

　　(3)指向数组的指针则是另外一种变量类型（在WIN32平台下，长度为4），仅仅意味着数组的存放地址！

　　1、数组名指代一种数据结构：数组

　　现在可以解释为什么第1个程序第6行的输出为10的问题，根据结论1，数组名str的内涵为一种数据结构，即一个长度为10的char型数组，所以sizeof(str)的结果为这个数据结构占据的内存大小：10字节。

　　再看：

1. int intArray[10];
2. cout << sizeof(intArray) ;
　　第2行的输出结果为40（整型数组占据的内存空间大小）。

　　如果C/C++程序可以这样写：

1. int[10] intArray;
2. cout << sizeof(intArray) ;
　　我们就都明白了，intArray定义为int[10]这种数据结构的一个实例，可惜啊，C/C++目前并不支持这种定义方式。

　　2、数组名可作为指针常量

　　根据结论2，数组名可以转换为指向其指代实体的指针，所以程序1中的第5行数组名直接赋值给指针，程序2第7行直接将数组名作为指针形参都可成立。

　　下面的程序成立吗？

1. int intArray[10];
2. intArray++;
　　读者可以编译之，发现编译出错。原因在于，虽然数组名可以转换为指向其指代实体的指针，但是它只能被看作一个指针常量，不能被修改。

　　而指针，不管是指向结构体、数组还是基本数据类型的指针，都不包含原始数据结构的内涵，在WIN32平台下，sizeof操作的结果都是4。
顺便纠正一下许多程序员的另一个误解。许多程序员以为sizeof是一个函数，而实际上，它是一个操作符，不过其使用方式看起来的确太像一个函数了。语句sizeof(int)就可以说明sizeof的确不是一个函数，因为函数接纳形参（一个变量），世界上没有一个C/C++函数接纳一个数据类型（如int）为"形参"。

　　3、数据名可能失去其数据结构内涵

　　到这里似乎数组名魔幻问题已经宣告圆满解决，但是平静的湖面上却再次掀起波浪。请看下面一段程序：

1. #include <iostream.h>
2. void arrayTest(char str[])
3. {
4. 　cout << sizeof(str) << endl;
5. }
6. int main(int argc, char* argv[])
7. {
8. 　char str1[10] = "I Love U";
9. 　arrayTest(str1);
10.　 return 0;
11. }
　　程序的输出结果为4。不可能吧？

　　一个可怕的数字，前面已经提到其为指针的长度!

　　结论1指出，数据名内涵为数组这种数据结构，在arrayTest函数体内，str是数组名，那为什么sizeof的结果却是指针的长度？这是因为：

　　(1)数组名作为函数形参时，在函数体内，其失去了本身的内涵，仅仅只是一个指针；

　　(2)很遗憾，在失去其内涵的同时，它还失去了其常量特性，可以作自增、自减等操作，可以被修改。

　　所以，数据名作为函数形参时，其全面沦落为一个普通指针！它的贵族身份被剥夺，成了一个地地道道的只拥有4个字节的平民。

　　以上就是结论4。

i）int *p[3];
（ii）int (*q)[3]；
（iii）int *(t[3]);
以上三者的区别？（vc＋＋环境下验证）：
（１）p是一个指针数组，此处包含三个整型指针，所以sizeof（p）＝１２；sizeof（＊p）＝４；／／首地址
　　　
（2）q是一个数组指针，指向含有三个元素的整型数组，所以sizeof（q）＝４；sizeof（＊q）＝１２；

（３）　和（１）一样；sizeof（t）＝１２；sizeof（＊t）＝４；

（４）　　　int *p[3]等价于：typedef        int*    myint;
                                  myint  p[3];
                   int (*p)[3]等价于：typedef     int    intarray[3];
                                  intarray  *p;
（５）　　　（i）可以这样初试化：int　　a［］＝｛１，２，３，４｝；
　　　　　　　　　　　　　　　　　p［０］＝a；／／＊p＝a；　
　　　　　　（ii）可以这样初始化：int　　a［３］＝｛１，２，３｝；／／数组元素必须是三个
　　　　　　　　　　　　　　　　　　q　＝＆a；
（６）p是数组，不可做＋＋操作，q是指针，可以做＋＋操作，q＋＋是当前q指向的地址值加１２；

题外话：

*p还有一种用法，就是当*是取值运算符的时候，*p是一个左值，表示一个变量，为什么*p是一个变量呢？也许有人会说，因为int i, *p=&i嘛，其实这是结果不是原因。严格来说，i只是一个变量名，不是变量，在编译器的符号表里面，变量名是一个符号地址，它所代表的地址值是它指向的那段内存单元的地址，真正叫变量的是那段内存单元，懂汇编的朋友能很容易地区分出来，在汇编里面，可以这样定义一个变量名：

VARW  DW  10,20

VARW就是一个变量名，它在汇编里面是一个地址，代表了10所在的内存单元这个变量。由于p被初始化为&i，*p指向i所代表的那段内存单元，因此说*p是一个变量。把i称为变量是一种习惯上的统称。

3。定义一个指针的时候，首先必须定出指针的类型，由于这是一个指向数组的指针，如果数组的元素的类型定下来了，那么这个指针的类型也就定下来了。前面说过，C语言的多维数组实质上是数组的嵌套，那么所指向数组的元素必定具有数组类型，也就是说，这个数组的元素是一个具有6个int元素的数组，因此，p定义的时候，必须指定第二维的上界，这样才能把p的类型定下来。

4。有这种疑问的人已经犯了一个错误，没有分清楚什么是指针，什么是数组，以数组的思维模式来看待这个指针p。定义一个数组（非static）的时候，需要在栈中静态分配一块内存，那么就需要知道这块内存的大小，因此定义数组时需要确定各维的上界。而这里只是定义一个指针而已，对于一个指针的定义，需要知道的是它所指向对象的类型，并不需要知道对象的大小，这是多余的。因此，所有指向数组的指针的第一维被忽略。

        以上介绍了如何声明一个指向二维数组的指针，类似地，对一个指向n维数组的指针也可以用同样的方法来声明，如下：

int (*p)[x2][x3]......[xn];

同样可以忽略第一维，而其它维必须指定上界。

        最后再讨论一种很常见的对多维数组的错误理解，有些人常常会以为，二维数组就是二级指针，这种错误的根源，来自于可以把一个二级指针int **p以p[i][j]这种形式使用。首先把数组称为指针就是错误的，第一章笔者已经说明了数组名是地址，不能理解为指针。第二，并非能以p[i][j]这种形式使用，那么p就是一个二维数组了，C标准对数组引用的规定，并没有指定数组引用时[]运算符的左边必须是数组名，而可以是一个表达式。第三，这是一种“巧合”，归根到底是由于C语言的数组实现是数组的嵌套同时C标准把[]运算符转换为类似*(*(a+i)+j)这样的等价表达式造成的，那两个取值运算符“恰好”可以用于一个二级指针。第四，p与p[i]并不具有数组类型，sizeof(p)和sizeof(p[i])的结果只是一个指针的大小4字节。而对于一个真正的数组，p与p[i]都是具有数组类型的地址。

        实际上，int **p只是一个指向一维指针数组的指针，而不是指向二维数组的指针。同样地，对于n级指针，都可以看作一个指向一维指针数组的指针，这个指针数组的元素都是n-1级指针。

posted @ 2014-04-17 13:37 冷冰若水阅读(435) 评论(0) 收藏举报

刷新页面返回顶部

C/C++数组名与指针区别深入探索(转载)

转载自： C/C++数组名与指针区别深入探索

公告