浅谈C中的指针和数组(三)
上一个博客我们得到了一个结论:
指针和数组根本就是两个完全不一样的东西。只是它们都可以“以指针形式”或“以下标形式”进行访问。一个是完全的匿名访问,一个是典型的具名+匿名访问。一定要注意的是这个“以XXX 的形式的访问”这种表达方式。
下面就说说两种东西在“以指针形式”访问和“以下标形式”访问的两种情况在指针和数组上的应用。
C语言标准对此作了说明:
规则1:表达式中的数组名被编译器当做一个指向该数组第一个元素的指针;
注:下面几种情况例外
1)数组名(不能是指针)作为sizeof的操作数
2)使用&取数组的地址(这时已经变成了指针)
规则2:下标总是与指针的偏移量相同;
规则3:在函数参数的声明中,数组名被编译器当做指向该数组第一个元素的指针。
规则1和规则2结合在一起理解,就是对数组下标的引用总是可以写成“一个指向数组的起始地址的指针加上偏移量”。如a[i]总是被编译器解析为*(a+i)的形式。
规则1:表达式中的数组名总被编译器解析为指针,因此如下语句int a[3];int *p=a;是可以正确编译执行的。在表达式中a被解析为指向数组第一个元素的指针,那么赋值符号两边的类型匹配,因此可以正确编译执行。
规则2:下标总是和指针的偏移量相同。C语言中将数组的下标改写成指针偏移量的主要原因在于指针和偏移量是底层硬件所使用的基本类型。如a[i]中的i总被编译器解析为偏移量,所以a[i]总是被改写成*(a+i)的形式,a是指向数组第一个元素的指针,加上偏移量i,表示该指针向后移i个步长,然后取a+i所在单元的内容。由此就可以解释为什么C语言中数组的下标可以为负,而且在我看来,C语言中不检查数组的下标是否越界同样跟这个有关,如下面这段程序:
#include<stdio.h> int main(void) { int a[3]={1,2,3}; int *p=(a+3); printf("%d\n",p[-1]); return 0; }
程序执行结果为3,虽然下标为-1,但是被编译器解析为偏移量,因此相当于*(p-1)。
规则3:在函数参数的声明中,数组名被编译器当做指向该数组第一个元素的指针。在C语言中将形参的数组和指针等同起来是出于效率的考虑。假如不这么做,将整个数组的每个元素的值都拷贝一份进行传递,这样无论在时间上还是空间上的开销都可能是非常大的。但是又要能操作到数组中的元素,只需将数组第一个元素的地址传递给调用函数,然后通过指针去访问想要访问的空间,这样一来时空消耗将大大减少。因此在函数内部,编译器始终把参数中声明的数组名当做一个指向数组第一个元素的指针,这样一来,编译器可以产生正确代码,并不需要对数组和指针这两种情况作区分。因此void fun(int a[]);和void fun(int *a)两种形式的效果完全等同,在函数内部去引用a的话,始终都会被编译器认为是指针。因为void fun(int a[]);这种形式最终还是会被编译器解析为void fun(int *a);这种形式告诉我们调用时必须传递一个指向整型数据的指针。所以下面这段代码可以正确编译和执行:
#include<stdio.h> void fun(int a[]) { printf("%d\n",a[0]); } int main(void) { int a[3]={1,2,3}; int *p1,*p2; int b=4; p1=a; p2=&b; fun(a); fun(&a[1]); //注意这句话输出的是2 fun(p1); fun(p2); fun(&b); return 0; }
区分几个表达式的含义:
&p,p,a,&a
&p:表示取存储指针变量p的内存单元的地址; sizeof(&p)=4;
p:表示取指针变量p存储的地址; sizeof(p)=4;
a:表示取数组第一个元素的地址; sizeof(a)=3*4=12;
&a:表示取整个数组的首地址; sizeof(&a)=4(在VC++6.0中该值为12,我认为是错误的,因为其类型是数组指针,就是一个指针,编译时期确定,大小就是4)
虽然a和&a的值相同,但是所表达的含义完全不同,a表示取数组第一个元素的地址,而&a表示取数组的首地址。它们所代表的类型也完全不同,a是一个int型指针,而&a是一个int (*p)[]型指针,即数组指针(在后续文章中会作解释)。所以a+1和&a+1得到的结果不同,a+1表示将指向该数组的第一个元素的指针向后移一个步长(这里的步长为数组元素类型所占的字节数);而&a+1表示将指向该数组的指针向后移动一个步长(而此处的步长为数组元素个数*元素类型所占的字节数)。
#include<stdio.h> #include<stdlib.h> int main(void) { int a[3]={1,2,3}; int *p=a; printf("%08x\n",&p); printf("%08x\n",p); printf("%08x\n",&p+1); printf("%08x\n",p+1); printf("%08x\n",a); printf("%08x\n",&a); printf("%08x\n",a+1); printf("%08x\n",&a+1); //注意输出结果 system("pause"); return 0; }