HelloWorld

ASM,C,LUA,LINUX(gentoo)
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

数组与指针

Posted on 2011-09-25 19:05  光铭  阅读(926)  评论(0编辑  收藏  举报

0.数组和指针并不是相同的

我们声明数组时,同时分配了一些内存空间,用于容纳数组元素,但是当我们声明一个指针时,只分配了用于容纳指针本身的内存空间。

从这个方面也可以理解sizeof后面跟数组名和指针名的不同。

什么时候数组和指针相同呢?

c语言标准对此做了如下说明

规则1.表达式中的数组名被编译器当作一个指向该数组的一个元素的指针

规则2.下标总是与指针和偏移量相同

规则3.在函数参数的声明中(形式参数),数组名被编译器当作指向该数组第一个元素的指针

1.数组名是一个常量指针,并不是一个左值

1 #include<stdio.h>
2 int main(int argc,char **argv)
3 {
4 int array[]={1,2,3,4};
5 array++;
6 return 0;
7 }

test.c|5| error: lvalue required as increment operand

数组名不是常量指针的情况只有两种,就是当数组名是sizeof和&的操作数时,前者产生整个数组的占用的字节数,后者产生一个指向数组的指针

2.下标引用和间接操作是一样的

 1 #include<stdio.h>
2 int main(int argc,char **argv)
3 {
4 int array[]={1,2,3,4};
5 int *b=array+1;
6 printf("%d\n",b[1]);
7 printf("%d\n",*(b+1));
8 printf("%d\n",b[-1]);
9 printf("%d\n",b[10]);
10 printf("%d\n",1[b]);
11 return 0;
12 }


输出

3
3
1
32595
3

这个例子说明了几个很有意思的事实,b是指针,但是b还是可以使用下标操作符,c在处理下标操作符时把b[1]看成*(b+1)

这也是为什么1[b]是合法的原因,1[b]被看成了*(1+b),在编译器看来b[1]和1[b]并没有区别

并且c语言不进行下标检查,这是基于相信coder的设计思想,并且检查下标要消耗一定的资源

3.当要传递一个数组是形参可以是两种形式

int strlen(char *string);
int strlen(char string[]);
//甚至是下面的方法都可以
int strlen(char string[100]);//里面的数字随意
void print1(int *a)
{
	int i;
	for(i=0;i < SIZE;i++)
		printf("%d\n",a[i]);
}
void print2(int a[])
{
	int i;
	for(i=0;i< 5;i++)
		printf("%d\n",a[i]);
}
//数组的下标使用变量是可以的
调用时,实参只能是一个指针
int a[]={1,2,3,4,5};
print1(a);
print2(a);
print2(&a[1]);//这样传过来就是数组的一部分。
实参即使不是真的数组都是合法的
int b=10;
print2(&b);
实际上传递的就是指针

这个相等行暗示指针和数组名是相等的,但千万不要被它糊弄了,这个声明确实相等,但是只存在于当前的这个上下文环境中。

3.sizeof 的不同

1 char *a = "hello";
2 char b[]= {'h','e','l','l','o'};
3 //sizeof(a)是指针占的内存地址大小,所有类型的指针的大小都一样,是系统的字长,32位系统就是4个字节,64位系统就是8个字节
4 //sizeof(b)是数组b占的字节数,这里是5个char加上一个‘\0',是6个字节


注意指针在这里的用法,只能对字符串常量采用char *a = "hello";

int *a = {1,2,3};             //error: (twice)excess element in scalar initializer, initialization makes pointer from interger without a cast
char *b = {'h','e','l','l','o'};//error:(four times)excess element in scalar initializer, initialization makes pointer from interger without a cast
char *c = 'h'; //error: initialization makes pointer form interger without a cast

char *d = "h"; //correct
char *e ="hello" //correct

4.由第三条引出了第四条

先讲一下历史

由于 char message[]={'h','e','l','l','o'};这种初始化字符数组的方式用于比较长的字符数组显得比较傻,c语言标准提出了一种快速方法用于初始化字符数组

char message[]=“hello"; 尽管它看上去有点像字符串常量,但是它并不是,它只是前例的初始化列表的一种写法。

一个字符串常量在用于初始化一个字符数组时,它是一个初始化列表,在其它任何情况下,他都是一个字符串常量

主意区分

char message1[] = "hello"; //message1是个数组,message1也是一个常量指针,不能改变message1的指向,"hello"是数组的初始化列表,可以通过下标或者间接操作来改变值
char *message2 = "hello"; //message2指向字符串常量,message2是一个变量指针,可以改变message2的指向。不能通过下标或者间接操作来改变值。如果硬要改变的话是编译通过运行出错

5.指向数组的指针

int matrix[3][10];

matrix可以看作成是一个一维数组,它包含3个元素,每个元素是包含10个整形元素的数组(这个是在人看来的,对计算机而言matrix就是个指针,计算机没有数组的概念,它只懂得指针,数组和下标提出来只不过是方便人理解,这是我到目前为止的看法)。(如同df -h)

matrix:一个常量指针,指向它的第一个元素,所以matrix是一个指向包含10个整形元素的数组的指针

matrix+1:仍然是一个指针,在matrix的地址的基础上向后移了4*10=40个字节。但是这里不是matrix[1],maxtrix[1]相当于*(matrix+1),再次强调下标和间接操作是一样的。

matrix[0]和 *matrix:maxtrix是一个指向数组的指针,那么*maxtrix就是一个数组,包含(*maxtrix)[0]到(*matrix)[9]这么10个元素,由于数组名是第一个元素的地址,所以*matrix相当于&(*matrix)[0]也就是&matrix[0][0],这是一个指向整数的指针。

*(*(matrix+1)+1):有了前面的基础,这个就相当简单了,matrix[1][1]。

但是很有意思的是matrix和matrix[0]的值竟然是一样的,都是&matrix[0][0],换句话说&matrix[0]和matrix[0]是一样的(这块我暂时不能解释,以后解决了再说)

 1 #include<stdio.h>
2 int main(int argc,char **argv)
3 {
4 int matrix[3][10]={
5 {1,2,3,4,5,6,7,8,9,10},
6 {10,9,8,7,6,5,4,3,2,1},
7 {5,4,3,2,1,6,7,8,9,10}
8 };
9 printf("%p\t%p\n",matrix,matrix[0]);
10 printf("%p\t%p\n",matrix+1,matrix[1]);
11 printf("%p\t%p\n",matrix+2,matrix[2]);
12 return 0;
13 }
14
15
16 //结果
17
18 0x7ffff4609f50 0x7ffff4609f50
19 0x7ffff4609f78 0x7ffff4609f78
20 0x7ffff4609fa0 0x7ffff4609fa0

我们发现下面的都比上面的多出4*10=40个字节的地址

那么指向数组的指针怎么表示呢

int (*p)[10]=maxtrix;

看一下怎么使用

int a[10];
int (*pa)[10] = &a;
由于对于数组来说&a和a的值是一样的,所以也可以写成
int(*pa)[10]=a;//但是这样写在gcc上会得到一个warning,所以还是不要这样写的好
值虽然一样但是类型不一样,这点很重要。
那么int *pa=a;和int (*pa)[10]=&a;有什么区别呢
这两个pa的值虽然是一样的,但是类型不一样,还是这句话,第一个pa指向的是一个整数,第二个pa指向的是一个数组,第一个++pa的步长是4,第二个++pa的步长是40
int a1[3];
int a2[2][3];
int (*ap)[3];
ap=&a1;
ap=a2;

 用法也不一样

int a[10]={1,2};

int (*pa)[10]=&a;

int *pb=a;

printf("%p\t%p\t%p\t%p\n",pa,pb,a,&a);
printf("%d\t%d\n",(*pa)[1],pb[1]);//很奇怪,其实声明已经很清除了(*pa)[10]这样才得到一个int,pa[1]编译器显示是int *类型
输出:
  0x7fffa745c2c0  0x7fffa745c2c0  0x7fffa745c2c0  0x7fffa745c2c0
2       2

这个声明看起来比我们见到过的所有声明都复杂,但事实上并不是很难。你只要假定它是一个表达式,并对它求值。下标引用的优先级高于间接访问,但由于括号的存在,首先执行的还是间接访问,所以p是一个指针,那么它指向什么呢?接下来是下标引用,所以它指向的是某种类型的数组(包含10个元素),这个表达式没有更多的操作,所以p是一个指向整形数组的指针。

那么上面matrix的类型是 int (*)[10],而matrix[0]的类型是int *

这里讲一句题外话,数组不能整体赋值给另外一个数组,只能一个一个元素赋值。

6.指针数组

注意和上面的指向数组的指针区别

int *p[10]

下标引用的优先级高于间接访问,首先执行下标引用,因此p是某种类型的数组(它包含的元素数为10)。在取得一个值以后,进行了间接访问操作,这个表达式不再有其它操作,得到的是一个int型。总结一下:对数组的某个元素进行间接操作后得到了一个int型,所以p是一个数组,它包含的元素是指向整型的指针。

#include<stdio.h>
int main(void)
{
	const char *keyword_table[5]={
		"do",
		"while",
		"if",
		"else",
		"switch"
	};
	printf("%p\t%p\t%p\t%p\t%p\t%p\t%p\t%c\n",&keyword_table,keyword_table,&keyword_table[0],&"do","do",keyword_table[0],&keyword_table[0][0],*keyword_table[0]); 
	return 0;
}
输出:
0x7fff46c5f790  0x7fff46c5f790  0x7fff46c5f790  0x4006ac        0x4006ac        0x4006ac        0x4006ac        d