第6章 利用数组处理批量数据
一批具有同名的同属性的数据就组成一个数组(array),s就是数组名
由此可知:
(1)数组是一组有序数据的集合。数组中各数据的排列是有一定规律的,下标代表数据在数组中的序号。
(2)用一个数组名(如s)和下标(如15)来唯一地确定数组中的元素,如s15就代表第15个学生的成绩。
(3)数组中的每一个元素都属于同一个数据类型。不能把不同类型的数据放在同一个数组中。
C语言规定用方括号中的数字来表示下标,如用s[15]表示s15,即第15个学生的成绩。
6.1 怎样定义和引用一维数组
一维数组是数组中最简单的,它的元素只需要用数组名加一个下标,就能唯一确定。
6.1.1 怎样定义一维数组
要想使用数组,就需要先定义数组,才能使用。下面是对数组的定义:
int a[10];
它表示定义了一个整形数组,数组名为a,此数组有10个整型元素。
定义一维数组的一般形式为:
类型符 数组名[常量表达式];
说明:
(1)数组名的命名规则和变量名相同,遵循标识符命名规则。
(2)在定义数组时,需要指定数组中元素的个数,方扩种的常量表达式用来表示元素的个数,即数组长度。
(3)常量表达式中可以包括常量和符号常量。不能包含变量;C语言不允许对数组的大小作动态定义,即数组的大小不依赖于程序运行过程中变量的值。
说明:如果在被调用的函数(不包括主函数)中定义数组,其长度可以是变量和非常量表达式。
void func(int n)
{
int a[2*n]; //合法,n的值从实参传来
……
}
如果指定数组为静态(static)存储方式,则不能用“可变长数组”。如:
static int a[2*n]; //不合法,a数组指定为static存储方式
6.1.2 怎样引用一维数组元素
在定义数组并对其中的各元素赋值后,就可以引用数组中的元素。应注意:只能引用数组元素而不能一次整体调用整个数组全部元素的值。
引用数组元素的表示形式为:
数组名[下标]
如,a[0]就是数组a中序号为0的元素,它和一个简单变量的地位和作用相似。“下标”可以是整形常量或整形表达式。如:
a[0] = a[5]+a[7]-a[2*3]
每一个数组元素都代表一个整数值
注意:定义数组时用到的“数组名[常量表达式]”和引用数组元素时用的“数组名[下标]”形式相同,但含义不同。如:
int a[10]; //这里的a[10]表示的是定义数组时指定数组包含10个元素
t = a[6]; //这里的a[6]表示引用a数组中序号为6的元素
例:将10个数组元素依次赋值为0,1,2,3,4,5,6,7,8,9,要求按逆序输出。
编写程序:
1 #include <stdio.h> 2 int main() 3 { 4 int i=0,a[10]; 5 printf("转序前的排序为:"); 6 for(i=0;i<=9;i++) 7 { 8 a[i] = i; 9 printf("%d ",a[i]); 10 } 11 printf("\n转序后的排序为:"); 12 for(i=9;i>=0;i--) 13 printf("%d ",a[i]); 14 printf("\n"); 15 return 0; 16 }
1 转序前的排序为:0 1 2 3 4 5 6 7 8 9 2 转序后的排序为:9 8 7 6 5 4 3 2 1 0 3 请按任意键继续. . .
注意:数组元素的下标从0开始,如果用“int a[10];”定义数组,则最大下标值为9,不存在数组元素a[10]。下面是常见的错误:
for(i = 1;i<=10;i++) //循环变量从1开始,变到10
a[i] = i; //下标从1开始,变到10
for(i = 10;i>=1;i--)
printf("%d",a[i]);
6.1.3 一维数组的初始化
为了使程序简洁,常在定义数组的同时,给各数组元素赋值,这称为数组的初始化。可以用“初始化列表”方法实现数组的初始化。
(1)在定义数组时对全部数组元素赋予初值。如:
int a[10] = {0,1,2,3,4,5,6,7,8,9};
将数组中各元素的初值顺序放在一对花括号内,数据间用逗号分隔。花括号内的数据就称为“初始化列表”。经过以上的定义和初始化之后,a[0] = 0,a[1] = 1…
(2)可以只给数组中的一部分元素赋值。如:
int a[10] ={0,1,2,3,4};
定义a数组有10个元素,但花括号内只提供5个初值,这表示只给前面5个元素赋初值,系统自动给后5个元素赋初值为0.
(3)如果想使一个数组中全部元素值为0,可写成:
int a[10] = {0, 0, 0, 0, 0, 0, 0, 0, 0, 0,};
或
int a[10] = {0}; //未赋值的部分元素自动设为0
(4)在对全部数组元素赋初值时,由于数据的个数已经确定,因此可以不指定数组长度。如:
int a[5] = {1,2,3,4,5};
也可写成:
int a[] = {1,2,3,4,5};
虽然没有在方括号中指定数组的长度,但是系统会根据花括号中的数据的个数确定a数组有5个元素。但是,如果数组长度与提供的初值个数不相同,则方括号中的数组长度不能省略。如,想定义数组长度为10,就不能省略数组长度的定义,而必须写成:
int a[10] = {1,2,3,4,5};
只初始化前5个元素,后5个元素为0.
说明:如果在定义数值型数组时,指定了数组的长度并对之初始化,凡未被“初始化列表”指定初始化的数组元素,系统会自动帮忙初始化。(如果是整型则初始化为0;如果是字符型数组,则初始化为‘\0’;如果是指针型数组,则初始化为NULL,即为空指针)。
6.1.4 一维数组程序举例
例:用数组来处理球Fibonacci数列问题
编写程序:
1 #include<stdio.h> 2 int main() 3 { 4 int i; 5 int s[25]={1,1}; 6 for(i=2;i<25;i++) 7 s[i]=s[i-1]+s[i-2]; 8 for(i=0;i<25;i++) 9 { 10 if(i%5==0&&i!=0) 11 printf("\n%12d",s[i]); 12 else 13 printf("%12d",s[i]); 14 } 15 printf("\n"); 16 return 0; 17 }
6.2 怎样定义和引用二维数组
怎样定义二维数组呢?基本概念与方法和一维数组相似。
float p[3][6];
以上定义了一个float型的二维数组,第1维有3个元素,第2维有6个元素。每一维的长度分别用一对方括号括起来。
二维数组定义的一般形式为:
类型说明符 数组名[常量表达式][常量表达式]
如:
int a[3][4],b[5][10]
定义a为3*4(3行3列)的数组,b为5*10(5行10列)的数组。注意,不能写成
int a[3,4],b[5,10]; //在一对方括号内写两个下标,错误
C语言对二维数组采用这样的定义方式,使得二维数组可被看作是一种特殊的一维数组:它的元素又是一个一维数组。如,可把a看作是一个一维数组,它有3个元素:
a[0],a[1],a[2]
每个元素又是一个包含4个元素的一维数组,如:
此处把a[0],a[1],a[2]看作一维数组名。C语言的这种处理方法在数组初始化和用指针表示时显得很方便;这将会后面有所体会。
C语言中,二维数组中元素排列的顺序是按行存放的,即在内存中先顺序存放第1行的元素,接着在存放第2行的元素。
注意:用矩阵形式(如3行4列形式)表示二维数组,是逻辑上的概念。能形象地表示出行列关系。而在内存中,各元素时连续存放的,不是二维的,是线性的。这点请务必明确。
C语言还允许使用多为数组。和二维数组一致,只是增加了一个括号:
int a[2][3][4] //定义三维数组a,它有2页,3行,4列
多维数组在内存中的排列顺序为:第1维的下标变化最慢,最右边的下标变化最快。
6.2.2 怎样引用二维数组的元素
二维数组元素的表示形式为:
数组名[下标][下标]
如,arr[2][3]表示a数组中序号为2的行中序号为3的列的元素。下标应是整型表达式,如arr[2-1][2*2-1].不要出现a[2,3]、a[2-1,2*2-1]形式。
数组元素可以出现在表达式中,也可以被赋值:
b[1][2] = a[2][3]/2
注意:在引用数组元素时,下标值应在已定义的数组打下的范围内。如:
int a[3][4]; //定义a为3*4的二维数组
……
a[3][4] = 3; //不存在a[3][4]元素
按以上的定义,数组a可用的“行下标”的范围为0~2,“列下标”的范围为0~3.用a[3][4]表示元素显然超过了数组的范围。
请严格区分在定义数组时用的a[3][4]和引用元素时的a[3][4]的区别。前者用a[3][4]来定义数组的维数和各维数的大小,后者a[3][4]中的3和4是数组元素的下标值;引用元素时,a[3][4]代表行序号为3、列序号为4的元素(行序号和列序号均从0起算)。
6.2.3 二维数组的初始化
可以使用“初始化列表”对二维数组初始化。“初始化列表”不理解的,请看前面的定义。
(1)分行给二维数组赋初值。
int a[3][4] ={{1,2,3,4},{5,6,7,8},{9,10,11,12}};
这种赋初值方法比较直观,把第1个花括号内的数组给第1行的元素,第2个花括号内的数据给第2行的元素……即按行赋初值
(2)可以将所有数据写在一个花括号内,安数组元素在内存中的排列顺序对个元素赋初值。如
int a[3][4] = {1,2,3,4, 5,6,7,8, 9,10,11,12};
效果与第1种赋值相同。但以第1中方法为好,界限清楚。用第2中方法如果数据多,则会写成一大片,容易遗漏,也不容易检查。
(3)可以对部分元素赋初值。如
int a[3][4] ={{1},{5},{9}};
它的作用只对各行第1列(即序号为0的列)的元素赋初值,其余元素值自动为0.赋初值后数组个元素为:
1 |
0 |
0 |
0 |
5 |
0 |
0 |
0 |
9 |
0 |
0 |
0 |
也可以对各行中的某一元素赋初值,如:
int a[3][4] = {{1},{0,6},{0,0,11}};
初始化后的数组元素如下:
1 |
0 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
0 |
11 |
0 |
这种方法对0元素少时比较方便,不必将所有的0都写出来,只需输入少量数据。
也可以只对某几行元素赋初值:
int a[3][4] = {{1},{5,6}};
初始化后的数组元素如下:
1 |
0 |
0 |
0 |
5 |
6 |
0 |
0 |
0 |
0 |
0 |
0 |
第3行不赋初值。
也可以对第2行不赋初值,如:
int a[3][4] = {{1},{},{9}};
(4)如果对全部元素都赋初值(即提供全部初始数据),则定义数组时对第1位的长度可以不指定,但第2维的长度不能省。换句话说,就是低维的长度一定要写。如
int a[3][4] = {1,2,3,4, 5,6,7,8, 9,10,11,12};
与下面的定义等价:
int a[][4] = {1,2,3,4, 5,6,7,8, 9,10,11,12};
系统会根据数据总个数和第2位的长度算出第1维的长度。
在定义时也可以只对部分元素赋初值而省略第1维的长度,但应分行赋初值。如:
int a[][4] = {{0,0,3},{},{0,10}};
这样的写法,能通知编译系统;数组共有3行。数组的各元素为:
0 |
0 |
3 |
0 |
0 |
0 |
0 |
0 |
0 |
10 |
0 |
0 |
从本节的介绍中可以看到:C语言在定义数组和表示数组元素时采用a[][]这种两个方括号的方式,对数组初始化时十分有用,它使概念清楚,使用方便,不易出错。
6.2.4 二维数组程序举例
例:将一个二维数组行和列元素互换,存到另一个二维数组中。如:
a = 1 2 3 b = 1 4
4 5 6 2 5
3 6
编写程序:
1 #include <stdio.h> 2 int main() 3 { 4 int a[2][3]={{1,2,3},{4,5,6}}; 5 int b[3][2],i,j; 6 printf("array a:\n"); 7 for(i = 0; i<=1;i++) 8 { 9 for(j = 0;j<=2;j++) 10 { 11 printf("%5d",a[i][j]); 12 b[j][i] = a[i][j]; 13 } 14 printf("\n"); 15 } 16 printf("array b:\n"); 17 for(i = 0; i<=2;i++) 18 { 19 for(j = 0;j<=1;j++) 20 { 21 printf("%5d",b[i][j]); 22 } 23 printf("\n"); 24 } 25 return 0; 26 }
6.3 字符数组
前面已经介绍过,字符型数据是以字符的ASCII码值存储在存储单元中,一般占用一个字节。由于ASCII代码属于整数形式,故在C99标准中,将字符型归纳为整型类型中的一种。
注意:C语言中没有字符串类型,字符串是存放在字符型数组中的。
6.3.1 怎样定义字符数组
用来存放字符数据的数组是字符数组。字符数组中的一个元素存放一个字符。
定义字符数组的方法与定义数值型数组的方法类似,如:
char c[10];
c[0] = ‘i’; c[1] = ‘ ‘;……
由于字符型数据是以整数形式(ASCII代码)存放的,因此也可以用整型数组来存储字符数据,如:
int c[10];
c[0] = ‘i’; c[1] = ‘ ‘;……
6.3.2 字符数组的初始化
(1)用“初始化列表”,把各个字符依次赋给数组中各元素。
char c[10] = {‘i’, ‘ ’, ‘a’, ‘m’, ‘ ’, ‘h’, ‘a’, ‘p’, ‘p’, ‘y’};
如果在定义字符数组时不进行初始化,则数组中各元素的值是不可预料的。如果花括号中提供的初值个数(即字符个数)大于数组长度,则出现语法错误。如果初值个数小于数组长度,则只将这些字符赋给数组中前面的那些元素,其余的元素自动定为空字符(即’\0’)。如:
char c[10] = {‘i’, ‘ ’, ‘a’, ‘m’, ‘ ’, ‘h’};
结果可通过编译运行查看。体会其中的差别。
(2)如果提供的初值个数与预定的数组长度相同,在定义时可以省略数组的长度,系统会自动根据初值个数确定数组长度。如:
char c[] = {‘i’, ‘ ’, ‘a’, ‘m’, ‘ ’, ‘h’, ‘a’, ‘p’, ‘p’, ‘y’};
数组c的长度自动定为10.
也可以定义和初始化一个二维数组;如:
char diamond[5][5] = {{‘ ’,’ ’,’*’},{’ ’ ,‘* ’ ,’ ’ ,’*’},
{’*’ ,’ ’ ,’ ’ ,’ ’ ,’*’},{’ ’ ,‘* ’ ,’ ’ ,’*’},{‘ ’,’ ’,’*’}};
6.6.3 怎样引用字符数组中的元素
可以引用字符数组中的一个元素,得到一个字符。
例:输入一个已知的字符串
编写程序:
1 #include <stdio.h> 2 int main() 3 { 4 char c[10] = {'i', ' ', 'a', 'm', ' ', 'h', 'a', 'p', 'p', 'y'}; 5 int i = 0; 6 for(i = 0; i<10 ; i++){ 7 printf("%c",c[i]); 8 } 9 printf("\n"); 10 return 0; 11 }
1 运行结果: i am happy
6.3.4 字符串和字符串结束标志
在C语言中,是把字符串作为字符数组来处理的。
字符串的有效长度和字符数组的长度是不一样的概念。
C语言规定了一个“字符串结束标志”,以字符’\0’为结尾作为结束标志。
如果字符数组中存有若干字符,前面9个字符都不是空字符(‘\0’),而第10个字符时’\0’,则认为数组中有一个字符串,其有效字符为9个(即有效长度为9)。也就是说,在遇到字符’\0’时,表示字符串结束,把它前面的字符组成一个字符串.
C系统在用字符数组存储字符串常量时会自动加一个’\0’作为结束符。如,“C program”共有9个字符,在数组中它占有10个字节,最后一个字节是’\0’是由系统自动加上的。
当然,在定义字符数组时应估计实际字符串长度,保证数组长度始终大于字符串实际长度。
说明:’\0’代表ASCII码为0的字符,从ASCII码表中可以查到(在博客前面有贴出来过),ASCII为0的字符不是一个可以显示的字符,而是一个“空操作符”,即什么也不做。用它来作为字符串结束标志不会产生附加的操作或增加有效字符,只起一个供辨别的标志。
(3)用字符串常量来使字符数组初始化;如:
char c[] = {“I am happy”};
也可以省略花括号,和下面等价
char c[] = “I am happy”;
等价于
char c[] = {'i', ' ', 'a', 'm', ' ', 'h', 'a', 'p', 'p', 'y',’\0’};
注意观察三种方式,这三种是等价的。
char c[10] = {'i', ' ', 'a', 'm', ' ', 'h', 'a', 'p', 'p', 'y',’\0’};
char c[] = {'i', ' ', 'a', 'm', ' ', 'h', 'a', 'p', 'p', 'y',};
这两种是不等价的,前者的长度为11,后者的长度为10.
说明:字符数组并不要求它的最后一个字符为’\0’,甚至可以不包含’\0’。
6.3.5 字符数组的输入输出
字符数组的输入输出可以有两种方法。
(1)逐个字符输入输出。用格式符“%c”输入或输出一个字符。如:
char c = ‘A’;
printf(“%c”,c);
(2)将整个字符串一次输入或输出。用“%s”格式符,意思是对字符串(String)的输入输出。
如:
char c[] = {“chian”};
printf(“%s\n”,c);
说明:
(1)输出的字符中不包括结束符’\0’
(2)用“%s”格式输出字符串时,printf函数中的输出项是字符数组名,而不是数组元素名。如:
char c[] = {“chian”};
printf(“%s”,c[0]); //这是错误的,不能这样输出
printf(“%s\n”,c); //这是正确的,能正常输出
(3)如果数组长度大于字符串的实际长度,也只能输出到遇’\0’结束。
char c[10] = {“chian”}; //字符串长度为5,连’\0’共占6个字节
printf(“%s\n”,c);
只输出字符串的有效字符“china”,而不是输出10个字符。
(4)如果一个字符数组中包含一个以上’\0’,则遇上第一个’\0’时输出就会结束。如:
char c[] = {'i', ' ', 'a', 'm',’\0’ ,' ', 'h', 'a', 'p', 'p', 'y'};
printf(“%s\n”,c);
输出结果:I am
(5)可以用scanf函数输入一个字符串。如:
scanf(“%s”,c);
scanf函数中的输入项c是已定义的字符数组名,输入的字符串应短于已定义的字符数组的长度。如,已定义: char c[6];
从键盘输入:
china 回车
系统会自动在china后面加一个’\0’结束符。
注意:scanf函数中的输入项如果是字符数组名,不要再加地址符&,因为在C语言中数组名代表该数组的起始地址。下面的写法不正确:
scanf(“%s”,&str); //str前面不应加&
(6)输入字符串的方法:
printf(“%s”,c);
过程:按字符数组名c找到其数组起始地位,然后逐个输出其中的字符,直到遇到’\0’为止。
6.3.6 使用字符串处理函数
在C函数库中提供了一些用来专门处理字符串的函数。
1. puts函数——输出字符串的函数
其一般形式为:
puts(字符数组)
其作用是将一个字符串(以’\0’结束的字符序列)输出到终端。假如已定义str是一个字符数组名,且该数组已被初始化为“china”.则执行:
puts(str);
其结果在终端上输出“china”。
用puts函数输出的字符串中可以包含转义字符。如:
char str[] = {“chian\nhappy”};
puts(str);
输出:
china
happy
在输出时将字符串结束标志’\0’转换为’\n’,即输出完字符串后换行。
2.gets函数——输入字符串的函数
其一般形式为:
gets(字符数组)
其作用是从终端输入一个字符串到字符数组,并且得到一个函数值。该函数值是字符数组的起始地址。如:
gets(str); //假定str是已定义的字符数组
从键盘输入:
computer
将输入的字符串“computer”送给字符数组str(请注意,送给数组的共有9个字符,而不是8个字符),返回的函数值是字符数组str的起始地址。一般利用gets函数的目的是向字符数组输入一个字符串,而不大关心起函数值。
注意:用puts和gets函数只能输出或输入一个字符串,不能写成
puts(str1,str2); 或 gets(str1,str2);
3.strcat函数——字符串连接函数
其一般形式为:
strcat(字数数组1,字符数组2)
strcat是STRingCATenate(字符串连接)的缩写。其作用是把两个字符数组中的字符串连接起来,把字符串2接到字符串1后面,结果放在字符数组1中,函数滴啊用后得到一个函数值——字符数组1的地址。如:
char str1[30] = {“people’s republic of ”};
char str2[] = {“china”};
printf(“%s”,strcat(str1,str2));
输出:
people’s republic of china
说明:
(1)字符数组1必须足够大,以便容纳连接后的新字符串。若在定义时改用str1[] = {“people’s republic of ”}; ,就会出现error ,因长度不够。
(2)连接前两个字符串的后面都有’\0’,连接时将字符串1后面的’\0’取消,只在新串最后保留’\0’。
4.strcpy和strncpy函数——字符串复制函数
其一般形式为:
strcpy(字符数组1,字符数组2)
strcpy是STRingCoPY(字符串复制)的简写。它表示“字符串复制函数”,作用是将字符串2复制到字符数组1中去。如:
char str1[10],str2[] = “china”;
strcpy(str1,str2);
说明:
(1)字符数组1必须定义得足够大,以便容纳被复制的字符串2.字符数组1的长度不应小于字符串2 的长度。
(2)“字符数组1”必须写成数组名形式(如str1),“字符串2”可以是字符数组名,也可以是一个字符串常量。如:
strcpy(str1,”china”);
作用与前面相同。
(3)如果在复制前未对str1数组初始化或赋值,则str1各字节中的内容是无法预知的,复制时将str2中的字符串和其后的’\0’一起复制到字符数组1中,取代字符数组1中的前6个字符,最后4个字符并不一定是’\0’,而是str1中原有的最后4个字节的内容。
(4)不能用赋值语句将一个字符串常量或字符数组直接给一个字符数组。如:
str1 = “china”;
str2 = str1; //这是错误的。
只能用strcpy函数将一个字符串复制到另一个字符数组中去。用赋值语句只能讲一个字符赋给一个字符型变量或字符型数组元素。
5.strcmp函数——字符串比较函数
其一般形式为:
strcmp(字符串1,字符串2);
strcmp是STRingCoMPare(字符串比较)的缩写。它的作用是比较字符串1和字符串2.如:
strcmp(str1,str2);
strcmp(“china”,”korea”);
strcmp(str1,”Beijing”);
说明:字符串比较的规则是:将两个字符串自左至右逐个字符相比(按ASCII码值大小比较),直到出现不同的字符或遇到’\0’为止。
(1)如全部字符相同,则认为两个字符串相等。
(2)若出现不相同的字符,则以第1对不相同的字符的比较结果为准。
如果参加比较的两个字符串都是由英文字母组成,则有规律:在英文字典中在后面的为“大”。如:在computer在字典中的位置在compare之后,所以“computer”>“compare”。但应注意小写字符比大写字符“大”。所以“DOG”<“cat”
比较的结果由函数值带回。
(1)如果字符串1=字符串2,则函数值为0
(2)如果字符串1>字符串2,则函数值为一个正整数
(3)如果字符串1<字符串2,则函数值为一个负整数
注意:对两个字符串比较,不能用以下形式:
if(str1>str2)
printf(“yes”);
只能用:
if(strcmp(str1,str2)>0)
printf(“yes”);
6. strlen函数——测字符串长度的函数
其一般形式为
strlen(字符数组)
strlen是STRingLENgth(字符串长度)的缩写。它是测试字符串长度的函数。函数的值为字符串中的实际长度(不包括’\0’)。
char str[10] = “china”;
printf(“%d”,strlen(str));
输出结果不是10,也不是6,而是5.也可以直接测试字符串常量的长度,如:
strlen(“china”);
7.strlwr函数——转换为小写的函数
其一般形式为
strlwr(字符串)
strlwr是STRingLoWeRcase(字符串小写)的缩写。函数的作用是将字符串中大写字母转成小写字母。
8.strupr函数——转换为大写的函数
其一般形式为
strupr(字符串)
strupr是STRingUPpeRcase(字符串大写)的缩写。函数的作用是将字符串中小写字母转成大写字母。
以上介绍了常用的8种字符串处理函数,应当再次强调:库函数并未C语言本身的组成部分,而是C语言编译系统为方便用户使用而提供的公共函数。当然,不同的编译系统提供的函数数量和函数名、函数功能都不尽相同,必要时查一下库函数手册。
注意:在使用字符串处理函数时,应当在程序文件的开头声明
#include <string.h>
把”string.h”文件包含到本文件中。