(C/C++学习)13.C语言字符串处理函数(一)
说明:字符串处理的函数很多,本文将例举经常遇到的一些函数加以说明。
一.字符串的输入输出
头文件:<stdio.h>
1.利用标准输出函数 printf() 来输出,将格式设置为 s% 。特点:在遇到字符串的结束标记 ’\0’ 会停止输出到屏幕。如下代码,打印输出为 abc 。
1 printf("%s\n","abc\0efg");
2.int puts(const char *_Str) 向屏幕输出,成功返回0,失败返-1,特点:自动追加换行,同样遇到 ‘\0’ 会截止输出。举例:
1 puts("abc\0d");
3.利用标准输入函数 scanf() 来输入,特点:遇到空格截止输入,要注意输入越界。在正常(不越界)的情况下,该函数会在输入的字符串后面自动追加结束标记 ’\0’ 。如下代码,若输入为 abc def 则打印 p 的内容时为 abc。
1 char p[10]; 2 //注意越界,输入字符数最多为10 3 scanf("%s",p);
4.char *gets(char *str) 从标准输入流中读取字符串。特点:gets 直到遇到回车或 EOF 才停止输入,空格也作为字符输入,读取成功返回 str ,失败返回 NULL。同样要注意越界问题。读取完成后同样在输入字符串的后面追加 ’\0’ 。
如下代码,若输入为:abc def,则打印出两行一样的字符串:abc def。
1 char p[10]; 2 char *q = gets(p); 3 puts(q); 4 puts(p);
二.字符串基本操作函数
头文件:<string.h>
1.size_t strlen ( const char * str ) 求取字符串 str 的长度,并返回。需要注意的是这个函数是以字符串的结束标志 ‘\0’来判断字符串结束的。如下代码,打印出的长度为 2 而不是 5 。注意:size_t == unsigned int 。
1 char *p = "ch\0na"; 2 int n = strlen(p); 3 printf("%d\n",n);
2.char * strcat ( char * dest, const char * src ) 追加 src 串到 dest 的末尾,dest 的末尾的'\0'字符,会被 src 的第一个字符所覆盖,追加完成后的新串会被在其末尾自动追加'\0',并返回该新串(注意越界)。如下代码,打印 s 为 chinajim 。
1 char p[30] = "china"; 2 char q[10] = "jim"; 3 char *s = strcat(p,q); 4 puts(s);
3.char * strcpy ( char * dest, const char * src ) 拷贝 src 所指向的字符串,到 dest 所指向空间中去,包含 src 中的结束符'\0'。返回值为 dest (注意越界)。
1 char p[30] = "china"; 2 char q[10] = "jim"; 3 char *s = strcpy(p,q); 4 puts(s); 5 puts(p);
4.int strcmp ( const char * str1, const char * str2 ) 比较字符串 str1 和字符串 str2 的大小。该函数从两字符串的第一个字符开始,如果相等,依次往下比较,直到遇到不相同的字符或其中一个遇到 '\0' 。比较的依据,是两字符对应的 ASCII 值的大小,若大于返回 1,小于返回 -1,等于返回 0。
1 char p[30] = "chinj"; 2 char q[10] = "chinc"; 3 int n = strcmp(p,q); 4 printf("%d\n",n);
三.字符串处理安全操作
头文件:<string.h>
说明:前面提到的字符串处理函数大多都存在一个问题,就是越界问题。比如当拷贝一个字符串到一个字符数组时,当字符数组的空间不够,则会发生越界问题。越界问题是很危险的,有时会出现难以预料的后果,比如系统崩溃。为此,C语言还提供了一些更为安全的字符串处理函数。
1.char *strncat(char * s1,const char * s2,size_t n) 将 s2 字符串的前 n 个字符追加到 s1 字符串,复制过来的 s2 字符串的第一个字符覆盖 s1 字符串结尾的 ‘\0’,最后在 s1 末尾追加 ‘\0’。打印结果为 chinachi。
1 char p[30] = "china"; 2 char q[10] = "china"; 3 char *s = strncat(p,q,3); 4 printf("%s\n",s);
2.char * strncpy ( char * destination, const char * source, size_t num ) 拷贝 source 中的前 num 个字符到 destination 中去。如果在拷贝 num 个字符中遇到 ’\0’ ,则不再继续拷贝,在其后补 ’\0’ ; 如果 source 的长度大于 num,在拷贝完 num 个字符后,并不会在 destination 的后面追加’\0’。所在这种情况下,destination 不以’\0’结尾,读它可能会越界。
解决办法是,依据 dest 的大小,假设设为 N,然后去读 N-1 个字符。然后将 dest[N-1] = ‘\0’ ;千万不可忘记拷贝完成后加 ‘\0’ 。
1 char p[5] = "china"; 2 char q[5] = "anihc"; 3 char *s = strncpy(p,q,sizeof(p)-1); 4 p[4] = '\0'; 5 printf("%s %s\n",p,s);
3.int strcmp(char *str1,char * str2,int n) 比较字符串 str1 和 str2 的前 n 个字符,该函数从两字符串的第一个字符开始,如果相等,依次往下比较,直到比较完前 n 个字符 。比较的依据,是两字符对应的 ASCII 值的大小,返回值为ASCII码值的差。如下打印结果为 8。
1 char p[5] = "9chin"; 2 char q[5] = "1fnih"; 3 int n = strncmp(p,q,5); 4 printf("%d",n);
4.int sprintf ( char * str, const char * format, ... ) 把格式化的数据写入某个字符串缓冲区。比如下面代码:输入 12.34.54.65,输出 12.34.54.65 。
1 int a,b,c,d; 2 printf("pls input ip:"); 3 scanf("%d.%d.%d.%d",&a,&b,&c,&d); 4 char buf[17]; 5 sprintf(buf,"%d.%d.%d.%d",a,b,c,d); 6 printf("%s\n",buf);
四.字符串与数值之间的转化
头文件:<stdlib.h>
1.int atoi(const char *nptr) 将字符串转换成整型数;atoi()会扫描参数 nptr 字符串,跳过前面的空格字符,直到遇上数字或正负号才开始做转换,而再遇到非数字或字符串时('\0')才结束转化,并将结果返回(返回转换后的整型数)。如下程序输出:data = 123 (换行)a –b = –1 。
1 char buf[100] = " 123abc"; 2 int data = atoi(buf); 3 printf("data = %d\n",data); 4 char a[] = "-100"; 5 char b[] = "99"; 6 printf("a -b = %d\n",atoi(a)+atoi(b));
2.char * itoa ( int value, char * str, int base ) 根据指定的进制(base),将整型数据转化为以 ’\0’ 结尾的字符串,保存到 str 指向的字符数组中,并返回。
1 char buf[100]; 2 int a = 123; 3 char * q = itoa(a,buf,10); 4 printf("q = %s\n",q); 5 printf("base 10 %s\n",buf); 6 itoa(a,buf,16); 7 printf("base 16 %s\n",buf); 8 itoa(a,buf,2); 9 printf("base 2 %s\n",buf);
输出结果:
五.字符串的其他处理函数
头文件 <string.h>
1.char *strchr(char* str,int ch) 返回字符串 str 中首次出现字符 c 的位置指针,返不到返回 NULL。
1 char buf[100] = "china"; 2 char *p = strchr(buf,'n');
2.char * strstr ( char * str1, const char * str2 ) 搜索字符串 str2 在字符串 str1 中是否出现。若找到,则该函数返回第一次匹配的字符串的地址;如果未找到所搜索的字符串,则返回 NULL。
1 char str1[] = "abcd123456efg"; 2 char str2[] = "1234"; 3 char *pf = strstr(str1,str2);
如下代码将统计 str2 字符串在 str1中出现的次数:
1 char *str1 = "aaaaaaaaaaaaaaaaa"; 2 char *str2 = "aa"; 3 int count = 0; 4 while((str1 = strstr(str1,str2)) != NULL) 5 { 6 count++; 7 str1 = str1+strlen(str2); 8 } 9 printf("%d\n",count);
3.char *strtok(char *s, char *delim) 分解字符串为一组字符串。s 为要分解的字符串,delim 为分隔符。首次调用时,s 指向要分解的字符串,之后再次调用要把 s 设成 NULL。该函数返回从 s 开头开始的一个个被分割的串。当没有被分割的串时则返回 NULL。所有 delim 中包含的字符都会被滤掉,并将被滤掉的地方设为一处分割的节点。
1 char buf[] = "aaaaaaaaaa@bbbbbbbbbbbb@ccccccccccc@ddddddddd"; 2 char delim[] = "@"; 3 printf("%s\n",buf); 4 char *q = strtok(buf,delim); 5 while(q ) 6 { 7 printf("%s\n",q); 8 q = strtok(NULL,delim); 9 }
程序运行结果: