Linux C 字符串输入函数 gets()、fgets()、scanf() 详解
一、gets() 函数详解
gets()函数用来从 标准输入设备(键盘)读取字符串直到 回车结束,但回车符('\n')不属于这个字符串。
调用格式为:
gets(str);
其中str为字符串变量(字符串数组名或字符串指针)。
gets(str) 函数与 scanf("%s", &str) 相似,但不完全相同,使用 scanf("%s", &str) 函数输入字符串时存在一个问题,就是如果输入了 空格 会认为输入字符串结束。
空格后的字符将作为下一个输入项处理, 但 gets() 函数将接收输入的整个字符串直到 回车 为止。
#include <stdio.h> #include <stdlib.h> int main(int argc, char **argv) { char s[20], *f; printf("input sth\n"); gets(s); // 等待输入字符串直到回车结束 puts(s); // 将输入的字符串输出 puts("input sth\n"); f = malloc(sizeof(f)); gets(f); puts(f); free(f); return 0; }
gets()函数详解 和 缺陷
1、基本信息
原型:
char *gets( char *buffer);
功能描述:
gets()函数从标准输入中读取一行文本,并存储于作为参数传递给它的数组中。一行文本由一串字符组成,以一个换行符('\n')结尾。在返回之前,gets()函数丢弃换行符('\n'),取而代之的是以'\0'结尾。
返回值:
读取成功,函数返回与buffer相同的指针。读入过程中遇到EOF或发生错误,函数返回NULL指针。当返回值为NULL指针时可以用 feof() 和 ferror() 来判断函数是遇到EOF还是发生错误。
例如:
char str[10]; if (gets(str) != NULL) // Danger! { printf("str = %s\n", str); }
2、函数缺陷
gets函数没有限制它所读取长度,程序员应该保证buffer有足够的空间,否则buffer可能无法容纳gets所读取的内容,从而导致堆栈溢出。如果溢出,多出来的字符将被写入到堆栈中,这就覆盖了堆栈原先的内容,破坏一个或多个不相关变量的值。
图1 溢出提示
为了安全起见,可以使用 gets_s() 函数。
二、fgets() 函数详解
fgets()函数,从流中读一行或指定个字符
1、基本信息
原型:
char *fgets(char *s, int n, FILE *stream);
功能描述:
从流中读入 n-1 个字符放入 s 为起始地址的空间内。如果在未读满 n-1 个字符之时,已读到一个换行符('\n')或一个EOF(文件结束标志),则结束本次读操作,读入的字符串中最后包含读到的换行符('\n')。因此,确切地说,调用 fgets() 函数时,最多只能读入 n-1 个字符。读入结束后,系统将自动在最后加 '\0',并以 s 作为函数值返回。
形参注释:
*s:结果数据的首地址;
n-1:一次读入数据块的长度,其默认值为1k,即1024;
stream:文件指针
例:如果一个文件的当前位置的文本如下
Love ,I Have
But ........
如果用
fgets(str1, 4, file1);
则执行后 str1="Lov",读取了 4-1=3 个字符,
而如果用
fgets(str1, 23, file1);
则执行后 str="Love ,I Have",读取了一行(包括行尾的'\n', 并自动加上字符串结束符'\0')。
2、特别说明
该函数从stream
所指的文件中读取以'\n'
结尾的一行(包括'\n'
在内)存到缓冲区s
中,并且在该行末尾添加一个 '\0'
组成完整的字符串。
如果文件中的一行太长,fgets
从文件中读了 n-1
个字符还没有读到 '\n'
,就把已经读到的 n-1
个字符和一个 '\0'
字符存入缓冲区,文件中剩下的半行可以在下次调用 fgets()
时继续读。
如果一次 fgets()
调用在读入若干个字符后到达文件末尾,则将已读到的字符串加上 '\0'
存入缓冲区并返回,如果再次调用 fgets()
则返回 NULL
,可以据此判断是否读到文件末尾。
注意:
对于
fgets()
来说,'\n'
是一个特别的字符,而'\0'
并无任何特别之处,如果读到'\0'
就当作普通字符读入。如果文件中存在
'\0'
字符(或者说0x00字节),调用fgets()
之后就无法判断缓冲区中的'\0'
究竟是从文件读上来的字符还是由fgets()
自动添加的结束符,所以fgets()
只适合读文本文件而不适合读二进制文件,并且文本文件中的所有字符都应该是可见字符,不能有'\0'
。
三、scanf() 函数详解
1、基本信息
函数名:scanf
功 能:执行格式化输入
用 法:int scanf(char *format[,argument,...]);
scanf()函数是通用终端格式化输入函数,它从标准输入设备(键盘) 读取输入的信息。可以读入任何固有类型的数据并自动把数值变换成适当的机内格式。
其调用格式为:
scanf("<格式化字符串>", <地址表>);
scanf()函数返回成功赋值的数据项数,出错时则返回 EOF。
其 控制串 由三类字符构成:
- 格式化说明符;
- 空白符;
- 非空白符;
(A)格式化说明符
格式字符 说明
%a 读入一个浮点值(仅C99有效)
%A 同上
%c 读入一个字符
%d 读入十进制整数
%i 读入十进制,八进制,十六进制整数
%o 读入八进制整数
%x 读入十六进制整数
%X 同上
%c 读入一个字符
%s 读入一个字符串
%f 读入一个浮点数
%F 同上
%e 同上
%E 同上
%g 同上
%G 同上
%p 读入一个指针
%u 读入一个无符号十进制整数
%n 至此已读入值的等价字符数
%[] 扫描字符集合
%% 读%符号
附加格式说明字符表
修饰符 说明
L/l 长度修饰符 输入"长"数据
h 长度修饰符 输入"短"数据
W 整型常数 指定输入数据所占宽度
* 星号 空读一个数据
hh,ll同上h,l但仅对C99有效。
(B)空白字符
空白字符会使scanf()函数在读操作中略去输入中的一个或多个空白字符,空白符可以是space,tab,newline等等,直到第一个非空白符出现为止。
(C)非空白字符
一个非空白字符会使scanf()函数在读入时剔除掉与这个非空白字符相同的字符。
注:scanf()控制串知识就介绍到这里(应该比较齐全了^_^),如有遗漏下次补上。下面将结合实际例程,一一阐述.
2、应用举例
例1.
#include "stdio.h" int main(int argc, char **argv) { int a, b, c; scanf("%d%d%d", &a, &b, &c); printf("%d,%d,%d\n", a, b, c); return 0; }
运行时按如下方式输入三个值:
3□4□5 ↙(输入a,b,c的值)
3,4,5 (printf输出的a,b,c的值)
(1)&a、&b、&c中的&是地址运算符,分别获得这三个变量的内存地址。
(2)"%d%d%d"是按十进值格式输入三个数值。输入时,在两个数据之间可以用一个或多个 空格、tab键、回车键 分隔。
以下是合法输入方式:
① 3□□4□□□□5↙
② 3↙
4□5↙
③ 3(tab键)4↙
5↙
例2.
#include "stdio.h" int main(int argc, char **argv) { int a, b, c; scanf("%d,%d,%d", &a, &b, &c); printf("%d,%d,%d\n", a, b, c); return 0; }
运行时按如下方式输入三个值:
3,4,5 ↙(输入a,b,c的值)
或者
3,□4,□5 ↙(输入a,b,c的值)
3,□□□4,□5 ↙(输入a,b,c的值)
......
都是合法的,但是","一定要跟在数字后面,如:
3□,4,□5 ↙就非法了,程序出错。(解决方法与原因后面讲)
3、注意事项
(1)sacnf()中的变量必须使用地址。
int a, b; scanf("%d%d", a, b); // 错误 scanf("%d%d", &a, &b);
(2)scanf()的格式控制串可以使用其它非空白字符,但在输入时必须输入这些字符。
例:
scanf("%d,%d", &a, &b);
输入: 3,4 ↙(逗号与"%d,%d"中的逗号对应)
scanf("a=%d,b=%d", &a, &b);
输入: a=3,b=4 ↙("a=","b=",逗号与"%d,%d"中的"a=","b="及逗号对应)
(3)在用"%c"输入时,空格和“转义字符”均作为有效字符。
例:
scanf("%c%c%c", &c1, &c2, &c3);
输入:a□b□c↙
结果:a→c1,□→c2,b→c3 (其余被丢弃)
scanf()函数接收输入数据时,遇以下情况结束一个数据的输入:(不是结束该scanf函数,scanf函数仅在每一个数据域均有数据,并按回车后结束)。
① 遇空格、“回车”、“跳格”键。
② 遇宽度结束。
③ 遇非法输入。
4、常见问题
问题一:scanf()函数不能正确接受有空格的字符串?如: I love you!
#include "stdio.h" int main(int argc, char **argv) { char str[80]; scanf("%s", str); printf("%s", str); return 0; }
输入:I live you!
输出:I
scanf()函数接收输入数据时,遇以下情况结束一个数据的输入:(不是结束该scanf函数,scanf函数仅在每一个数据域均有数据,并按回车后结束)。
① 遇空格、“回车”、“跳格”键。
② 遇宽度结束。
③ 遇非法输入。
所以,上述程序并不能达到预期目的,scanf()扫描到"I"后面的空格就认为对str的赋值结束,并忽略后面的"love you!"。这里要注意是"love you!"还在键盘缓冲区(关于这个问题,网上我所见的说法都是如此,但是,我经过调试发现,其实这时缓冲区字符串首尾指针已经相等了,也就是说缓冲区清空了,scanf()函数应该只是扫描stdin流,这个残存信息是在stdin中)。我们改动一下上面的程序来验证一下:
#include <unistd.h> #include "stdio.h" int main(int argc, char **argv) { char str[80]; char str1[80]; char str2[80]; scanf("%s", str); // 此处输入:I love you! printf("%s", str); sleep(5); // 这里等待5秒, 告诉你程序运行到什么地方 scanf("%s", str1); // 这两句无需你再输入, 是对键盘盘缓冲区再扫描 scanf("%s", str2); // 这两句无需你再输入, 是对键盘盘缓冲区再扫描 printf("\n%s", str1); printf("\n%s", str2); return 0; }
输入:I love you!
输出:I
love
you!
好了,原因知道了,那么scanf()函数能不能完成这个任务?回答是:能!别忘了scanf()函数还有一个 %[] 格式控制符(如果对%[]不了解的请查看本文的上篇),请看下面的程序:
#include <unistd.h> #include "stdio.h" int main(int argc, char **argv) { char string[50]; //scanf("%s", string); //不能接收空格符 scanf("%[^\n]", string); printf("%s\n", string); return 0; }
问题二:键盘缓冲区残余信息问题
#include "stdio.h" int main(int argc, char **argv) { int a; char c; do { scanf("%d", &a); scanf("%c", &c); printf("a=%d c=%c\n", a, c); //printf("c=%d\n", c); } while (c != 'N'); return 0; }
scanf("%c", &c);这句不能正常接收字符,什么原因呢?我们用 printf("c=%d\n", c); 将C用int表示出来,启用 printf("c=%d\n", c); 这一句,看看 scanf() 函数赋给c到底是什么,结果是 c=10,ASCII值为10是什么?换行即\n。对了,我们每击打一下"Enter"键,向键盘缓冲区发去一个“回车”(\r),一个“换行"(\n),在这里\r被 scanf() 函数处理掉了(姑且这么认为吧^_^),而\n被scanf()函数“错误”地赋给了c。
解决办法:
可以在两个 scanf() 函数之后加个 fflush(stdin);,还有加 getch(); getchar(); 也可以,但是要视具体 scanf() 语句加那个,这里就不分析了,读者自己去摸索吧。但是加fflush(stdin);不管什么情况都可行。
函数名: fflush
功 能: 清除一个流
用 法: int fflush(FILE *stream);
#include "stdio.h" int main(int argc, char **argv) { int a; char c; do { scanf("%d", &a); fflush(stdin); scanf("%c", &c); fflush(stdin); printf("a=%d c=%c\n", a, c); } while (c != 'N'); return 0; }
这里再给一个用“空格符”来处理缓冲区残余信息的示例:
运行出错的程序:
#include <stdio.h> int main(int argc, char **argv) { int i; char j; for (i = 0; i < 10; i++) { scanf("%c", &j); // 这里%前没有空格 } return 0; }
使用了空格控制符后:
#include <stdio.h> int main(int argc, char **argv) { int i; char j; for (i = 0; i < 10; i++) { scanf(" %c", &j); // 注意这里%前有个空格 } return 0; }
可以运行看看两个程序有什么不同。
问题三:如何处理scanf()函数误输入造成程序死锁或出错?
#include <stdio.h> int main(int argc, char **argv) { int a, b, c; // 计算a+b scanf("%d,%d", &a, &b); c = a + b; printf("%d+%d=%d", a, b, c); return 0; }
如上程序,如果正确输入a,b的值,那么没什么问题,但是,你不能保证使用者每一次都能正确输入,一旦输入了错误的类型,你的程序不是死锁,就是得到一个错误的结果,呵呵,这可能所有人都遇到过的问题吧?
解决方法:
scanf()函数执行成功时的返回值是成功读取的变量数,也就是说,你这个scanf()函数有几个变量,如果scanf()函数全部正常读取,它就返回几。但这里还要注意另一个问题,如果输入了非法数据,键盘缓冲区就可能还个有残余信息问题。
正确的例程:
#include <stdio.h> int main(int argc, char **argv) { int a, b, c; // 计算a+b while (scanf("%d,%d", &a, &b) != 2) { fflush(stdin); } c = a + b; printf("%d+%d=%d", a, b, c); return 0; }