C Primer Plus学习笔记(七)- 字符输入/输出和输入验证
单字符 I/O:getchar() 和 putchar()
getchar() 和 putchar() 每次只处理一个字符
getchar() 和 putchar() 都不是真正的函数,它们被定义为供预处理器使用的宏
getchar() 不带任何参数,它从输入队列中返回下一个字符
例如,下面的语句读取下一个字符输入,并把该字符的值赋给变量 ch
ch = getchar(); 等同于 scanf("%c", &ch);
putchar() 打印它的参数
例如,下面的语句把之前赋给 ch 的值作为字符打印出来
putchar(ch); 等同于 printf("%c", ch);
getchar() 和 putchar() 不需要转换说明,因为它们只处理字符
缓冲区
回显用户输入的字符后立即重复打印该字符是属于无缓冲(或直接)输入,即正在等待的程序可立即使用输入的字符
大部分系统在用户按下 Enter 键之前不会重复打印刚输入的字符,这种输入形式属于缓冲输入。用户输入的字符被收集并储存在一个被称为缓冲区(buffer)的临时存储区,按下 Enter 键后,程序才能使用用户输入的字符
缓冲分为两类:完全缓冲 I/O 和行缓冲 I/O
完全缓冲输入指的是当缓冲区被填满时才刷新缓冲区(内容被发送到目的地),通常出现在文件输入中
缓冲区的大小取决于系统,常见的大小是 512 字节和 4096 字节
行缓冲 I/O 指的是在出现换行符时刷新缓冲区
键盘输入通常是行缓冲输入,所以在按下 Enter 键后才刷新缓冲区
结束键盘输入
文件、流和键盘输入
文件和存储器中储存信息的区域
通常,文件都保存在某种永久存储器中(如,硬盘、U 盘或 DVD 等)
从较低层面上,C 可以使用主机操作系统的基本文件工具直接处理文件,这些直接调用操作系统的函数被称为底层 I/O(low-level I/O)
由于计算机系统各不相同,所以不可能为普通的底层 I/O 函数创建标准库
从较高层面上,C 还可以通过标准 I/O 包(standard I/O package)来处理文件
不同的系统储存文件的方式不同
有些系统把文件的内容储存在一处,而文件相关的信息储存在另一处,有些系统在文件中创建一份文件描述
在处理文件方面,有些系统使用单个换行符标记行末尾,而其他系统可能使用回车符和换行符的组合来表示行末尾
有些系统用最小字节来衡量文件的大小,有些系统则以字节块的大小来衡量
如果使用标准 I/O 包,就不用考虑这些差异。即使系统实际用的是回车符和换行符的组合来标记行末尾,I/O 函数会在两种表示法之间相互转换
C 程序处理的是流而不是直接处理文件
流(stream)是一个实际输入或输出映射的理想化数据流,这意味着不同属性和不同种类的输入,由属性更统一的流来表示
打开文件的过程就是把流和文件相关联,而且读写都通过流来完成
C 把输入和输出设备视为存储设备上的普通文件,尤其是把键盘和显示设备视为每个 C 程序自动打开的文件
stdin 流表示键盘输入,stdout 流表示屏幕输出
getchar()、putchar()、printf()、scanf() 函数都是标准 I/O 包的成员,处理上面这两个流
文件结尾
检测文件结尾的一种方法是,在文件末尾放一个特殊的字符标记文件结尾,如 Ctrl + Z
操作系统使用的另一种方法是储存文件大小的信息,如果文件有 3000 字节,程序在读到 3000 字节时便达到文件的末尾
在 C 语言中,用 getchar() 读取文件检测到文件结尾时将返回一个特殊的值,即 EOF(end of file 的缩写)
scanf() 函数检测到文件结尾时也返回 EOF
通常,EOF 定义在 stdio.h 文件中:
#define EOF (-1)
因为 getchar() 函数的返回值通常都介于 0~127,这些值对应标准字符集。但是,如果系统能识别扩展字符集,该函数的返回值可能在 0~255 之间。无论哪种情况,-1 都不对应任何字符,所以,该值可用于标记文件结尾
某些系统也许把 EOF 定义为 -1 以外的值,但是定义的值一定与输入字符所产生的返回值不同
如果包含 stdio.h 文件,并使用 EOF 符号,就不必担心 EOF 值不同的问题
EOF 是一个值,标志着检测到文件结尾,并不是在文件中找得到的符号
绝大部分系统都有办法通过键盘模拟文件结尾条件
// 重复输入,直到文件末尾 #include <stdio.h> int main(void) { int ch; while ((ch = getchar()) != EOF) putchar(ch); return 0; }
由于 getchar() 函数的返回类型是 int,如果把 getchar() 的返回值赋给 char 类型的变量,一些编译器会警告可能丢失数据
使用该程序进行键盘输入,要设法输入 EOF 字符。不能只输入字符 EOF,也不能只输入 -1(输入 -1 会传送两个字符:一个是连字符和一个数字 1)
正确的方法是,必须找出当前系统的要求,即规定的文件结尾信号
重定向和文件
在默认情况下,C 程序使用标准 I/O 包查找标准输入作为输入源
程序可以通过两种方式使用文件:
第一种方法是,显示使用特定的函数打开文件、关闭文件、读取文件、写入文件,诸如此类
第二种方法是,设计能与键盘和屏幕互动的程序,通过不同的渠道重定向输入至文件和从文件输出
重定向的一个主要问题是它与操作系统有关,与 C 无关
UNIX、Linux 和 DOS 重定向
UNIX(运行命令行模式时)、Linux(ditto)和 Windows 命令行提示(模仿旧式 DOS 命令行环境)都能重定向输入、输出
重定向输入让程序使用文件而不是键盘来输入,重定向输出让程序输出至文件而不是屏幕
1.重定向输入
// 重复输入,直到文件末尾 #include <stdio.h> int main(void) { int ch; while ((ch = getchar()) != EOF) putchar(ch); return 0; }
该程序获取用户从键盘输入的输入,如果要处理一个名为 words 的文本文件的话
sch01ar@ubuntu:~$ ./echo_eof < words
运行结果
< 符号是 UNIX 和 DOS/Windows 的重定向运算符
该运算符使 words 文件与 stdin 流相关联,把文件中的内容导入 echo_eof 程序
echo_eof 程序本身并不知道(或不关心)输入的内容是来自文件还是键盘,它只知道这是需要导入的字符流,所以它读取这些内容并把字符逐个打印在屏幕上,直到读到文件结尾
因为 C 把文件和 I/O 设备放在一个层面,所以文件就是现在的 I/O 设备
2.重定向输出
// 重复输入,直到文件末尾 #include <stdio.h> int main(void) { int ch; while ((ch = getchar()) != EOF) putchar(ch); return 0; }
如果要用该程序把键盘输入的内容发送到名为 mywords 的文件中
sch01ar@ubuntu:~$ ./echo_eof > mywords
运行结果
> 符号也是 UNIX 和 DOS/Windows 的重定向运算符
它创建了一个名为 mywords 的新文件,然后把 echo_eof 的输出(即,你输入字符的副本)重定向至该文件中
重定向把 stdout 从显示设备(即,显示器)赋给 mywords 文件
如果已经有一个名为 mywords 的文件,通常会擦除该文件的内容,然后替换新的内容
在 UNIX 中,按 Ctrl + D 结束程序
在 DOS 中,按 Ctrl + Z 结束程序
在每行的末尾按 Enter 键,才能把缓冲区的内容发送给程序