C/C++标准I/O缓冲区:全缓冲和行缓冲
行缓冲和全缓冲
ISO C标准I/O提供了全缓冲和行缓冲
全缓冲:在进行I/O操作时,只有当I/O缓冲区被填满时,才进行真正的I/O操作。所以对于全缓冲的缓冲区可由标准I/O例程自动刷新,即当缓冲区填满时,还有一种方法就是调用函数fflush进行刷新。
行缓冲:在I/O操作时,输入输出遇到换行符时进行,进行真正的I/O操作。对于行缓冲,标准I/O每一行缓冲区的长度是固定的,所以只要填满了缓冲区,即使没有遇到换行符,也换刷新缓冲区。
当然标准I/O还提供了不带缓冲的类型,就是不对字符进行缓冲操作。那么全缓冲和行缓冲都用在I/O操作的哪些地方呢。
ISO C要求:
- 当且仅当标准输入和输出不涉及交互式设备(终端设备)时,它们才是全缓冲。
- 标准出错不是全缓冲。
但是这并没有告诉我们当涉及到交互式设备时,标准输入输出是行缓冲还是不带缓冲,以及标准出错时行缓冲还是不带缓冲。很多系统(FreeBSD,Linux,Mac OS,Solaris)默认使用下面类型缓冲:
- 如果标准输入输出涉及终端设备,则它们是行缓冲,否则是全缓冲。
- 标准出错不带缓冲。
我们都知道shell为每个进程都定义了三个文件描述符:0,1,2。这三个文件描述符分别与进程的标准输入,标准输出和标准出错输出相关联。在unistd.h头文件中这三个常量分别替换成STDIN_FILENO,STDOUT_FILENO,STDERR_FILENO符号。在ISO C中分别对应与stdin,stdout,stderr。
由apue chapter 8中的一个例子可以深刻的体会到上面所说的全缓冲和行缓冲的区别;
1 #include <stdio.h>
2 #include <string.h>
3
4 #include <unistd.h>
5
6 int glob = 6;
7 char buf[] = "anonymalias\n";
8
9 int main()
10 {
11 int var;
12 pid_t pid;
13
14 var = 8;
15
16 if(write(STDOUT_FILENO, buf, strlen(buf)) != strlen(buf))
17 {
18 fprintf(stderr, "write error");
19 return 0;
20 }
21
22 printf("before fork()...\n");
23
24 if((pid = fork()) == -1)
25 {
26 fprintf(stderr, "fork error");
27 return 0;
28 }
29 if(pid == 0)
30 {
31 glob++;
32 var++;
33 }
34 else
35 {
36 sleep(2);
37 }
38 printf("parent process id:%d ", getppid());
39 printf("process id:%d, glob:%d, var:%d\n", getpid(), glob, var);
40 return 0;
41 }
若执行输入为:./unix8_1时,输出结果为:
anonymalias before fork()... parent process id:7222 process id:7223, glob:7, var:9 parent process id:5200 process id:7222, glob:6, var:8
若执行输入为:./unix8_1 > temp 时,查看temp文件,输出结果为:
anonymalias before fork()... parent process id:7237 process id:7238, glob:7, var:9 before fork()... parent process id:5200 process id:7237, glob:6, var:8
之所以会出那先上面的结果是因为:在执行unix8_1时,默认的标准输出为终端设备即显示器。这时标准输出缓冲区为行缓冲,在执行到第22行输出后缓冲区会被刷新。
而在./unix8_1 > temp时标准输出被重定向到文件,非交互式设备。这时标准输出缓冲区为全缓冲,在执行到第22行时,不会进行输出,缓冲区不会被刷新。只有等到缓冲区满或进行fflush,才会进行输出。
而在fork生成子进程后,子进程会复制父进程的数据空间,当然包括父进程打开的文件描述符所对应的缓冲区。在./unix8_1时中第22行输出后缓冲区已经被刷新即清除,所以子进程不会复制这部分缓冲区;而在执行./unix8_1 > temp时,第22行标准输出的缓冲区是全缓冲,不会被刷新,所以子进程会复制这部分缓冲区,在程序结束时才会对输出缓冲区进行刷新。所以最后会输出两次“before fork()...”,因为父进程和子进程都有自己的这部分缓冲区。
要想在执行./unix8_1 和./unix8_1 > temp 时输出结果一样,可以再第22行后面加上一句fflush:
printf("before fork()...\n");
fflush(stdout);
这样输出的结果就都是
anonymalias before fork()... parent process id:7222 process id:7223, glob:7, var:9 parent process id:5200 process id:7222, glob:6, var:8
在多线程和网络编程中标准I/O函数的限制:
在linux和多线程编程的时候,如果要把数据输出到终端上的时候,一定要记得flush一下缓冲区,而且如果我们用流进行读写时一定要清楚以下限制:
限制一:跟在输出函数之后的输入函数。如果中间没有插入对fflush,fseek,fsetpos或者rewind的调用,一个输入函数不能跟在一个输出函数之后,fflush函数清空与流相关的缓冲区,后三个函数使用Unix/IO lseek函数来重置当前文件的位置。
限制二:跟在输入函数之后的输出函数,如果中间没有插入对fflush,fseek,fsetpos或者rewind的调用,一个输出函数不能跟在一个输入函数之后,除非该输入函数遇到了一个EOF
参考地址:http://blog.csdn.net/anonymalias/article/details/8011115