《Unix/Linux系统编程》第九章学习笔记

第9章 I/O库函数

1、I/O库函数与系统调用

系统调用函数:open()、read()、write()、lseek()、close();
I/O库函数:fopen()、fread()、fwrite()、flseek()、fclose()。

I/O库函数一一对应地依赖于系统调用函数。

2、I/O库函数的算法

(1)fread算法

1.在第一次调用fread(时,FILE结构体的缓冲区是空的,fread()使用保存的文件描述符fd发出一个n=read(fd,fbuffer,BLKSIZE);系统调用,用数据块填充内部的fbuf[]。然后,它会初始化fbuf[]的指针、计数器和状态变量以表明内部缓冲区中有一个数据块。接着,通过将数据复制到程序的缓冲区,尝试满足来自内部缓冲区的fread()调用。如果内部缓冲区没有足够的数据,则会再发出一个read()系统调用来填充内部缓冲区,将数据从内部缓冲区传输到程序缓冲区,直到满足所需的字节数(或者文件无更多数据)。将数据复制到程序的缓冲区之后,它会更新内部缓冲区的指针、计数器等,为下一个fread()请求做好准备。然后,它会返回实际读取的数据对象数量。
2.在随后的每次fread()调用中,它都尝试满足来自FILE结构体内部缓冲区的调用。当缓冲区变为空时,它就会发出read()系统调用来重新填充内部缓冲区。因此,fread()一方面接受来自用户程序的调用,另一方面向操作系统内核发出read()系统调用。除了read()系统调用之外,所有fread()处理都在用户模式映像中执行。它只在需要时才会进入操作系统内核,并且以一种最高效匹配文件的方式进人。它会提供自动缓冲机制,因此用户程序不必担心这些具体操作。

(2)fwrite算法

fwrite()算法与fread()算法相似,但数据传输方向不同。

每次调动fwrite()时,它将数据写入缓冲区,并调整缓冲区的指针、计数器和状态变量,以跟踪缓冲区中的字节数。如果缓冲区已满,则发出write()系统调用,将整个缓冲区写入操作系统内核。

(3) fclose()算法

若文件以写的方式被打开,fclose()会先关闭文件流的局部缓冲区。然后,它会发出一个close(fd)系统调用来关闭FILE结构体中的文件描述符。最后,它会释放FILE结构体并将FILE指针重置为NULL。

3、I/O库模式

fopen()中的模式参数可以指定为:"r"、" w"、"a”,分别代表读、写、追加。每个模式字符串可包含一个+号,表示同时读写,或者在写入、追加情况下,如果文件不存在则创建文件。
"r+":表示读/写,不会截断文件。
"w+":表示读/写,但是会先截断文件; 如果文件不存在,会创建文件。
"a+":表示通过追加进行读/写;如果文件不存在,会创建文件。

(1)字符模式I/O

int fgetc(FILE *fp);
int ungetc(int c,FILE *fp);
int fputc(int c,FILE *fp)。

(2) 行模式I/O

char *fgets(char *buf,int size,FILE *fp):从fp中读取最多为一行(以\n结尾)的字符。
int fputs(char *buf,FILE *fp):将buf中的一行写入fp中。

(3) 格式化I/O(最常用)

格式化输入:(FMT=格式字符串)
scanf(char *FMT,&items);
fscanf(fp,char *FMT,&items)。
格式化输出:
printf(char *FMT,items);
fprintf(fp,char *FMT,items)。

(4) 内存中的转换函数

sscanf(buf,FMT,&items);
sprintf(buf,FMT,items);
sscanf()和sprintf()并非I/0函数,而是内存中的数据转换函数。

(5) 其他I/O库函数

fseek()、ftell()、rewind():更改文件流中的读/写字节位置。
feof()、ferr()、fileno():测试文件流状态。
fdopen():用文件描述符打开文件流。
freopen():以新名称重新打开现有的流。
setbuf()、setvbuf():设置缓冲方案。
popen():创建管道,复刻子进程来调用sh。

(6) 限制混合fread-fwrite

当某文件流同时用于读/写时,就会限制使用合fread()和fwrite()调用。规范要求每对fread()和fwrite()之间至少有一个fseek()或ftell()。

4、文件流缓冲

(1) 通过fopen()创建文件流之后,在对其执行任何操作之前,用户均可发出一个

setvbuf(FILE *stream, char *buf, int mode, int size)

其中buf为缓冲区,mode为缓冲方案,size为缓冲区大小。

(2) 三种缓冲方案:

无缓冲(_IONBUF):从非缓冲流中写入或读取的字符将尽快单独传输到文件或从文件中传输。
行缓冲(_IOLBUF):遇到换行符时,写入行缓冲流的字符以块的形式传输。
全缓冲(_IOFBUF):写入全缓冲流或从中读取的字符以块大小传输到文件或从文件传输。这是文件流的正常缓冲方案。

 

问题与解决思路:

1、库函数IO与系统调用IO功能类似,为什么还要对系统调用接口进行封装呢?

首先要理解open返回的操作句柄即文件描述符--一个非负数是如何描述一个具体文件呢?

文件描述符:为系统内核中进程所打开的文件描述信息表中的下标索引。

文件描述符分配原则:在file_struct数组中,找到未被使用的最小下标,作为新的文件描述符

标准输入文件fd=0(scanf),标准输出文件fd=1(printf),标准错误文件fd=2。

引入重定向概念:通过改变文件描述符下标位置所保存的文件描述信息,进而改变这个描述符所操作的文件,改变数据的流向。

int dup2(int oldfd,int newfd)将newfd重定向到oldfd。

文件流指针就是一个FILE*结构体指针,结构体中包含一个成员变量就是文件描述符。

2、库函数和系统调用的区别:

本质方面:函数调用数内核提供给应用程序的一部分,库函数是为了方便人们而编程设计的。

空间方面:系统调用在内核地址空间执行,属于系统时间,开销大;库函数在用户空间执行,开销小。

缓冲方面:系统调用无缓冲区,库函数有缓冲区。

系统相关方面:系统调用由操作系统决定,操作系统不同那么底层函数不同;库函数和系统无关,始终在C库中存放,代码不会变,根据系统不同会调用不同的底层函数,但接口不变,因此可移植性好。

3、文本文件和二进制文件

所谓的文本文件,就是按照字符的编码规则(比如ASCII),1:1的根据你敲的字符形成的机器码文件。后缀习惯是以.txt结尾。一个典型的文本编辑器就是大家熟悉的记事本程序(notepad.exe)。

二进制文件是可以认为是所有非文本文件都称之为二进制文件。

要打开二进制文件,需要有形成这类文件的程序的内置的解析器,才能解读。这也解释了为什么不同的文件比如pdf,docx等文件,在编程的时候,必须要有相应的文档解析类函数来完成的原因了。

当然你完全可以用二进制方式打开任何一个文本文件,因为底层上就是那些代码,你只需要读取每一个字节,查找转化成相应字符予以显示就可以了,因为是你知道ASCII表的规则。

 

 

posted @ 2021-09-25 23:59  20191309刘嘉祺  阅读(37)  评论(0编辑  收藏  举报