2018-2019-1 20165237 《信息安全系统设计基础》第六周学习总结
2018-2019-1 20165237 《信息安全系统设计基础》第六周学习总结
系统级I/O
- 输入/输出(I/O)是在主存和外部设备之间拷贝数据的过程,输入操作是从I/O设备拷贝数据到主存,输出操作是从主存拷贝数据到I/O设备。
Unix I/O
- I/O设备:网络、磁盘和终端
- 描述符:打开文件时,内核返回一个小的非负整数。
- Unix外壳创建的每个进程开始时都有三个打开的文件:标准输入(描述符为0)、标准输出(描述符为1)、标准错误(描述符为2)。
- 改变当前的文件位置:文件位置为k,初始为0。
- seek操作:显式地设置文件的当前位置为k。
-关闭文件:内核释放文件打开时创建的数据结构,并将这个描述符恢复到可用的描述符池中。无论一个进程因为何种原因终止时,内核都会关闭所有打开的文件并释放它们的存储器资源。
打开和关闭文件
- open函数:打开一个已存在的文件或者创建一个新文件
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
int open(char *filename,int flags,mode_t mode);
- 对于open函数的说明:
- 返回值:open函数将filename转换为一个文件描述符,并且返回描述符数字。返回的描述符总是在进程中当前没有打开的最小描述符。
- flags:指明了进程打算如何访问这个文件
- mode:指定了新文件的访问权限位文件的访问权限位被设置为
mode & ~umask
- close函数:关闭一个打开的文件
#include <unistd.h>
int close(int fd);
读和写文件
- 应用程序是通过分别调用read和write函数来执行输入和输出的。
#include <unistd.h>
ssize_t read(int fd,void *buf,size_t n);
ssize_t write(int fd,const void *buf,size_t n);
- 相关说明:
- read函数:从描述符为fd的当前文件位置拷贝最多n个字节到存储器位置buf。返回值:-1表示一个错误;0表示EOF;否则,返回值表示的是实际传送的字节数量。
- 从存储器位置buf拷贝至多n个字节到描述符fd的当前文件位置。返回值:若成功则为写的字节数,若出错则为-1。
- lseek函数:应用程序能够显式地修改当前文件的位置。
- 不足值:read和write传送的字节比应用程序要求的少。
- 读时遇到EOF
- 从终端读文本行
- 读和写网络套接字
读取文件元数据
- 检索文件信息(元数据):应用程序能够通过调用stat和fstat函数
#include <unistd.h>
#include <sys/stat.h>
int stat(const char *filename,struct stat *buf);
//stat函数以一个文件名作为输入,填写一个stat数据结构中的各个成员。
int fstat(int fd,struct stat *buf);
//fstat函数以文件描述符而不是文件名作为输入。
- st_size成员包含了文件的字节数大小
- st_mode成员编码了文件访问许可位和文件类型
- Unix提供的宏指令根据st_mode成员来确定文件的类型
宏指令 | 描述 |
---|---|
S_ISREG() | 这是一个普通文件吗? |
S_ISDIR() | 这是一个目录文件吗? |
S_ISSOCK() | 这是一个网络套接字吗? |
共享文件
- 内核使用三个相关的数据结构来表示打开的文件:
- 描述符表:每个打开的描述符表项指向文件表中的一个表项
- 文件表:所有进程共享这张表,每个表项包括文件位置,引用计数,以及一个指向v-node表对应表项的指针
- v-node表:所有进程共享这张表,包含stat结构中的大多数信息
- 关键思想是每个描述符都有它自己的文件位置,所以对不同描述符的读操作可以从文件的不同位置获取数据。
I/O重定向
-
Unix外壳提供了I/O重定向操作符,允许用户将磁盘文件和标准输入输出联系起来。
unix> ls > foo.txt
-
、I/O重定向是依靠dup2函数工作的。
#include <unistd.h>
int dup2(int oldfd,int newfd);
- dup2函数拷贝描述符表表项oldfd到描述符表表项newfd,覆盖描述符表表项newfd以前的内容。若newfd已经打卡了。dup2会在拷贝oldfd之前关闭newfd。
标准I/O
- 标准I/O库将一个打开的文件模型化为一个流,一个流就是一个指向FILE类型的结构的指针。每个ANSIC程序开始都有三个打开的流stdin、stdout和stderr,分别对应于标准输入、标准输出、标准错误。
- 类型为FILE的流是对文件描述符和流缓冲区的抽象。流缓冲区的目的和RIO读缓冲区的一样,就是开销较高的Unix I/O系统调用的数量尽量能的小。
I/O函数的使用
- 应用程序可以通过open、close、lseek、read、write和stat这样的函数来访问Unix I/O。
- 标准I/O函数:提供了Unix I/O函数的一个更加完整的带缓冲的替代品,包括格式化的I/O例程。是磁盘和终端设备I/O之选。
- 套接字描述符:
- Unix对网络的抽象是一种称为套接字的文件类型,被称为套接字描述符。应用进程通过读写套接字描述符来与运行在其他计算机上的进程通信。
- 对流I/O限制是:
- 跟在输出函数之后的输入函数,必须在其中间插入fflush、fseek、fsetpos或者rewind函数,后三个函数使用Unix I/O中的lseek函数来重置当前的文件位置。
- 跟在输入函数之后的输出函数,必须在中间插入fseek、fsetpos或者rewind的调用,一个输出函数不能跟随在一个输入函数之后,除非该输入函数遇到了一个EOF。
- 解决对流I/O限制的方法是:
- 采用在每个输入操作前刷新缓存区这样的规则来满足。
- 对同一个打开的套接字描述符打开两个流,一个用来读,一个用来写。
- 对套接字使用lseek函数是非法的。
- 在网络套接字上,使用RIO函数更常见。
学习进度条
代码行数(新增/累积) | 博客量(新增/累积) | 学习时间(新增/累积) | 重要成长 | |
---|---|---|---|---|
目标 | 5000行 | 20篇 | 400小时 | |
第一周 | 61/61 | 1/1 | 10/10 | 了解vim,gcc,gdb基本操作 |
第二周 | 0/61 | 1/2 | 10/20 | 了解信息的表示和处理 |
第三周 | 21/81 | 1/3 | 10/30 | 更深层次了解信息处理 |
第四周 | 29/110 | 2/5 | 10/40 | Y86处理器 |
第五周 | 39/149 | 1/6 | 14/54 | 理解了局部性原理 |
第六周 | 21/170 | 2/8 | 16/70 | 了解Linux是怎样操作文件 |