信息安全系统设计基础第九周学习总结

【学习时间：6小时】

【学习内容：CHAPTER 10——系统级I/O】

一、课本内容

1.每个unix文件都是一个m字节的序列；所有I/O设备如网络、磁盘和终端都被模型化为文件，而输入和输出就是对这些文件的读写操作。

2.unix系统中输入输出的操作：

打开文件：一个应用程序通过要求内核打开相应的文件，来宣告它想要访问一个I/O设备，内核返回一个小的非负整数，叫做描述符。unix系统创建每个进程的时候都有三个打开的文件：标准输入；标准输出，标准错误。
改变当前的文件位置。对于每个打开的文件，内核保持着一个文件位置k（从文件开头起始的字节偏移量）。
读写文件。读操作就是从文件拷贝n>0个字节到存储器，从当前文件位置k开始，然后将k增加到k+n。
关闭文件。应用通知内核关闭这个文件；作为响应，内核释放文件打开时创建的数据结构，并将这个描述符恢复到可用的描述符池当中。

【把I/O抽象成文件，其实是把系统内的一切操作都变成对文件（字节序列）的操作；这样极大地简洁了各类动作。上述对文件的描述，其实是输入输出类型的“文件操作”，分别对应的是进行I/O、读写操作。】

3.打开和关闭文件

打开文件：

fd = Open("文件名",flag位——表示访问方式及额外提示，mode参数);//出错的时候返回-1
1. mode参数指定新文件的访问权限位。作为上下文的一部分，每个进程都有一个umask；当进程通过带某个带mode参数的open函数用来创建一个新文件的时候，文件的访问权限位被设置为mode & ~umask。
2. fd是返回的文件描述符（数字），总是返回在进程中当前没有打开的最小描述符。
3. flag参数可以是一位或者多位掩码的或，如：O_CREAT,表示如果文件不存在，就创建它的一个截断的文件。
关闭文件：

int close(int fd);//若成功则返回0，不成功则为-1

【这里的打开文件时返回值fd的详细介绍（比如什么是“在进程中当前没有打开的最小描述符”可以参考练习题10.1）】

4.读写文件

读函数

ssize_t read(int fd,void *buf,size_t n);//成功则返回n；EOF返回0；出错返回-1

read函数从描述符为fd的当前文件位置拷贝最多n个字节到存储器位置buf。

【什么是EOF？就是给定了m字节大小的文件；在从k字节位置开始读或者写的时候，发现k>=m】

写函数

ssize_t write(int fd,const void *buf,size_t n);

【ssziet,sizet有什么区别？前者被定义为int，有符号；后者被定义成unsigned int，无符号】

5.RIO包

无缓冲的输入输出函数。直接在存储器和文件之间传送数据(允许被中断的字节调用，并在必要的时候重启它们)。

ssizet riowriten(int fd,const void *usrbuf,size_t n);

ssizet riowriten(int fd,const void *usrbuf,size_t n);

rio__writen函数遇到EOF的时候返回0；

rio__readn遇到EOF的时候返回不足值（即不足n的那个部分的字节数）。

带缓冲的输入函数。允许用户高效地从文件中读取文本行和二进制数据（之前是一次读一个字节，应用这个函数之后，可以一次读一行函数）。

原理：函数从内部缓冲区中拷贝一个文本行，当缓冲区变空的时候，会自动地调用read重新填满缓冲区。

6.带缓冲的输入函数详解

rioreadinitb(riot *rp,int fd);

每打开一个描述符都会调用一次该函数，它将描述符fd和地址rp处的类型为rio_t的缓冲区联系起来。

rioreadnb(riot *rp,void *usrbuf,size_t n) ;

从文件rp中最多读n个字节到存储器位置usrbuf。对同一描述符，rioreadnb和rioreadlineb的调用可以交叉进行。

ssizet readlineb(riot *rp,void *usrbuf,size_t maxlen);

从文件rp中读取一个文本行（包括结尾的换行符），将它拷贝到存储器位置usrbuf，并用空字符来结束这个文本行。

7.RIO读程序核心：rio-read函数

static ssize_t rio_read(rio_t *rp,char *usrbuf,size_t n)
{
    int cnt;
    while(rp->rio_cnt<=0)//如果缓冲区为空，先调用函数填满缓冲区再读数据
    {
        rp->rio_cnt=read(rp->rio_fd,rp->rio_buf,sizeof(rp->rio_buf));//调用read函数填满缓冲区
        if(rp->rio_cnt<0)//排除文件读不出数据的情况
        {
            if（error != EINTR）
            {
                return -1;
            }
        }
        else if(rp->rio_cnt=0)
            return 0;
        else 
            rp->rio_bufptr = rp->rio_buf;//更新现在读到的位置
    }
    cnt=n;
    if(rp->rio_cnt<n)
        cnt=rp->rio_cnt;//以上三步，将n与rp->rio_cnt中较小的值赋给cnt
    memcpy(usrbuf,rp->rio_bufptr,cnt);把读缓冲区的内容拷贝到用户缓冲区
    rp->rio_bufptr+=cnt;
    rp->rio_cnt-=cnt;
    return cnt;
}

8.读取文件元数据

应用程序能够通过调用stat和fstat函数，检索到关于文件的信息（元数据）。

函数格式：

#include <unistd.h>
#include <sys/stat.h>
int stat(cost char *filename,struc sta *buf);
int fstat(int fd,struct stat *buf);

这两个函数都需要填写stat结构体的各个成员。这里举两个例子：stsize包含了文件的字节数大小；stmode则编码了文件访问许可位和文件类型（目录文件：包含关于其他文件的信息；套接字是一种用来通过网络与其他进程通信的文件）。

9.表示打开文件的三个数据结构

描述符表。每个进程都有独立的描述符表；它的表项是由进程打开的文件描述符来索引的。
v-node表。所有进程共享。每个表项包含stat结构中的大多数信息。
文件表。表示打开文件的集合；所有的进程共享。表项有：文件位置、引用计数、指向v-node表中对应表项的指针。

10.文件共享方式

没有共享文件，每个描述符对应一个不同文件。
多个描述符也可以通过不同的文件表表项来引用同一个文件。（每个描述符都有自己的文件位置，所以对不同描述符的读操作可以从文件的不同位置获取数据）
父子进程可以共享文件。子进程会有一个父进程描述符表项的副本，父子进程打开相同的文件表集合，共享相同的文件位置。在内核删除相应的文件表表项之前，父子进程都必须关闭相应的描述符表项。

二、习题筛选

1.下面程序的输出是什么？

#include "csapp.h"
int main()
{
    int fd1,fd2;
    fd1=Open("foo.txt",O_RDONLY,0);
    Close(fd1);
    fd2=Open("baz.txt",O_RDONLY,0);
    printf("fd2=%d\n",fd2);
    exit(0);
}

【unix进程生命周期开始的时候，就已经有了三个打开的描述符：标准输入、标准输出、标准错误，分别为0，1，2。所以fd2的值应该是3】

2.下面代码的功能是什么？

#include "csapp.h"
int main(void)
{
    char c;
    while(Read(STDIN_FILENO,&C,1) !=0)
        Write(STDOUT_FILENO,&c,1);
    exit(0);
}

【每次一个字节，从标准输入传递到标准输出】

3.假设磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么，下列程序的输出是什么？

#include "csapp.h"
int main()
{
    int fd1,fd2;
    char c;
    fd1=Open("foobar.txt",O_RDONLY,0);
    fd2=Open("foobar.txt",O_RDONLY,0);
    Read(fd1,&c,1);
    Read(fd2,&c,1);
    printf("c=%c\n",c);
    exit(0);
}

【描述符fd1和fd2都有各自的打开文件表表项，所以有它们各自的文件位置（也就是说互不影响，不会因为fd1先执行就使得fd2打开的文件位置推后）。则fd2打开文件读出的第一个字母还是f。】

4.就像前面那样，磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么，下列程序的输出是什么？

#include "csapp.h"
int main()
{
    int fd;
    char c;
    fd=Open("foobar.txt",O_RDONLY,0);
    if(Fork()==0)
    {
        Read(fd,&c,1);
        exit(0);
    }
    Wait(NULL);
    Read(fd,&c,1);
    printf("c=%c\n",c);
    exit(0);
}

【父子进程共享相同的文件表表项，因此依次读取的是“f”和“o”。输出为o。】

心得

本次学习的章节内容较少，然而值得深入挖掘的代码部分也是十分重要。我之间就觉得，读代码是一件很有意思的事情——在逐行推敲之后恍然大悟，好像柳暗花明。本章节的代码设计的都是对“基本操作”的分解（原来简单的输入和输出背后也是这么多有序的步骤）；读起来更是饶有趣味。

另外，在使用虚拟机的时候，我发现虚拟机平台提示“硬盘位置改动”导致linux系统不可用；在百度了资料之后，利用虚拟介质管理修复了错误。

posted @ 2015-11-05 20:45 5216 Views(337) Comments(0) 收藏举报

刷新页面返回顶部

司马欧阳

信息安全系统设计基础第九周学习总结

信息安全系统设计基础第九周学习总结

一、课本内容

1.每个unix文件都是一个m字节的序列；所有I/O设备如网络、磁盘和终端都被模型化为文件，而输入和输出就是对这些文件的读写操作。

2.unix系统中输入输出的操作：

3.打开和关闭文件

4.读写文件

5.RIO包

6.带缓冲的输入函数详解

7.RIO读程序核心：rio-read函数

8.读取文件元数据

9.表示打开文件的三个数据结构

10.文件共享方式

二、习题筛选

1.下面程序的输出是什么？

2.下面代码的功能是什么？

3.假设磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么，下列程序的输出是什么？

4.就像前面那样，磁盘文件foobar.txt由6个ASCII码字符“foobar”组成。那么，下列程序的输出是什么？

心得

公告