2017-2018-1 20155330 《信息安全系统设计基础》第13周学习总结

教材学习内容总结

Unix I/O

基本概念：所有的I/O设备都被模型化为文件，而所有的输入和输出都被当作对相应文件的读和写来执行。这种将设备优雅地映射为文件的方式，允许Linux内核引出一个简单、低级的应用接口，称为Unix I/O。
Unix I/O所有的输入和输出都能以一种统一且一致的方式执行：
- 打开文件。
  
  应用程序向内核发出请求→要求内核打开相应的文件→内核返回文件描述符
- Linux shell创建的每个进程开始时都有三个打开的文件：标准输入（描述符为0）、标准输出（描述符为1）和标准错误（描述符为2）。头文件<unistd.h>定义常量STDIN_FILENO、STDOUT_FILENO、STDERR_FILENO用来代替显式的描述符值。
- 改变当前的文件位置。
- 读写文件。
- 关闭文件。

打开和关闭文件

1.open函数

（1）函数定义：

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(char *filename, int flags, mode_t mode);

（2）参数解析：

flags：指明进程打算如何访问这个文件，主要参数：

O_RDONLY：只读
O_WRONLY：只写
O_RDWR：可读可写

O_CREAT：文件不存在，就创建新文件
O_TRUNC：如果文件存在，就截断它
O_APPEND：写操作前设置文件位置到结尾处
这些值可以用或连接起来。
mode：指定了新文件的访问权限位，符号名称如下：

读和写文件

读和写文件
1.读 read

（1）函数原型：

#include <unistd.h>

ssize_t read(int fd, void *buf, size_t n);

（2）参数：

返回值：成功则返回读的字节数，EOF返回0，出错返回-1。返回值为有符号数。

fd：文件描述符

buf：存储器位置

n：最多从当前文件位置拷贝n个字节到存储器位置buf
2.写 write

（1）函数原型：

#include <unistd.h>

ssize_t write(int fd, void *buf, size_t n);

（2）参数：

返回值：成功则返回写的字节数，出错返回-1。返回值为有符号数。

fd：文件描述符

buf：存储器位置

n：最多从存储器位置buf拷贝n个字节到当前文件位置

PS：read和write在正常情况下返回值是实际传送的字节数量。

3.通过lseek函数可以显式的修改当前文件的位置。

> ssize_t和size_t有什么区别？

4.不足值

在某些情况下，read和write传送的字节比应用程序要求的要少，原因如下：

读的时候遇到EOF
从终端读文本行
读和写socket

用RIO包健壮的读写

RIO，Robust I/O，自动处理不足值。

1.RIO的无缓冲的输入输出函数。

这些函数的作用是直接在存储器和文件之间传送数据，常适用于网络和二进制数据之间。

rio_readn函数和rio_writen定义：

#include "csapp.h"

ssize_t rio_readn(int fd, void *usrbuf, size_t n);
ssize_t rio_writen(int fd, void *usrbuf, size_t n);

参数：

fd：文件描述符
usrbuf：存储器位置
n:传送的字节数
返回值：

rio_readn成功则返回传送的字节数，EOF为0（一个不足值），出错为-1

rio_writen成功则返回传送的字节数，出错为-1，没有不足值。

2.RIO的带缓冲的输入函数

可以高效的从文件中读取文本行和二进制数据。

一个文本行就是一个由换行符结尾的ASCII码字符序列。

使用RIO函数实现一次一行的从标准输入复制一个文本文件到标准输出。

#include "csapp.h"

int main(int argc, char **argv) 
{
    int n;
    rio_t rio;
    char buf[MAXLINE];

    Rio_readinitb(&rio, STDIN_FILENO);//连接标准输入和rio地址
    while((n = Rio_readlineb(&rio, buf, MAXLINE)) != 0) //当成功返回时，将rio中的内容拷贝到存储器位置buf中，最多读maxline-1
    Rio_writen(STDOUT_FILENO, buf, n);//把存储器位置中的数据拷贝到标注输出中。
    exit(0);
}

读缓冲区格式，并初始化其rio_readinitb函数。

#define RIO_BUFSIZE 8192
typedef struct {
    int rio_fd;                /* descriptor for this internal buf */
    int rio_cnt;               /* unread bytes in internal buf */
    char *rio_bufptr;          /* next unread byte in internal buf */
    char rio_buf[RIO_BUFSIZE]; /* internal buffer */
} rio_t;

void rio_readinitb(rio_t *rp, int fd) 
{
    rp->rio_fd = fd;  
    rp->rio_cnt = 0;  
    rp->rio_bufptr = rp->rio_buf;
}

RIO读程序的核心是rio_read函数

static ssize_t rio_read(rio_t *rp, char *usrbuf, size_t n)
{
    int cnt;

    while (rp->rio_cnt <= 0) {  /* 如果缓存区为空，调用read填满它 */
    rp->rio_cnt = read(rp->rio_fd, rp->rio_buf, 
               sizeof(rp->rio_buf));
    if (rp->rio_cnt < 0) {
        if (errno != EINTR) /* 出错返回-1*/
        return -1;
    }
    else if (rp->rio_cnt == 0)  /* EOF返回0 */
        return 0;
    else 
        rp->rio_bufptr = rp->rio_buf; /* reset buffer ptr */
    }

    /* 一旦缓存区非空，就从读缓存区拷贝n和rp->rio_cnt中较小值个字节到用户缓存区，并且返回拷贝的字节数 */
    cnt = n;          
    if (rp->rio_cnt < n)   
    cnt = rp->rio_cnt;
    memcpy(usrbuf, rp->rio_bufptr, cnt);
    rp->rio_bufptr += cnt;
    rp->rio_cnt -= cnt;
    return cnt;
}

rio_readnb函数

ssize_t rio_readnb(rio_t *rp, void *usrbuf, size_t n) 
{
    size_t nleft = n;
    ssize_t nread;
    char *bufp = usrbuf;
    
    while (nleft > 0) {
    if ((nread = rio_read(rp, bufp, nleft)) < 0) {
        if (errno == EINTR) 
        nread = 0;      /* 调用read填充 */
        else
        return -1;      /* 错误，返回-1 */ 
    } 
    else if (nread == 0)
        break;              /* EOF */
    nleft -= nread;
    bufp += nread;
    }
    return (n - nleft);         /* 返回成功传送的字节数*/
}

rio_readlineb函数

ssize_t rio_readlineb(rio_t *rp, void *usrbuf, size_t maxlen) 
{
    int n, rc;
    char c, *bufp = usrbuf;

    for (n = 1; n < maxlen; n++) { //最多是maxlen-1个
    if ((rc = rio_read(rp, &c, 1)) == 1) {
        *bufp++ = c;
        if (c == '\n')//找到换行符，就退出
        break;
    } else if (rc == 0) {
        if (n == 1)
        return 0; /* EOF,并且没有读到数据 */
        else
        break;    /* EOF,有数据，出现不足值 */
    } else
        return -1;    /* 错误，返回-1 */
    }
    *bufp = 0;
    return n;//返回成功传送的字节数
}

stat需要输入文件名，而fstat需要输入的是文件描述符。

在stat数据结构中需要注意的有两个变量，st_mode和st_size。

st_size：包含文件的字节数大小
st_mode：包编码文件访问许可位和文件类型。
许可位在Unix文件类型如下，有对应的宏指令，含义均为“是xx吗”，这些宏在sys/stat.h中定义：

类型	作用	函数
普通文件	二进制或文本文件（对内核没差）	S_ISREG()
目录文件	关于其他文件的信息	S_ISDIR()
套接字	通过网络与其他进程通信的文件	S_ISSOCK()

查询和处理一个文件的st_mode位：

#include "csapp.h"

int main (int argc, char **argv) 
{
    struct stat stat;
    char *type, *readok;

    Stat(argv[1], &stat);//文件选择argv[1]，写入一个stat数据结构
    if (S_ISREG(stat.st_mode))     /* 如果是一个文本文件 */
    type = "regular";
    else if (S_ISDIR(stat.st_mode))//如果是一个目录文件
    type = "directory";
    else 
    type = "other";
    if ((stat.st_mode & S_IRUSR)) /* 检查阅读权限 */
    readok = "yes";
    else
    readok = "no";

    printf("type: %s, read: %s\n", type, readok);
    exit(0);
}

I/O重定向

I/O重定向操作符命令：ls > foo.txt
使外壳加载和执行ls程序，并且将标准输出重定向到磁盘文件foo.txt。

I/O重定向函数： dup2

函数定义为：

#include <unistd.h>

int dup2(int oldfd, int newfd);
返回值：成功返回描述符，错误返回-1

这个函数执行的操作是，拷贝描述符表表项oldfd，覆盖描述表表项newfd，如果后者被打开，则在拷贝前关闭它。

标准I/O

标准I/O库：

ANSI C定义了一组高级输入输出函数，称为标准I/O库，包含:

fopen、fclose，打开和关闭文件

fread、fwrite，读和写字节

fgets、fputs，读和写字符串

scanf、printf，复杂的格式化的I/O函数

流——类型为FILE的流是对文件描述符和流缓冲区的抽象

标准I/O库将一个打开的文件模型化为一个流。

每个ANSI C程序开始的时候都有三个打开的流：stdin、stdout、stderr，对应于标准输入、标准输出和标准错误，定义如下：

#include <stdio.h>

extern FILE *stdin;
extern FILE *stdout;
extern FILE *stderr;

套接字

网络套接字上最好不要使用标准I/O函数，而是使用RIO函数，原因：

如果没有清楚缓存区，输入函数后面不能接输出函数，输出函数后面也不能接输入函数，而对套接字使用lseek是非法的，打开两个流有很麻烦，所以！在网络套接字上不要使用标准I/O函数来进行输入和输出！

错误处理
附录A中主要讲了这本书中的错误处理方式，有一个方法——错误处理包装函数，这个思想很有意思，相当于给基本函数再套上一层皮，然后run这个皮，发现了错误就终止，完全正确的话就跟没有这层皮一样。

错误处理风格

（1）Unix风格

遇到错误后返回-1，并且将全局变量errno设置为指明错误原因的错误代码；

如果成功完成，就返回有用的结果。

（2）Posix风格

返回0表示成功，返回非0表示失败；

有用的结果在传进来的函数参数中。

（3）DNS风格

有两个函数，gethostbyname和gethostbyaddr，失败时返回NULL指针，并设置全局变量h_errno。

（4）错误报告函数

void unix_error(char *msg) /* unix-style error */
{
    fprintf(stderr, "%s: %s\n", msg, strerror(errno));
    exit(0);
}
/* $end unixerror */

void posix_error(int code, char *msg) /* posix-style error */
{
    fprintf(stderr, "%s: %s\n", msg, strerror(code));
    exit(0);
}

void dns_error(char *msg) /* dns-style error */
{
    fprintf(stderr, "%s: DNS error %d\n", msg, h_errno);
    exit(0);
}

void app_error(char *msg) /* application error */
{
    fprintf(stderr, "%s\n", msg);
    exit(0);
}

2.错误处理包装函数

Unix风格

成功时返回void，返回错误时包装函数打印一条信息，然后退出。

void Kill(pid_t pid, int signum) 
{
    int rc;

    if ((rc = kill(pid, signum)) < 0)
    unix_error("Kill error");
}

Posix风格

成功时返回void，错误返回码中不会包含有用的结果。

void Pthread_detach(pthread_t tid) {
    int rc;

    if ((rc = pthread_detach(tid)) != 0)
    posix_error(rc, "Pthread_detach error");
}

DNS风格

struct hostent *Gethostbyname(const char *name) 
{
    struct hostent *p;

    if ((p = gethostbyname(name)) == NULL)
    dns_error("Gethostbyname error");
    return p;
}

本章习题

- 运行结果：
- 运行结果：
- 运行结果：
调用dup2(5,0)/dup2(5,STDIN_FILENO)
- 运行结果：

代码托管

学习进度条

	代码行数（新增/累积）	博客量（新增/累积）	学习时间（新增/累积）
目标	5000行	30篇	400小时
第一周	0/0	1/1	10/10
第二周	63/63	1/2	8/18
第三周	31/94	1/3	18/36
第四周	265/329	1/4	17/53
第五周	106/435	2/6	18/71
第六周	211/646	2/8	21/92
第七周	1420/2066	2/10	17/109
第八周	1061/3127	1/11	17/126
第九周	1458/4585	3/14	20/146
第十周	1410/5995	1/15	20/166
第十一周	779/6774	2/17	18/184
第十三周	326/7100	2/19	20/204

尝试一下记录「计划学习时间」和「实际学习时间」，到期末看看能不能改进自己的计划能力。这个工作学习中很重要，也很有用。
耗时估计的公式
：Y=X+X/N ，Y=X-X/N，训练次数多了，X、Y就接近了。

参考：软件工程软件的估计为什么这么难，软件工程估计方法

计划学习时间:20小时
实际学习时间:20小时

参考资料

《深入理解计算机系统V3》学习指导

posted @ 2017-12-17 22:30 20155330 阅读(143) 评论(0) 收藏举报

刷新页面返回顶部

20155330

2017-2018-1 20155330 《信息安全系统设计基础》第13周学习总结

2017-2018-1 20155330 《信息安全系统设计基础》第13周学习总结

教材学习内容总结

Unix I/O

打开和关闭文件

读和写文件

用RIO包健壮的读写

I/O重定向

标准I/O

套接字

本章习题

代码托管

学习进度条

参考资料

公告