管道/命名管道

匿名管道:

概述:

用于Unix系列系统。单向数据通道,写端写的数据在被读端读取之前会被操作系统缓存。双向管道需要通过创建两个单向管道实现

之所以是匿名的。是因为匿名管道不存在于文件系统中,随着使用它的进程结束而结束,没有名称。没有特别指明的话,管道指匿名管道。

管道为多个文件创建了临时的直接连接,这使得整合起来的管道整体性能比各个程序分别运行要高。这种直接连接使得程序可以同时运行,并且允许数据直接在它们之间连续的传输而不必将数据传到临时文件中或是显示器上然后等待前一个程序执行完后一个才可以执行。如果写入程序写的快于读取程序,写入程序就会被阻塞并等待数据被读取;相反的,读取程序就会被阻塞等待数据被写入(如果设置为阻塞读写的话)。

文件描述符:当打开文件之后,系统会为其维护一个描述文件的实体,相应的,这个实体会有一个整数作为其描述符,通过这个整数就可以访问这个文件描述实体。所以在通过文件描述符使用文件的功能中,可以通过改变文件描述符实际指向的内容来实现输入输出流的改变。使用fopen()返回的文件结构体struct FILE(即struct _IO_FILE)中的_fileno字段表示文件描述符。文件描述符0/1/2分别为标准输入输出错误流,所以新打开的文件会从3开始使用并随着打开的文件增长

在程序中使用管道

Unix系列系统通过pipe()函数创建新的管道。包含在头文件unistd.h中。原型:int pipe(int filedes[2]);

返回值:成功返回0,失败返回-1

参数:一个2个元素的文件描述符数组,成功创建的话,函数将在其中分别放置读端(filedes[0])和写端(filedes[1])

read()向写端写,read()向读端读。参数为文件描述符、存放位置、读/写大小。默认情况下读取是阻塞的,只要有写端是打开的,就会一致阻塞地等待需要的数据

从管道中读取:

读取时

管道中

字节数(p)

至少有一个进程有打开的写端 没有进程有打开的写端
阻塞读 非阻塞读
至少一个写端进程在sleep 没有写端进程在sleep
p=0 如果管道不为空就从中取n字节数据然后返回n,否则等待直到有数据 阻塞等待直到有数据,然后获取数据并返回其大小 返回-EAGAIN 返回0
0<p<n 获取p字节然后返回p
p>=n 获取n个字节返回n,在管道中剩下(p-n)个字节

通常情况下,一个进程创建了管道之后会fork()一个子进程,并分别的在父子进程中进行读写。但是这样父子进程就会都有读端和写端,都可以进行读和写。在某些Unix系统中,管道实现为全双工模式。但是POSIX标准规定只能是单工模式,一个进程只能使用一个文件描述符。Linux遵循了POSIX规范,但是没有强制要求进程一定要关闭不用的一端,而是将这项工作留给了开发者

原子写:

遵循POSIX协议的系统,单次写只要写入的字节数没有超过PIPE_BUF的限制,写操作就是是原子的。默认情况下,如果管道中没有足够的空间保存写入的数据(这次写入的<=PIPE_BUF,但总和>PIPE_BUF),写操作就会被阻塞直到有足够的空间。此外,如果单次写入的字节数超过了PIPE_BUF就不能保证写是原子的

有两种方式获取PIPE_BUF的大小。POSIX要求每个PIPE_BUF至少需要512字节,Linux中是4096字节

  1. 包含头文件<limits.h>使用PIPE_BUF,但是如果头文件是过时的,就只能用下面的方法获取准确的值
  2. 调用fpathconf()获取一个打开的文件描述符的属性值。long fpathconf(int filedes, int name);返回指定的文件描述符的指定配置选项的值

管道的实际容量可能会比PIPE_BUF大,但是没有系统参数指明管道的总容量,可以用程序检测

关于阻塞I/O和管道:

如果write()向一个没有任何读进程连接的管道写数据,SIGPIPE信号量会被发送到写进程,默认的信号处理函数会直接终止进程。如果实现了自己的处理函数,在处理完SIGPIPE信号量之后,write()会返回-1,然后errno被设置为EPIPE

在有其他进程向管道写的时候,如果唯一的读进程关闭了读端,所有的写进程都会执行上一条规则

只要有写端没有关闭,读端就会一直阻塞地等待

向满的管道(现有数据加上需要写入的数据量)写数据会阻塞写进程直到有足够的可用空间

和读文件不同的是,从管道读数据之后数据就不再存在在管道中。所以即便有多个读进程从同一个管道读也不会有任何两个进程读到相同的数据

只要管道中的字节数不超过PIPE_BUF,写就是原子的

进程不能对管道执行seek()(复位读写文件的偏移位置)

popen()/pclose():

包含在头文件stdio.h中,封装好了一部分创建管道的操作

FILE *popen(const char *command, const char *type);会创建一个管道,然后fork一个子进程,子进程为command指定的程序。type可以是"w"或"r",如果是"r",该函数会返回一个管道的读端,该管道的写端会连到command对应的子进程标准输出流。如果是"w",会返回一个管道的写端,该管道的读端会连到command对应子进程的标准输入流。

int pclose(FILE *stream);用popen()打开的文件指针只能用此函数关闭

命令行层面的管道:

基础:

标准流重定向(stdin/stdout/stderr)

  • Stdin(0):在执行程序的时候,可以在命令后面使用"<"操作符来指定标准输入文件。重定向或者管道的数据是匿名的,接收程序无法得知数据来源
  • Stdout(1):在执行程序的命令后面使用">"操作符来指定标准输出文件。">>"命令在已有的文件后面增量的添加内容,只使用">"会覆盖已存在文件的内容。值得注意的是,当重定向或使用管道的时候,实际存放的数据总是一致的,但是在输出到屏幕上的时候可能会有些许的不同。因为显示屏的宽是已知的,而重定向的位置是未知的。所以重定向的时候最安全的方式是一个元素一行,而在屏幕上可能是所有的字符串在一行
  • Stderr(2):默认情况下重定向的流是标准I/O流,想要重定向ERROR输出流,需要指定。这三个输出流有三个数字与之对应,在">"操作符之前加上数字2就可以重定向stderr流。如果想要将stderr和stdout重定向到同一个文件,可以先把stderr重定向到stdout,然后将stdout重定向到文件。2>&1,通过在数字前面加"&"指明这是个流而不是文件名

Error流:默认情况下,管道中的所有程序的error流会合并在一起并发送到console中。但是许多的shell都有其他的语法来控制这个流程,比如csh shell使用"|&"代替"|"来指定标准错误流需要和标准输出流合并然后重定向到下一个程序

用程序模拟shell命令">":

命令:ls > list,ls命令是将当前文件夹下的文件列表输出到显示器上,此命令将输出重定向到list文件

shell执行的指令:

  1. Fork()一个子进程
  2. 在子进程中close()文件描述符1(标准输出的文件描述符)
  3. 在子进程中open()文件list(和O_CREAT标志一起)
  4. 子进程exec()命令ls

以上过程能够实现重定向的原因:Fork的子进程在关闭标准输出的时候,其对应的文件描述符1就被释放,之后使用open()命令打开文件list,list就会使用可用的文件描述符1。子进程再执行ls命令的时候,ls仍会去寻找文件描述符1,因为默认情况下它就代表的是标准输出,但是实际上指向的是文件list,所以就会输出到list。与此同时,shell主进程的标准输入输出仍保持未改变

用程序模拟shell命令"|":

需要采取某种方式将管道一端连接到前一个程序的标准输出,管道的另一端连接到后一个的标准输入

系统调用dup()和系统调用dup2():dup2可以代替dup

dup():int dup(int oldfd)

Dup()复制文件描述符指向的内容,在成功调用之后,新旧文件描述符可以通用。它们指向相同打开的文件描述实体,所以即便文件发生了改变,新旧文件描述符都会引用新的文件

但是dup的问题是,它返回的是最小的可用文件描述符。那么一个进程如果关闭了标准输出,然后dup了管道的写端,标准输出的文件描述符就会被使用作为写端的拷贝,所以在进程想要执行标准输出的时候,就会输出到管道的写端

实现的方式:父进程P创建子进程C,需要实现父进程的标准输出向子进程的标准输入写数据,需要创建管道,写端连到父进程的标准输出,读端连到子进程的标准输入。

父进程:关闭stdout和fd[0],此时此进程中最小的文件描述符就是stdout,dup(fd[1]),那么此时标准输出就和fd[1]一致,向标准输出写就相当于向fd[0]写

子进程:关闭stdin和fd[1],此时此进程中最小的文件描述符就是stdin,dup(fd[0]),那么此时标准输入就和fd[0]一致,从标准输入读就相当于向fd[1]读

问题:

父进程不会等待子进程,因为父进程用execlp()取代了它自己。避免这种情况的方式是创建两个子进程分别用于读/写

将标准输入输出连接到管道是分为两步的,这两步之间有间隔,所以可能在进程关闭了标准输入输出后在将管道连到其上之前有一个信号量到来,其处理函数关闭了一个文件描述符,那么之后dup()返回的文件描述符就会是刚刚关闭的,而不是标准输入输出

程序:

switch(fork()){
    case -1:{
        printf("Error:cannot fork a process.\n");
        return -1;
    }
    case 0:{
        close(fd[0]);
        dup2(fd[1],fileno(stdout));
        close(fd[1]);
        close(fd[1]);
        return 1;
    }
    default:{
        close(fd[1]);
        dup2(fd[0],fileno(stdin));
        close(fd[0]);
        fgets(message,27,stdin);
        return 2;
    }
}

int dup2(int oldfd, int newfd);

因为dup()存在的问题,dup2()被创建。

将oldfd的内容拷贝到newfd中,如果newfd之前是打开的,会先关闭再拷贝。整个操作是原子的

程序:

switch(fork()){
    case -1:{
        perror("Failed to fork:");
        exit(3);
    }
    case 0:{/* parent process */
        close(fd[0]);/* close read end */
        dup2(fd[1],fileno(stdout));/* set stdout as write end */
        close(fd[1]);/* close useless copy of write end */
        if(execlp(argv[1],argv[1],NULL) == -1)
            perror("Failed to execute parameter1:\n");
        exit(4);
    }
    default:{/* child process */
        close(fd[1]);/* close write end */
        dup2(fd[0],fileno(stdin));/* set stdin as read end */
        close(fd[0]);/* close useless copy of read end */
        if(execlp(argv[2],argv[2],NULL) == -1)
            perror("Failed to execute parameter2:\n");
        exit(5);
    }
}

命名管道:

匿名管道的缺点:

  1. 管道只能在有共同祖先的进程之间使用,比如父子进程
  2. 管道会随着使用管道的进程结束而结束,所以每次使用的时候都要创建

二者的异同:

  1. 在打开、关闭、读、写方面,命名管道和匿名管道的操作是相同的
  2. 命名管道的存在形式是文件系统中的目录入口,所以相关的有访问权限和所有者
  3. 命名管道可以在不相关的进程之间使用
  4. 命名管道可以在shell层面或是程序层面进程删除和创建

命令层中的命名管道:

Mknod:此命令用于创建设备特殊文件,所以也可以用于创建管道

需要注意的是,创建特殊文件要在Linux文件系统中才可以,不能在微软的文件系统下。

使用方式:mknod filename p

filename是想要创建的命名管道名,p告知mknod命令创建的是一个命名管道

之后其他的程序执行的时候就可以通过访问这个文件来使用管道了

Mkfifo

Mkfifo [option]… NAME,创建名称为NAME的命名管道,如果有多个NAME,就会分别创建对应的命名管道

在程序中使用命名管道

可以使用系统调用mknod()或是库函数mkfifo()。但是在mknod()的Linux手册中说明此命令不能用于创建目录,如果想要创建目录应该使用mkdir(2)创建目录,用mkfifo(3)创建管道。所以我们将使用mdfifo()来创建管道,相比于mknod(),mkfifo()还有一个优点是不用超级用户权限

使用时需要头文件sys/types.h和sys/stat/h,int mkfifo(const char *pathname, mode_t mode);。按照惯例,命名管道名称使用大写字母

Public FIFO和private FIFO:没有特定的函数使一个FIFO成为public的,public的含义是创建的管道名被广而告之,client程序都可以访问它。而private是指创建的管道只会被其创建进程以及特定的被告知管道名的进程可以使用

 

posted @ 2018-12-14 10:28  biaoJM  阅读(1111)  评论(0编辑  收藏  举报