Linux系统编程之匿名管道
1.进程间通信介绍
1.1 进程通信的基本概念
在之前我们已经学习过进程地址空间。Linux 环境下,进程地址空间相互独立,每个进程各自有不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到,所以进程和进程之间不能相互访问,要交换数据必须通过内核,在内核中开辟一块缓冲区,进程1把数据从用户空间拷到内核缓冲区,进程2再从内核缓冲区把数据读走,内核提供的这种机制称为进程间通信(IPC,Inter Process Communication)。
1.2 为什么要进程间通信
进程通信主要有以下目的:
- 数据传输:一个进程需要将它的数据发送给另一个进程。
- 资源共享:多个进程之间共享同样的资源。
- 通知事件:一个进程需要向另一个或一组进程发送消息,通知它(它们)发生了某种事件(如进程终止时要通知父进程)。
- 进程控制:有些进程希望完全控制另一个进程的执行(如Debug进程),此时控制进程希望能够拦截另一个进程的所有陷入和异常,并能够及时知道它的状态改变。
1.3 常见的进程通信方式
在进程间完成数据传递需要借助操作系统提供特殊的方法,如今常见的进程间通信方式有:
① 管道 (分为匿名管道与命名管道)
② 信号 (开销最小)
③ 共享内存
2.管道
2.1管道简介
管道是Unix中最古老的进程间通信方式,我们把从一个进程连接到另一个进程的数据流叫做管道。
在Linux中,| 符号被用来代表管道。因为在Linux中,不同的命令,如ps,ls,grep等命令的本质都是可执行程序,| 前面的命令前面的命令通常会输出大量的结果,这些结果将会交由 | 后面的命令继续处理。
如下面这个命令就是将ps axj中含有PID的结果输出:
2.2 管道的创建和应用
管道的本质是内核中一块供不同进程进行读写的缓冲区,而外在的操作形式是通过文件读写的方式进行。
#include <unistd.h>
功能:创建一无名管道
原型
int pipe(int fd[2]);
参数
fd:文件描述符数组,这是一个输出型参数,调用该接口后,将会给fd[2]数组分配两个文件描述符,两个文件描述符分别对应管道的读写两端。其中fd[0]表示读端, fd[1]表示写端
返回值:成功返回0,失败返回错误代码
我们先用一个简单的例子来看一下管道的创建:
#include<iostream>
#include<unistd.h>
int main()
{
int fd[2];
int ret=pipe(fd);
if(-1==ret)
{
std::cout<<"管道创建失败!"<<std::endl;
}
std::cout<<"fd[0]:"<<fd[0]<<std::endl<<"fd[1]:"<<fd[1]<<std::endl;
return 0;
}
运行后:
可以看到,此时fd[0]和fd[1]返回了两个文件描述符。这两个文件描述符分别分别对应管道的读写两端。
#include<string.h>
#include<unistd.h>
#include<sys/wait.h>
#include<sys/stat.h>
#include<stdlib.h>
#include <sys/types.h>
#include <fcntl.h>
int main()
{
int fd[2];
pipe(fd);
pid_t pid = fork();
if(pid < 0)
{
printf("fork error!");
}else if(pid == 0)
{
//child
close(fd[0]);
char str[100];
while(1)
{
printf("child:");
fgets(str, 100, stdin);
ssize_t len = strlen(str);
if(write(fd[1], str, len) != len)
{
perror("write to pipe");
exit(1);
}
memset(str, 0, len);
sleep(1);
}
}
//father
int count = 0;
close(fd[1]);
while(count < 10)
{
char str[100];
ssize_t s = read(fd[0], str, 100);
if(s < 0){
perror("read from pipe");
break;
}else{
printf("father:%s", str);
}
memset(str, 0, strlen(str));
}
return 0;
}
上面这段代码实现了子进程写入管道,父进程读出的过程。
2.3 管道的底层机制
管道是在有血缘关系的进程之间来通信的,如父子进程,兄弟进程等。因此,应用匿名管道时一定会有fork函数的参与。
如下面这个简化图可以看到,
-
父进程先使用pipe函数创建管道,得到两个文件描述符 fd[0]、fd[1]指向管道的读端和写端。
-
父进程调用fork创建子进程,此时父子进程有相同的struct files_struct,父子进程指向的struct file又指向了同一片文件缓冲区。(注意:这个表述并不严谨,我们下面马上就会讲到)
-
接下来父进程关闭写端,子进程关闭读端,就可以实现子进程向管道中写,父进程读。注意:管道的通信是单向的!!!!
在 Linux 中,管道的实现并没有使用专门的数据结构,而是借助了文件系统的file结构和VFS的索引节点inode。通过将两个 file struct指向同一个临时的 inode,而这个 VFS 索引节点又指向一个物理页面而实现的。
如上图所示,有两个 file 数据结构,但它们定义文件操作例程地址是不同的,其中一个是向管道中写入数据的例程地址,而另一个是从管道中读出数据的例程地址。
这样,用户程序的系统调用仍然是通常的文件操作,而内核却利用这种抽象机制实现了管道这一特殊操作。看待管道,就如同看待文件一样!管道的使用和文件一致,迎合了“Linux一切皆文件思想”。
2.4 管道读写规则
用阻塞的方式打开管道(即默认情况下)
-
如果所有管道写端对应的文件描述符被关闭(管道写端引用计数为 0),读端在将管道中剩余数据读取后,再次read会返回0。(写端关闭)
-
如果有指向管道写端的文件描述符没关闭,且持有管道写端的进程也没有向管道中写数据,这时有进程从管道读端读数据,那么管道中剩余的数据都被读取后,再次 read 会阻塞。(读完不写)
-
如果所有指向管道读端的文件描述符都关闭了(管道读端引用计数为 0),进行write操作会产生信号SIGPIPE,进而可能导致write进程退出。(读端关闭)
-
如果有指向管道读端的文件描述符没关闭(管道读端引用计数大于 0),且读端进程并没有向管道中读进程,则当写端进程写满后,会进入阻塞。(写满不读)
2.5 管道的特点
- 只能用于具有共同祖先的进程(具有亲缘关系的进程)之间进行通信。
- 管道提供流式服务。
- 管道的生命周期随进程,进程退出,管道释放。
- 内核会对管道操作进行同步与互斥。
- 管道是半双工的,数据只能向一个方向流动;需要双方通信时,需要建立起两个管道
- 管道大小为65536 byte