进程间通信
原文链接:http://www.orlion.ga/1072/
每个进程各自有不同的用户地址空间,任何一个进程的全局变量在另一个进程中都看不到,所以进程之间交换数据必须通过内核,在内核中开辟一块缓冲区,进程1把数据从用户空间拷到内核缓冲区,进程2再从内核缓冲区中把数据读走,内核提供的这种机制称为进程间通信(IPC):
一、管道
管道是一种最基本的IPC机制,由pipe函数创建:
#include <unistd.h> int pipe(int filedes[2]);
调用pipe函数时在内核中开辟一块缓冲区(称为管道)用于通信,它有一个读端一个写端,然后通过filedes参数传出给用户程序两个文件描述符,filedes[0]指向管道的读端,filedes[1]指向管道的写端。所以在用户程序看来就像一个打开的文件,通过read(filedes[0]);或者write(filedes[1]);向这个文件读写数据其实是在读写内核缓冲区。pipe函数调用成功返回0,调用失败返回-1。
开启了管道之后可以按如下的步骤通信:
-
父进程调用pipe开辟管道,得到两个文件描述符指向管道的两端。
-
父进程调用fork创建子进程,那么子进程也有两个文件描述符指向同一管道。
-
父进程关闭管道读端,子进程关闭管道写端。父进程可以往管道里写,子进程可以从管道里读,管道使用环形队列实现的,数据从写端流入从读端流出,这样就实现了进程间通信。
例:
#include <stdlib.h> #include <unistd.h> #define MAXLINE 80 int main(void) { int n; int fd[2]; pid_t pid; char line[MAXLINE]; if (pipe(fd) < 0) { perror("pipe"); exit(1); } if ((pid = fork()) < 0) { perror("fork"); exit(1); } if (pid > 0) { /* parent */ close(fd[0]); write(fd[1], "hello world\n", 12); wait(NULL); } else { /* child */ close(fd[1]); n = read(fd[0], line, MAXLINE); write(STDOUT_FILENO, line, n); } return 0; }
使用管道有一些限制:
-
两个进程通过一个管道只能实现单向通信,比如上面的例子,父进程写子进程读,如果有时候也需要子进程写父进程读,牛必须另开一个管道。
-
管道的读写端通过打开的文件描述符来传递。因此要通信的两个进程必须从它们的公共祖先那里继承管道文件描述符。上面的例子是父进程把文件描述符传给子进程之后父子进程之间通信,也可以父进程fork两次,把文件描述符传给两个子进程,然后两个子进程之间通信,总之需要通过fork传递文件描述符使两个进程都能访问同一管道,他们才能通信。
使用管道需要注意一下4点(假设都是阻塞I/O操作,没有设置O_NONBLOCK标志):
-
如果所有指向管道写端的文件描述符都关闭了(管道写端的引用计数为0),而仍然有进程从管道的读端读数据,那么管道中剩余的数据都被读取后,再次read会返回0,就像读到文件末尾一样。
-
如果有指向管道写端的文件描述符没关闭(管道写端的引用计数大于0),而持有管道写端的进程也没有向管道中写数据,这时有进程从管道读数据,那么管道中剩余的数据都被读取后,再次read会阻塞,直到管道中有数据可读了才读取数据并返回。
-
如果所有指向管道读端的文件描述符都关闭了(关闭读端的引用计数等于0),这时有进程向管道的写端write,那么该进程会收到信号SIGPIPE,通常会导致进程异常终止。
-
如果有指向管道读端的文件描述符没关闭(管道读端的引用计数大于0),而持有管道读端的进程也没有从管道中读数据,这时有进程向管道写端写数据,那么在管道被写满时再次write会阻塞,直到管道中有了空位置才写入数据并返回。
二、其他IPC机制
进程间通信必须通过内核提供了通道,而且必须有一种方法在进程中标示内核提供的某个通道,上一节讲的管道是用打开的文件描述符来标示的。如果要互相通信的几个进程没有从公共祖先那里继承文件描述符就不能通信了。内核提供一条通道不是问题,问题是如何标识这条通道才能使各进程都可以访问它?文件系统中的路径名是全局的,各进程都可以访问,因此可以用文件系统中的路径名来标识一个IPC通道。
FIFO和Unix Domain Socket这两种IPC机制都是利用文件系统中的特殊文件来标识的,可以用mkfifo命令创建一个FIFO文件:
FIFO文件在磁盘上没有数据块,仅用来标识内核中的一条通道,各进程可以打开这个文件进行read/write,实际上是在读写内核通道(根本原因在于这个file结构体所指向的read、write函数和常规文件不一样),这样就实现了进程间通信。
Socket和FIFO的原理类似,也需要一个特殊的socket文件来标识内核中的通道,例如/var/run目录下有很多系统服务的socket文件,文件类型s表示socket,这些文件在磁盘上没有数据块。Unix Domail Socket是目前最广泛使用的IPC机制。
总结一下进程间通信的机制:
1.父进程通过fork可以将打开文件的描述符传递给子进程
2.子进程结束时,父进程调用wait可以得到子进程的终止信息
3.几个进程可以在文件系统中读写某个共享文件,也可以通过给文件加锁来实现进程间同步
4.进程之间互发信号,一般使用SIGUSR1和SIGUSR2实现用户自定义功能
5.管道
6.FIFO
7.mmap函数,几个进程可以映射同一内存区
8.SYS V IPC,以前的SYS V UNIX系统实现的IPC机制,包括消息队列、信号量和共享内存,现在已经基本废弃
9.UNIX Domain Socket,目前最广泛使用的IPC机制