进程通信

  定义:进程通信是指进程之间的信息交换。

一、低级通信——进程之间的互斥和同步
信号量机制是有效的同步工具,但作为通信工具缺点如下:
(1)效率低(通信量少)
(2)通信对用户不透明(程序员实现,操作系统只提供共享存储器供代码操作)
二、高级进程通信
用户直接利用操作系统提供的一组通信命令,高效地传送大量数据的通信方式。
操作系统隐藏了进程通信的细节,对用户透明,减少了通信程序编制上的复杂性。

进程通信的类型


高级通信机制可归结为四大类

a.基于共享数据结构

诸进程公用某些数据结构,借以实现诸进程间的信息交换。
如生产消费问题,定义共享的数据结构:n个长度的有界缓冲区。
程序员:提供对公用数据结构的设置及对进程间同步的处理。
操作系统:提供共享存储器。
特点:复杂、低效率,还只适合传递相对少量的数据。


b.基于共享存储区

在存储器中划出了一块共享存储区,诸进程可通过对共享存储区中数据的读或写来实现通信。
进程通信前先向系统申请获得共享存储区中的一个分区,并指定该分区的关键字;
若系统已经分给了其他进程,则将该分区的描述符返回给申请者,申请者把获得的共享存储分区连接到本进程上;此后,便可像读、写普通存储器一样地读、写该公用存储分区。多进程借助该区通信。
②消息传递系统(发--收方式)
最广泛使用的一种,进程间的数据交换,以格式化的消息为单位。屏蔽底层复杂操作。
单机:操作系统底层编程中的消息传递系统调用;
计算机网络:消息称为报文。程序员直接利用系统提供的一组通信命令(原语)进行通信。(④客户机-服务器系统)
如socket编程,利用函数库的send、receive等命令即可实现网络通信
③管道通信(中间文件方式)
所谓“管道”,是指用于连接一读进程和一写进程以实现通信的一个共享文件,又名pipe文件。
向共享文件输入的写进程以字符流形式将大量的数据送入管道;而接收管道输出的读进程则从管道中接收(读)数据。
首创于UNIX系统。其管道机制需提供三方面的协调能力:互斥、同步、确定对方是否存在。
④Client-Server system
套接字(Socket)
一个套接字就是一个通信标识类型的数据结构,包含了通信目的的地址,端口号,传输层协议、进程所在的网络地址,以及针对C\S程序提供的不同系统调用(API函数)等。
系统中所有的连接都持有唯一的一对套接字及端口连接,从而方便地区分来自不同应用程序进程或网络连接的通信,确保通信双方间逻辑链路的唯一性。

远程过程调用(远程方法调用)
RPC 有很多正面的应用,比如网络文件系统NFS、Web Service等,也是网络安全中容易被攻击的技术。
Remote Procedure Call,远程过程调用。也就是说,调用过程代码并不是在调用者本地运行,而是要实现调用者与被调用者二地之间的连接与通信。
RPC的基本通信模型是基于Client/Server进程间相互通信模型的一种同步通信形式;它对Client提供了远程服务的过程抽象,其底层消息传递操作对Client是透明的。

RPC应用开发步骤
1.定义客户端、服务器端的通信协议(定义服务过程的名称、调用参数的数据类型、返回参数的数据类型、底层传输类型(UDP/TCP)等。2.开发客户端程序。3.开发服务器端程序。

对于RPC通信协议的生成,最简单的方法是利用协议编译工具:生成实现RPC协议的生成器rpcgen( C程序) ,Remotetea( java程序)。

2.消息传递通信的实现方法
1)直接通信方式
发送进程利用OS所提供的发送命令(原语),直接把消息发送给目标进程。此时,发送进程和接收进程都以显式方式提供对方的标识符。通常利用系统通信命令(原语):
Send(Receiver, message);
Receive(Sender, message);


2)间接通信方式
基于共享数据结构的实体用来暂存发送给目标进程的消息;接收进程则从该实体中,取出对方发送给自己的消息。通常把这种实体称为信箱。
消息在信箱中可以安全地保存,只允许核准的目标用户随时读取。既可实时通信,又可非实时通信。

系统为信箱通信提供原语:


1)信箱的创建和撤消
信箱名
权限属性
私用信箱
公用信箱
共享信箱
共享者名称

2)信箱消息的发送和接收
进程之间利用信箱进行通信时,必须使用共享信箱。
Send(mailbox, message);
Receive(mailbox, message);
3.消息传递系统的实现
单机和网络环境下的高级进程通信广泛采用“消息传递”方式,需要考虑的问题:
通信链路的建立
消息格式
同步方式

通信链路的建立


计算机网络环境下,用原语显式建立/拆除链路
单机系统只须利用系统原语,进程间链路由系统自动管理。
消息格式
单机系统,发送与接收进程在同一台机器,环境相同故格式简单;
网络环境下,受不同目标机器的环境和长距离信息传输等因素的影响,消息格式较复杂,消息常是“大头+正文”

同步方式(如何控制发送和接收的状态)
即考虑平时闲着,还是平时忙碌?
发送进程阻塞、接收进程阻塞(无缓冲紧密同步)
发送进程不阻塞、接收进程阻塞(服务器程序)
发送进程和接收进程均不阻塞(缓冲队列)


4.消息缓冲队列通信机制


美国Hansan提出,在RC 4000系统上实现。后被广泛应用于本地进程通信。
不需管理链路
定义简单数据结构(亦即消息格式)
实现发送和接收的操作原语
② 数据结构
即消息队列中的消息格式如何?
本机通信消息结构简单,如下:
type message buffer = record
sender; 发送者进程标识符
size; 消息长度
text; 消息正文
next; 指向下一消息缓冲区的指针
end
PCB中需要记录有关通信的信息项
type ProcessControlBlock =record

mq; 消息队列队首指针
mutex; 消息队列互斥信号量
sm; 消息队列资源信号量

end
③原语代码 发送原语:
procedure send(receiver, a)
begin
getbuf(a.size, i); 根据a.size申请缓冲区
i.sender :=a.sender; 将发送区a中的信息复制到 i
i.size :=a.size;
i.text :=a.text;
i.next :=0;
获取接收进程内部标识符
getid(PCB set, receiver, j);
insert(j.mq, i); 将消息缓冲区插入目标消息队列

end

接收原语
procedure receive(b)
begin
j:=internal name; j为接收进程内部标识符


remove(j.mq, i); 将消息队列中的第i个消息移出

b.sender :=i.sender;
b.size :=i.size; 将消息缓冲区i中的信息
b.text :=i.text; 复制到接收区b
end

认识线程


1.线程的引入


多道程序管理:追求效率的目的下实现“并发”
并发性与效率的讨论
有如下频繁操作:创建进程、撤销进程、进程切换
PCB信息,CPU环境的管理等付出不少时空开销,尤其在进程切换上。
所以并发程度不是随意设定的:
并发进程数量不宜过多,切换频率不宜过高。
限制并发程度问题所在:进程实体信息量大,对进程的管理操作越多,与运行时间的比值就越大,运行效率就低。
怎样进一步提高并发效率,节约时空开销?

以进程为单位分配资源
将进程划分为多个功能单位调度执行。


多线程系统中,同一个进程中的多个线程
共享进程资源
可并发执行


2.线程的属性


多线程OS中,一个进程包括多个线程,每个线程都是利用CPU的基本单位。
轻型实体:只需一点必不可少的、能保证独立运行的资源。(TCB)
独立调度和分派的基本单位:调度切换迅速且开销小。
可并发执行
共享进程资源:同进程中的线程可共享相同的进程地址空间、已打开文件、信号量机构等。


3.线程的信息


状态参数
标识符、运行状态、优先级、寄存器状态、堆栈、专有存储器、信号屏蔽等。
运行状态
执行、就绪、阻塞


4. 线程的创建和终止


在多线程OS中,应用程序启动时,通常只有一个线程(初始化线程)在执行,它根据需要再创建若干线程。
创建新线程
利用线程创建函数(或系统调用),提供相应参数。线程创建函数执行完后,返回一个线程标识符供以后使用。
线程被终止:
不立即释放资源,只有当进程中的其它线程执行分离函数后,资源才分离出来能被其它线程利用。
被终止而未释放资源的线程仍可被需要它的线程调用,使其重新恢复运行。
*多线程的应用
一个应用程序有多个任务或功能需要同时进行处理,就最适合多线程机制。
应用情况举例:
网络软件,需要同时进行用户界面响应、收数据、发数据。
网络下载工具:多线程下载的下载工具
*编程举例
多线程编程过程是类似的:
可用win32 API编写C风格程序
C的main既是规定了主线程的代码。启动程序时,系统根据main地址,启动主线程。
在主线程代码某处利用线程创建函数即可创建线程;给创建函数编写线程功能代码;
利用其他一系列函数使系统管理多个线程。
也可用封装好的类库,如JAVA,MFC

 

通信:
(一)本地机进程间通讯:        

   1)采用微软消息队列(Microsoft   Message   Queue,MSMQ);           

   2)采用内存映射文件;     

(二)网络中不同机器间数据通讯:   

         Winsock ;


5.多线程系统中的进程


进程只是用于分配系统资源
包括多个线程
不是执行实体,线程在进程范围内作为执行实体。
* 线程与进程的比较
调度:线程作为CPU调度的基本单位,而进程只作为其它资源分配单位。
并发性:进程之间可以并发,实质上是不同进程中的两个线程并发。一个进程的多个线程之间亦可并发。
拥有资源:进程间资源相互独立;同一进程的各线程间共享。某进程内的线程在其它进程不可见
系统开销:线程上下文切换在同进程环境下上下文切换要快得多。因为同进程内线程间共享内存地址和打开的文件资源;


6.线程的管理


同步和通信机制
1)互斥锁
比较简单的,控制线程互斥访问资源;
适用于高频度使用的关键共享数据和程序段;
unlock和lock两个锁操作原语;

2)条件变量
与互斥锁一起使用
锁保证互斥进入临界区,但利用条件变量使线程阻塞
注意不满足条件时,wait条件变量:
释放互斥锁
进程阻塞在条件变量指向队列中
被唤醒后要重新再设互斥锁

Lock mutex
check
while(R busy)
wait(condition varible)
R busy
Unlock mutex

3)信号量
私用信号量(private samephore)
用于同进程的线程间同步,数据结构存放在应用程序的地址空间。属于特定进程,OS感知不到其存在。
公用信号量(public samephore)
用于不同进程间或不同进程中线程的同步,数据结构由OS管理,存放在受保护的系统存储区。

互斥锁是为了上锁而优化的;条件变量是为了等待而优化的;信号灯即可用于上锁,也可用于等待,因而可能导致更多的开销和更高的复杂性。
三种机制适用逐渐复杂的同步情况


二、线程的实现方式


1.内核线程KST(kernel-level thread)
依赖于内核,利用系统调用由OS内核在内核空间完成创建、撤消、切换等线程工作。
时间片分配给线程,所以多线程的进程获得更多CPU时间。
KST优缺点
多处理器系统下可实现多线程并行
一个线程发起系统调用而阻塞,不会影响其它线程的运行
线程切换开销远小于进程切换
内核本身也采用多线程技术可提高系统执行速度和效率
BAD:
用户态运行线程,调度和管理线程则是内核态。模式的切换开销大。
2.用户线程ULT(user-level thread)
无须利用系统调用,不依赖于OS核心。进程利用线程库函数创建、同步、调度和管理控制用户线程。
调度由应用软件内部进行,通常采用非抢先式和更简单的规则,也无需用户态/核心态切换,速度比kst快。
ULT优缺点
用户线程的维护由应用进程完成;内核不了解用户线程的存在;线程切换不需要内核特权;
用户线程调度算法可针对应用优化;
多线程的实现与平台无关
一旦系统调用引起进程阻塞,则整个进程的所有线程都不能执行
以进程为单位分配cpu,所有在多处理器系统中没有优势

3.组合方式
内核支持多KST线程的管理,同时也允许用户应用程序级的线程管理。

*具体实现
内核支持的线程直接利用系统调用,线程控制很简单
给创建的新进程分配一个任务数据区PTDA,存放其线程的TCB
信息保存在内核空间中
操作TCB控制线程调度和切换,花费较小

用户级线程需借助某种形式的中间系统取得内核服务,用户程序复杂
运行时系统:管理和控制线程的函数/过程集合。
内核控制线程,轻型进程LWP

Runtime System
所有函数驻留在用户空间上
线程切换由切换过程实现,线程的CPU状态保存在自己的堆栈中,切换不需要转入内核态执行
根本上操作系统资源还是要由内核做。用户线程的所有要求给了运行时系统,由它通过相应的系统调用获得系统资源。
轻权进程(LightWeight Process)
每个轻权进程由一个单独的内核线程来支持。
用户级线程只要连接到一个LWP,就可使用系统调用(如文件读写时,先“捆绑(bound)”在一个LWP上)
永久捆绑:一个LWP固定被一个用户级线程占用,该LWP移到LWP池之外
临时捆绑:从LWP池中临时分配一个未被占用的LWP
在使用系统调用时,如果所有LWP已被其他用户级线程所占用(捆绑),则该线程阻塞直到有可用的LWP--例如6个用户级线程,而LWP池中有4个LWP
如果LWP执行系统调用时阻塞(如read()调用),则当前捆绑在LWP上的用户级线程也阻塞。