Socket进程通信机制及应用

      Socket通常称为“套接字”,用于描述IP地址和端口,是一个通信链的句柄。应用程序通过套接字向网络发出请求或者应答网络请求。Socket即不是一个程序,也不是一个协议,其只是操作系统提供的通信层的一组抽象的API。

      由于Socket是开放的、透明的,一旦运行,任何操作Socket的语言都可以访问这个开放的服务。可以是Java、PHP、C、Python等任何提供SocketAPI的语言访问此服务。
提示Socket是一种服务,与其实现语言无关。基于这个性质,我们能实现不同服务之间、不同语言之间的互联互通。
 
 
进程通信相关概念
      进程难的概念最初来源于单机系统。由于每个进程都在自己的地址范围内运行,为保证两个相互通信的进程之间既互相不替干扰双协调一致工作,操作系统为进程通信提供了相应设施,如UNIX BSD中的管道(pipe)、命名管道(named pipe)和软件中断信号(signal),以及UNIX System V的消息(message)、共享存储区(shared memory)和信号量(semaphore)等,但这些都仅限于用在本机进程之间的通信。网间进程通信要解决的是不同主机进程间的相互通信问题(可把同机通信看作是其中的特例)。为此,首先要解决的是网间进程标识问题。同一主机上,不同进程可用唯一进程号(Process ID)标识。
      网络环境下,各主机独立分配的进程号不能唯一标识该进程。例如,主机A赋予某进程号5,在B机中也可以存在5号进程,因此,“5号进程”就没有意义了。
     操作系统支持的网络协议众多,不同协议的工作方式不同,地址格式也不同。因此,网间进程通信还要解决多重协议的识别问题。
     为了解决上述问题,TCP/IP协议引入了下列概念。
 
1.端口
网络中可以被命名和寻址的通信端口,是操作系统可分配的一种资源。
按照OSI七层协议的描述,传输层与网络层在功能上的最大区别就是传输层提供进程通信能力。从这个意义上讲,网络通信的最终地址就不仅仅是主机地址了,还包括可以描述进程的某种标识符。为此,TCP/IP协议提出了协议端口(Protocal Port,简称端口)的概念,用于标识通信的进程。
 
      端口是一种抽象的软件结构(包括一些数据结构和I/O缓冲区)。应用程序(即进程)通过系统调用与某调用与某端口建立连接(binding)后,传输层传给该端口的数据都被相应的进程所接收,相应进程发给传输层的数据都通过该端口输出。在TCP/IP协议的实现中,操作商品类似于一般的I/O操作,进程获取一个端口,相当于获取本地唯一的I/O文件,可以用一般的读写原语访问。
      类似于文件描述符,每个端口都有一个端口号,都是整形标识符,用于区别不同端口。由于TCP/IP传输层的TCP协议和UDP协议是完全独立两个软件模块,因此各自的端口号也相互独立,如TCP有一个255端口,UDP也有一个255端口,二者并不冲突。TCP与UDP段结构中端口的地址都是16比特,有0~65535个端口号。
      对于这65535个端口号有以下使用规定:
      端口号小于256的定义为常用端口,服务器一般都是通过常用端口号识别。任何TCP/IP实现所提供的服务都用1~1023之间的端口号,这是由IANA管理的。
      客户端中需保证该端口号在本机上是唯一的。客户端口号因存在时间很短暂,又称为临时端口号。
      大多数TCP/IP实现给临时商品号分配1024~5000之间的端口号。大于5000的端口号为其他服务器预留的。
      常见的端口有FTP的21号端口,HTTP服务的80号端口,SMTP的25端口等。
 
2.地址
网络地址中通信的两个进程分别处在不同的机器上。遵循以下原则:
某台主机可与多个网络相连,必须指定一个特定网络地址。
网络上每台主机都应有其唯一的地址。
每台主机的每个进程应有在该主机的唯一标识符。
通常主机地址由网络ID和主机ID组成,在TCP/IP协议中用32位整数值表示;TCP和UDP均使用16位端口号标识用户进程。
 
3.连接
两个进程间的通信链路称为连接。连接表现为一些缓冲区和一组协议机制。
 
 
 
Socket函数原型
      Socket就是一种通信机制,类似于银行、电信这些部分的电话客服部门。打电话时,对方会分配一个坐席(客服)代表回答你的问题,客服部分就相当于Socket的服务器端,你就相当于客户端。通话结束前,如果有人想找到和通话的坐席代表是不可能的,因为你们正在通信,客服部门的电话交换机也不会重复分配。
Socket函数的原型定义如下:
SOCKET socket(int af, int type, int protocl);
该函数共有三个参数:
af : 指定应用程序使用的通信协议的协议族,对于TCP/IP协议族该参数置AF_INET,对于UNIX可建立本地Socket。
type:指定创建的Socket类型。有三种可选项。
流套接字类型(SOCK_STREAM):最常见的类型,基于TCP协议。
数据报套接字类型(SOCK_DGRAM):即UDP数据报。
原始套接字类型(SOCK_RAW):在IP层对套接字进行编程,实际上就是在IP层构造自己的IP包,然后再把这个IP包发送出去。
protocal:指定应用程序所使用的通信协议。最常用的是TCP协议与UDP协议。
同样,可以把TCP/UDP传输过来的包抓取过来并进行分析。流套接字不能完成的任务,可以在原始套接字中得以实现。所有语言提供的Socket API都是按照这个原型设计的。
提示 Socket从传输模式上又分为端对端和点对点的连接,流套接字和数据报套接字都属于端对端的连接,因此需要绑定端口号。原原始套接字是基于IP协议的,属于点对点传输模式,是没有端口这个概念的。比如常用的监测网络命令ping命令,就是基于ICMP协议的,它不存在端口概念。
posted @ 2015-08-25 14:08  雪山飞猪  阅读(1322)  评论(0编辑  收藏  举报