代码改变世界

Linux 网络编程基础(一) ---------------客户端/服务器的简单实现

2011-04-18 09:32  Jason_Wang NUAA  阅读(6386)  评论(7编辑  收藏  举报

 

一、 Socket的基本知识

1. socket历史与功能

在80年代早期,加利福尼亚大学伯克利分校的一个研究组,将TCP/IP软件一直到UNIX操作系统上。作为实现该项目的一部分,他们设计了一种接口,应用程序可以通过这个接口方便的进行通信。这样做的结果是出现了插件接口(Barkeley Socket)。

image

图1. Socket层次

Socket实质上提供了进程通信的端点,进程通信之前,双方必须首先各自创建一个端点,否则是没有办法建立联系并相互通信的。

每一个Socket都一个半相关描述:

{协议, 本地地址, 本地端口}

完整的Socket的描述:

{协议, 本地地址, 本地端口, 远程地址, 远程端口}

2. Socket工作流程
l 服务器端

首先,服务器应用程序用系统调用socket()来创建一个socket,它是系统分配给该服务器进程的类似文件描述符的资源,不能与其他进程共享。

接下来,需要给socket绑定,本地socket绑定的是Linux文件系统中的文件名,一般放在/tmp或者/usr/tmp目录中。对于网络socket,要和客户连接的特定网络相关的服务标示符(端口号或者访问点)。可以使用系统调用bind()来绑定socket,然后服务器进程就用listen()创建一个队列将客户的连接存入队列,再使用accept()接收客户的连接。

服务器调用accept()时会创建一个和原有的socket不同的新socket。这个新socket只用于与这个特定的客户进行通信,而原socket保留下来继续处理来自其他客户的连接。

l 客户端

客户端是首先调用socket()创建一个未绑定的socket,然后将服务器的socket作为一个地址调用connect()与服务器建立连接。

image

图2 面向连接(TCP)的Socket工作流程

image

图3 UDP的socket工作流程

3. 套接字属性
l 套接字的域(domain)

AF_INET

互联网络

AF_UNIX

UNIX文件系统

AF_ISO

基于ISO标准协议的网络

AF_XNS

Xerox网络系统

l 套接字的类型(type)

套接字有三种类型:流式套接字(SOCK_STREAM),数据报套接字(SOCK_DGRAM)及原始套接字。

流式套接字(SOCK_STREAM)

流式的套接字可以提供可靠的、面向连接的通讯流。如果你通过流式套接字发送顺序的数据:“1”、“2”,那么数据到达的顺序也是“1”、“2”。流式套接字在AF_INET域中使用TCP协议来保证数据传输的正确性及顺序性。TCP是TCP/IP协议的前半部分,IP只处理网络路由。

数据报套接字(SOCK_DGRAM)

数据报协议定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证可靠,无差错。它使用UDP/IP协议。UDP将数据打包,贴上IP地址,然后发送。这个过程不需要建立连接。

原始套接字

原始套接字主要用于一些协议的开发,可以进行比较底层的操作。它功能强大,但是没有流式套接字和数据报套接字使用方便,一般的程序也不涉及到原始套接字。

4. 套接字地址

AF_INET与AF_UNIX域的套接字地址结构不相同,分别为struct sockaddr_in, struct sockaddr_un。

l AF_INET地址结构
#include <netinet/in.h>

struct sockaddr_in

{

short int sin_family; /* AF_INET */

unsigned short int sin_port; /* Port Numbers*/

struct in_addr sin_addr; /* Internet Address */

}

IP地址结构in_add定义为:

struct in_addr

{

unsigned long int s_addr; /* IP地址是四个字节的一个32位值 */

}
l AF_UNIX地址结构
#include <sys/un.h>

struct sockaddr_un

{

sa_family_t sun_family; /* AF_UNIX */

char sun_path[]; /* pathname */

}

在当前的Linux系统中,由X/Open规范定义的类型sa_family_t在头文件sys/un.h中声明,它是短整数类型。另外sun_path指定的路径名长度也是有限制的(Linux规定的是108个字符)。

二、 转换函数

1. 主机字节序和网络字节序

因为每一个机器内部对变量的字节存储顺序不同(有的系统是高位在前,低位在后,有的系统是的低位在前,高位在后),而网络传输的字节序需要统一。所以,对于主机字节序和网络字节序不同的机器,就一定要对数据进行转换(例如IP地址的表示和端口号的表示)。如果主机字节序和网络字节序相同,也要调用转换函数,真正转换 还是不转换由系统函数自己决定。

转换函数:

#include <netinet/in.h>

unsigned long int htonl(unsigned long int hostlong); /* host to network long */

unsigned short int htons(unsinged short int hostshort); /* host to network short */

unsigned long int ntohl(unsigned long int netlong); /* network to host long */

unsigned short int ntohs(unsigned short int netshort); /* network to host short */

这些函数将16位和32位整数在主机字节序和标准的网络字节序之间进行转换。“h”代表主机“host”,“n”代表网络“network”,“l”代表“long”,“s”代表“short”。

三、 socket系统调用

1. 创建套接字socket()

socket()系统调用创建一个套接字并返回一个描述符,该描述符可以用来访问该套接字。

#include <sys/types.h>

#include <sys/socket.h>

int socket(int domain, int type, int protocol);

创建的套接字是一条通信线路的一个端点,domain参数指定协议族,type参数指定这个套接字的通信类型,protocol参数指定使用的协议。

最常用的套接字域是AF_UNIX和AF_INET,前者用于通过UNIX和Linux文件系统实现的本地套接字,后者用于UNIX网络套接字。AF_INET套接字可以用于通过包括互联网在内的TCP/IP网络进行通信的程序。

参数type指定这个socket的通信类型,protocol参数指定使用的协议。通信所需的协议一般是由socket类型来决定,通常不需要进行选择。只有当需要选择的时候,才会用到protocol参数。将protocol参数设置为0表示使用默认协议。

socket返回一个描述符,类似于文件描述符。这个描述符可以用于read(),write()等系统调用来连接另一个socket。

实例:创建socket,AF_INET,SOCK_STREAM。

server_sockfd = socket(AF_INET, SOCK_STREAM, 0);
2. 绑定socket

在调用socket()获得描述符之后,需要对该套接字进行绑定。AF_UNIX套接字会关联到一个文件系统的路径名,而AF_INET套接字会关联到一个IP端口号。

#include <sys/socket.h>

int bind(int socket, const struct sockaddr *address, size_t address_len);

bind将参数address中的地址分配给与文件描述符socket关联的未命名套接字。address_len传递地址结构体的长度。 地址的长度取决于地址的类型。bind系统调用需要将struct sockaddr_in或struct sockaddr_un指针转换成struct sockaddr *类型。

bind在调用成功时返回0, 失败是返回-1并设置errno。

EBADF

文件描述符无效

ENOTSOCK

文件描述符对应的不是一个socket

EINVAL

文件描述符对应的是一个已经绑定的socket

EADDRNOTAVAIL

地址不可用

EADDRINUSE

地址已经绑定了一个socket

表2 errno值

AF_UNIX还有一些错误代码

EACCESS

权限不足,不能创建文件系统中的路径名

ENOTDIR, ENAMETOOLONG

文件名不符合要求

表3 AF_UNIX部分errno值

实例:

bind(server_sockfd, (struct sockaddr *)&server_address, server_len);
3. 创建套接字队列

为了能够在套接字上接受进入的链接,服务器要建立一个队列来保存未处理的请求。

#include <sys/socket.h>

int listen(int socket, int backlog);

参数backlog设置队列中可以容纳的未处理连接的最大个数。超过这个数字后,剩下的连接会被拒绝。backlog常用值为5……

listen函数会在成功时返回0,失败时返回-1,错误代码包括EBADF,EINVAL和ENOTSOCK。

实例:

listen(server_sockfd, 5);
4. 接受连接

一旦服务器程序创建并绑定了socket之后,他就可以通过用accept()来等待客户建立对该socket的连接。

#inculde <sys/socket.h>

int accept(int socket, struct sockaddr *address, size_t *address_len);

accept只有当有客户程序尝试连接到由socket参数指定的socket上时才返回。accept将创建一个新socket来与该客户进行通信,将该socket描述符作为返回值。之后的读写动作都关联到该socket描述符上。

参数socket所关联的套接字必须首先已经被bind绑定,而且有listen为其分配连接队列。参数address表示客户的地址,如果不关心客户的地址值可设为空指针。

如果socket没有未处理的连接accept将阻塞直到队列中有未处理的连接。可以通过设置O_NONBLOCK来改变。实例:

int flags = fcntl(socket, F_GETFL, 0);

fcntl(socket, F_SETFL, O_NONBLOCK | flags);

发生错误时,accept会返回-1。

5. 请求连接

客户程序通过与服务器监听套接字之间绑定的方法连接到服务器。

#include <sys/socket.h>

int connect(int socket, const struct sockaddr *address, size_t address_len);

参数socket指定的套接字将连接到参数address指定的服务器的socket上。

成功时,connect返回0,失败返回-1。

如果连接不能立刻建立,connect将阻塞到超时时间,超过超时时间连接将被放弃,连接失败。

6. 关闭socket

可以通过close()来终止服务器与客户端的socket连接。

#include <unistd.h>

int close(int socket);
7. 发送数据send()

send()同样可以发送数据,与write()不同的是,send()只能用于socket数据的发送。

#include <sys/socket.h>

int send(int socket, const void *buff, int len, int flags)

参数中,buff指向要发送的数据,len为要发送数据的长度, flags一般为0。

成功时send返回发送的字节数,失败返回-1。

8. 接收数据recv()

与send()相同,recv()也只能用于socket的数据发送。

#include <sys/socket.h>

int recv(int socket, void *buf, int len, unsigned int flags)

buf指向存放接收数据的缓冲区,len为数据长度,flags一般为0。

成功时recv()返回接收的字节数,失败时返回-1。

9. 发送数据sendto()

sendto需要带上发送目的地的地址信息,可以用于UDP通讯的实现,TCP中也可以使用sendto()。

#include <sys/socket.h>

int sendto(int socket, const void *buff, int len, unsigned int flags, const struct sockaddr *addr_to, int addr_len)

buff指向要发送的数据,len为要发送的数据的长度,flags一般为0,addr_to携带发送目的IP的信息,addr_len是地址信息的长度。

成功时,sendto返回发送的字节数,失败返回-1。

10.接收数据recvfrom()

recvfrom()与sendto配套使用,实现数据的收发。

#include <sys/socket.h>

int recvfrom(int socket, const void *buff, int len, unsigned int flags, const struct sockaddr *addr_from, int addr_len)

buff指向接收数据的缓冲区,len为数据长度,flags一般为0, addr_from存放数据来源的IP地址,addr_len为地址信息的长度。

recvfrom成功时返回接收的字节数,失败返回-1。

四、 阻塞

connect(),recv()都是阻塞性函数,当需求的资源没有准备好的时候,调用函数的进程将进入休眠状态,这样就无法处理I/O多路复用的情况了。

解决这个问题的方法与普通的文件操作相同:使用fcntl()或者select()函数。相比较fcntl(),select()函数还可以设置等待时间,功能更为强大。

----<end>----