基本的TCP socket API
socket()函数
为了执行网络I/O,一个进程必须做的第一件事情就是调用socket函数,指定期望的通信协议类型(使用IPv4的TCP、使用IPv6的UDP、Unix域字节流协议等)。
# include <sys/socket.h>
int socket(int familiy, int type, int protocol);
其中family参数指明协议族,它是下表中所示的某个常值。该参数也往往被称为协议域。
family | 说明 |
---|---|
AF_INET | IPv4协议 |
AF_INET6 | IPv6协议 |
AF_LOCAL | Unix域协议 |
AF_ROUTE | 路由套接字 |
AF_KEY | 密匙套接字 |
type参数指明套接字类型,它是下表中所示的某个常值。
type | 说明 |
---|---|
SOCK_STREAM | 字节流套接字 |
SOCK_DGRAM | 数据报套接字 |
SOCK_SEQPACKET | 有序分组套接字 |
SOCK_RAW | 原始套接字 |
protocol参数应设为下表所示的某个协议类型常值,或者设为0,以选择所给定famiy和type组合的系统默认值。
protocol | 说明 |
---|---|
IPPROTO_CP | TCP传输协议 |
IPPROTO_UDP | UDP传输协议 |
IPPROTO_SCTP | SCTP传输协议 |
并非所有套接字family与tpe的组合都是有效的,图4-5给出了一些有效的组合和对应的真正协议。其中标为"是"的项也是有效的,但还没有找到便捷的缩略词。而空白项则是无效组合。
socket函数在成功时返回一个小的非负整数值,它与文件描述符类似,我们把它称为套接字描述符(socket descriptor),简称sockfd。
为了得到这个套接字描述符,我们只是指定了协议族(IPv4、IPv6或Unix)和套接字类型(字节流、数据报或原始套接字)。我们并没有指定本地协议地址或远程协议地址。
connect()函数
TCP客户用connect函数来建立与TCP服务器的连接。
# include <sys/socket.h>
int connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen);
sockfd是由socket函数返回的套接字描述符,第二个、第三个参数分别是一个指向套接字地址结构的指针和该结构的大小。套接字地址结构必须含有服务器的IP地址和端口号。
客户在调用函数connect前不必非得调用bind函数(我们在下一节介绍该函数),因为如果需要的话,内核会确定源IP地址,并选择一个临时端口作为源端口。
bind()函数
bind函数把一个本地协议地址赋予一个套接字。对于网际协议,协议地址是32位的IPv4地址或128位的IPv6地址与16位的TCP或UDP端口号的组合。
# include <sys/socket.h>
int bind(int sockfd, const struct sockaddr *myaddr, socklen_t addrlen);
第二个参数是一个指向特定于协议的地址结构的指针,第三个参数是该地址结构的长度。
对于TCP,调用bind函数可以指定一个端口号,或指定一个IP地址,也可以两者都指定,还可以都不指定。
listen()函数
listen函数仅由TCP服务器调用,它做两件事情。
- 当socket函数创建一个套接字时,它被假设为一个主动套接字,也就是说,它是一个将调connect发起连接的客户套接字。listen函数把一个未连接的套接字转换成一个被动套接字,指示内核应接受指向该套接字的连接请求。调用listen导致套接字从CLOSED状态转换到LISTEN状态。
- 本函数的第二个参数规定了内核应该为相应套接字排队的最大连接个数。
# include <sys/socket.h>
int listen(int sockfd, int backlog);
本函数通常应该在调用socket和bind这两个函数之后,并在调用accept函数之前调用。为了理解其中的backlog参数,我们必须认识到内核为任何一个给定的监听套接字维护两个队列∶
- 未完成连接队列(incomplete connection queue),每个这样的SYN分节对应其中一项:已由某个客户发出并到达服务器,而服务器正在等待完成相应的TCP三路握手过程。这些套接字处于SYN_RCVD状态。
- 已完成连接队列(completedconnectionqueue),每个已完成TCP三路握手过程的客户对应其中一项。这些套接字处于ESTABLISHED状态。
backlog:相应socket可以排队的最大连接个数 。
accept()函数
accept函数由TCP服务器调用,用于从已完成连接队列队头返回下一个已完成连接。如果已完成连接队列为空,那么进程被投入睡眠(假定套接字为默认的阻塞方式)。
# include <sys/socket.h>
int accept(int sockfd, struct sockaddr *cliaddr, socklen_t *addrlen);
参数cliaddr和adrlen用来返回已连接的对端进程(客户)的协议地址。
addrlen是值-结果参数:调用前,我们将由*addrlen所引用的整数值置为由cliaddt所指的套接字地址结构的长度,返回时,该整数值即为由内核存放在该套接字地址结构内的确切字节数。
如果accept成功,那么其返回值是由内核自动生成的一个全新描述符,代表与所返回客户的TCP连接。
在讨论accept函数时,我们称它的第一个参数为监听套接字(listeningsocket)描述符(由socket创建,随后用作bind和listen的第一个参数的描述符),称它的返回值为已连接套接字(connected socket)描述符。
区分这两个套接字非常重要。一个服务器通常仅仅创建一个监听套接字,它在该服务器的生命期内一直存在。内核为每个由服务器进程接受的客户连接创建一个已连接套接字(也就是说对于它的TCP三路握手过程已经完成)。
当服务器完成对某个给定客户的服务时,相应的已连接套接字就被关闭。
本函数最多返回三个值:一个既可能是新套接字描述符也可能是出错指示的整数、客户进程的协议地址(由cliaddr指针所指)以及该地址的大小(由adarlen指针所指)。如果我们对返回客户协议地址不感兴趣,那么可以把cliaddr和addrlen均置为空指针。
已连接套接字每次都在循环中关闭,但监听套接字在服务器的整个有效期内都保持开放。accept的第二和第三个参数通常都是空指针,因为我们对客户的身份不感兴趣。
close()函数
用来关闭套接字,并终TCP连接。
# include <sys/socket.h>
int close(int sockfd);
close一个TCP套接字的默认行为是把该套接字标记成已关闭,然后立即返回到调用进程。