【网络通信教程】windows 下的 socket API 编程（TCP协议）

0w0

准备（以 winsock2 为例）

简单说一些概念

服务端简介
客户端简介

着手实现

服务端实现
客户端实现
谈一谈阻塞
通过 select () 实现非阻塞的服务端及客户端

感谢

准备（以 winsock2 为例）

winsock2 即 windows socket 2，2 是版本号，对应的还有 winsock

常用函数

WSAStartup ()

int WSAStartup(WORD wVersionRequested, LPWSADATA lpWSAData);

WSACleanup ()

int WSACleanup(void);

socket ()

SOCKET socket(int af, int type, int protocol);

bind ()

int bind(SOCKET s, const struct sockaddr * name, int namelen);

listen ()

int listen(SOCKET s, int backlog);

connect ()

int connect(SOCKET s, const struct sockaddr * name, int namelen);

accept ()

SOCKET accept(SOCKET s, struct sockaddr * addr, int * addrlen);

recv ()

int recv(SOCKET s, char * buf, int len, int flags);

send ()

int send(SOCKET s, const char * buf, int len, int flags);

closesocket ()

int closesocket(SOCKET s);

WSAGetLastError ()

int WSAGetLastError(void);

select ()

int select(int nfds, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, const struct timeval * timeout);

大概就是这些了。
还有一些高级的用法没有罗列，因为我还没有研究到那里，不过这些已经完全足够了。

简单说一些概念

你也许根本就没有接触过 socket ，那么在刚刚看了上面这么多奇怪的数据类型，和不知其所云的函数名称，可能有些难以理解。
　　不要慌，听我慢慢解释。
　　
　　首先，看标题最后括号里写的三个字母，以下所有内容均基于 TCP 协议。
　　
　　TCP 是什么？ → 戳我看百科(度娘是个好东西)
　　TCP 常常和 UDP 一起出现，这是两种不同的网络通信协议。
　　一般来说，我们认为，TCP 相较于 UDP 更可靠一些。
　　
　　什么是通信协议？
　　其实我们不必知道，因为他已经被封装在了 ws2_32.lib 里面，对于调用者来说，我们不必知道被封装的函数具体的实现方法，我们关心的是更高层的调用逻辑。
　　如果非要深究，简单来说，通信协议就是 socket 的实现方法。
　　
　　对于 TCP 协议，我们需要操作的抽象对象有两个，一个被称为 服务端 ，另一个被称为 客户端 ，是不是非常熟悉呢？

服务端简介

服务端需要负责什么？
作为一个正直的服务端，就应该堂堂正正地出现在客户端们的眼前。所以，服务端应该知道自己到底在哪里。就像一个商铺，客户端要来主动找我们，然后我们才能为它们提供服务。
也就是说，服务端需要知晓自己的 IP地址 和端口，如此客户端才能朝着我们连接（connect ()）。

对服务端来说，未连接的客户端应该是不可见的。

客户端简介

客户端需要负责什么？
客户端不必知道自己从哪里来，因为根本没人关心。我们关心的是客户端要去哪，把数据交给谁。
　　所以，客户端需要知晓服务器的 IP地址 和端口

对客户端来说，服务端应该像太阳一样站在中间，向所有人敞开怀抱，每个客户端都应该知晓服务端的位置。

着手实现

服务端实现

我方才说了，TCP 协议的 socket 需要我们操作两个对象，那么怎么算对象呢？
　　是的，不管是服务端还是客户端，我们从始至终都需要操作一个被称为 socket 描述符的东西，他就像是一个句柄。
　　如果你足够认真，就会发现，很多函数都需要一个被称为 SOCKET 类型的参数。
　　
　　听起来很神秘，实际上就是一个整数而已：

typedef unsigned long long SOCKET;

这个东西在同一时间对于同一主机是唯一的，他是 socket 底层逻辑用来识别不同主机的标志。（客户端和服务端统称为“主机”）
　　抽象一下，当两个主机在网络上通信时，数据的入口和出口就是 socket 描述符。
　　
　　那么，迈向 windows 网络通信的第一只脚是什么呢？
　　
　　好吧，跟我们料想的并不一样，不是获取一个 socket 描述符。
　　再等等，让我们先完成最初的步骤。
　　
　　第一个需要调用的函数应该是 WSAStartup ()。
　　在 windows 下，WSAStartup 必须是应用程序或 DLL 调用的第一个 Windows Sockets 函数。
　　我把 WSAStartup() 放在常用函数的第一位就是因为这个，我们首先需要调用他。
　　很简单，就把它安安静静的放在开头就好了。

我们看一下他的定义及参数：

int WSAStartup(WORD wVersionRequested, LPWSADATA lpWSAData);
参数1：windows socket 的版本号。
参数2：指向WSADATA数据结构的指针，用来接收Windows Sockets 实现的细节。
（第二个参数看起来好像很高端，实际上根本没什么用）

对于第一个参数，我们需要使用一个宏，这个宏定义于“winsock2.h”中：

#define MAKEWORD(a, b)      ((WORD)(((BYTE)(((DWORD_PTR)(a)) & 0xff)) | ((WORD)((BYTE)(((DWORD_PTR)(b)) & 0xff))) << 8))

而对于第二个看起来很高端，实则没吊用的参数，我们就按照他的要求给他传个指针好了：

WSADATA wsadata;
WSAStartup(MAKEWORD(2, 2), &wsadata);

为了在应用程序当中调用任何一个Winsock API函数，首先第一件事情就是必须通过WSAStartup函数完成对Winsock服务的初始化，因此需要调用WSAStartup函数。使用Socket的程序在使用Socket之前必须调用WSAStartup函数。该函数的第一个参数指明程序请求使用的Socket版本，其中高位字节指明副版本、低位字节指明主版本；操作系统利用第二个参数返回请求的Socket的版本信息。当一个应用程序调用WSAStartup函数时，操作系统根据请求的Socket版本来搜索相应的Socket库，然后绑定找到的Socket库到该应用程序中。以后应用程序就可以调用所请求的Socket库中的其它Socket函数了。——baidu

下面就正式开始第一步了

获取 socket 描述符
这一步很简单,仅仅需要简单地调用 socket () 即可

函数定义及参数：

SOCKET socket(int af, int type, int protocol);
参数1：一个地址描述，即地址类型，我们选择 IPv4
参数2：指定socket类型，我们选择流式套接字
参数3：指定socket所用的协议，当然是 TCP 协议了

第一个参数填常量 AF_INET ，即使用 IPv4 进行通信。
第二个参数填常量 SOCK_STREAM，流式套接字。
第三个参数填 IPPROTO_TCP，选用 TCP 协议。

这一步，我们的代码这样写就可以了：

SOCKET server_sock;
server_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

若 socket () 返回 -1 则表示出现错误。

让我们的服务器像太阳一样发光
我们已经获得了进行网络通信的入口了，现在需要通过 bind () 把我们的地址绑定在我们的入口上，好让客户找到我们。

函数定义及参数：

int bind(SOCKET s, const struct sockaddr * name, int namelen);
参数1：socket 描述符
参数2：一个结构体，包含服务端的 IP 地址及端口信息
参数3：第二个参数的长度

第一个参数填我们刚刚得到的 socket 描述符。
第二个参数需要传一个结构体，

我们先看一下这个结构体的定义：

struct sockaddr {
    unsigned short sa_family;
    CHAR sa_data[14];
};

第一个成员“sa_family”是地址描述，即填我们刚刚在 socket() 函数中传入的第一个参数 AF_INET 即可。
第二个参数就稍微麻烦点了，他包含有 IP 地址及端口信息。

为了处理这个麻烦的结构，“winsock2.h”中还定义了一个更加清晰的结构：

struct sockaddr_in {
    short   sin_family;
    unsigned short sin_port;
    struct in_addr sin_addr;
    unsigned short sin_zero[8];
};

第一个成员仍然是地址描述。
第二个成员是端口信息。
第三个成员是一个结构体，包含 IP 地址。
用这个数据结构可以轻松处理 socket 地址的相关信息。

给出对这个结构体赋值的例子：

struct sockaddr_in socket_addr;

socket_addr.sin_family = AF_INET;
socket_addr.sin_addr.S_un.S_addr = inet_addr(ip);
socket_addr.sin_port = htons(port);

这里用到了两个新函数，而且你也可能会有一些疑问，这里给出详细解释。
当然，你也可以不用深究，直接跳过此段。

//////////////////////////////////////////////////////////////////////////////////////////

第一个疑问，对于结构体 struct sockaddr_in，我为什么没有解释第四个成员“sin_zero[8]”是干什么的？

它本身没有意义，仅用来与第一个结构体 struct sockaddr 保持等长。
　　有什么用呢？
　　他可以让一个指向第一个结构体的指针直接指向第二个结构体，上面说过了，这是一个并列的结构，它们互相兼容。
例如：

bind(..., (struct sockaddr*) &(socket_addr),...);

第二个疑问，我们用到了两个新函数 inet_addr () 及 htons ()，为什么我们的 IP 地址和端口需要通过这两个函数进行处理呢？

这里需要讲到 “网络字节顺序” 和 “主机字节顺序”

网络字节顺序（NBO）：网络数据在传输中的规定的数据格式，从高到低位顺序存储，即低字节存储在高地址，高字节存储在低地址；即“大端模式”。网络字节顺序可以避免不同主机字节顺序的差异。

主机字节顺序（HBO）：与机器CPU相关，数据的存储顺序由CPU决定。

用大白话说，当我们在通过网络传输数据时，需要将 “主机字节顺序” 转换到 “网络字节顺序” ，而 htons () 函数就是用来做这种事情的，还有 inet_addr () 则是将 “十进制点分ip” 转换为一个符合结构体格式的整数，而其转换后即为 “网络字节顺序”。

什么是 “十进制点分ip？
　　就是 IP 地址的字符串而已。
　　
　　非常方便，不是吗？

还有更多：
inet_addr() 将十进制点分ip 转换为网络字节顺序
inet_ntoa() 将网络字节顺序转换为十进制点分ip

htons() 将 short 主机字节顺序转换为网络字节顺序
ntohs() 将 short 网络字节顺序转换为主机字节顺序

ntohl（）将 long 主机字节顺序转换为网络字节顺序
htonl（）将 long 网络字节顺序转换为主机字节顺序

//////////////////////////////////////////////////////////////////////////////////////////

疑问已经解释完了，继续进行我们的教程
现在，我们结构体已经赋值完毕了，
在这一步，我们的代码看起来应该是这样子的：

struct sockaddr_in socket_addr;

socket_addr.sin_family = AF_INET;
socket_addr.sin_addr.S_un.S_addr = inet_addr(ip);
socket_addr.sin_port = htons(port);

bind(server_sock, (struct sockaddr*) &(socket_addr),sizeof(struct sockaddr));

同样，若 bind () 返回 -1 则表示出现错误。

监听端口
我们的服务器已经张开双臂准备迎接客户连接了，这时候我们需要调用 listen ()，对我们刚才对结构体赋值的时候填上去的端口进行监听。
首先说明白，这个函数的意义是开始监听，开始监听后该函数将直接返回，而不是监听直到用户进入。

int listen(SOCKET s, int backlog);
参数1：socket 描述符
参数2：进入队列中允许的连接数目

参数一填服务端的 socket 的描述符即可。
参数二是什么意思呢？进入队列即在你调用 accept() 同意客户接入之前的客户等待队列。
同一时间可能有很多客户端请求连接，若超出了服务端的处理速度，进入队列会很长，那么多于你定义的队列长度的客户就会被 socket底层直接忽略掉。

那么很简单，这一步的代码：

listen(server_sock, 2）//第二个参数随意填咯

还是那样，返回 -1 代表出错。

接受客户的连接请求
我们几乎要成功了！
现在我们要用 accept () 来接受用户的连接请求。
该函数将会阻塞，直到客户请求连接后才返回，返回值为客户在本机的 socket 描述符。这个返回值很重要，在以后发送数据和接收数据时均需要对此描述符进行操作。

SOCKET accept(SOCKET s,struct sockaddr * addr, int * addrlen);
参数1：socket 描述符
参数2：客户的 ip 地址及端口信息结构体指针
参数3：第二个参数的长度的指针

第一个参数还是填服务端的 socket 描述符
第二个参数需要声明一个新的 struct sockaddr，作为客户的地址信息，然后把指针传进去
第三个参数需要传有第二个参数的长度的指针…emmmmm…至于为啥要指针，咱也不知道，咱也不敢问，反正人家让传，咱们传就是了…

这一步的代码：

int size_addr = sizeofstruct sockaddr();
SOCKET client_sock;
struct sockaddr client_addr;

client_sock = accept(server_sock, &(sock_temp.socket_addr), &size_addr);

如果出现错误，该函数返回值仍为 -1

发送数据
终于到这里了，好兴奋啊！
我们已经接受了客户的连接请求，双方已经能够清晰的看到对方了。那么我们开始交流吧！
这一步，我们需要使用的函数是 send ()

int send(SOCKET s, const char * buf, int len, int flags);
参数1：客户的 socket 描述符
参数2：发送的字符串
参数3：字符串的最大长度
参数4：一般置 0

第一个参数就传由 accept() 返回的客户 socket 描述符，想对谁发送数据，就填他的 socket
第二个参数就是我们想要发送的字符串数据，这里一定保证有效数据的末尾有结束标志‘\0’
第三个参数为我们字符串的最大长度，一般填缓冲区数组长度 - 1,有效保证结尾存在‘\0’
这一步的代码：

char * buf[1024] = {0};
scanf("%s"，&buf);
send(client_sock, buf, 1023, 0);

重复收发数据时，一般我们会先调用 memset() 将缓冲区置0
像这样：

memset(buf, 0, 1024);
scanf("%s"，&buf);
send(client_sock, buf, 1023, 0);

让我们来听听客户端的声音
我们既然可以向客户端发送数据，那么，客户端也就可以向我们发送数据。
这里需要调用 recv (),它的作用是从 socket 底层的接收缓冲区中 copy 一定长度的字节，需要注意的是，只有数据到达后才会返回，否则会处于阻塞状态。
而若接收缓冲区中存在数据，即客户在你调用它之前已经发送给数据，那么该函数将立即返回。
（数据的接收由 socket 的底层逻辑完成，recv () 仅用于 copy 数据）

int recv(SOCKET s, char * buf, int len, int flags);
参数1：客户的 socket 描述符
参数2：接收数据的缓冲区（与上文的“接收缓冲区”不同），即一个指向足够大小字符数组的指针
参数3：想要接收数据的最大长度
参数4：一般置0

与 send () 非常相似，代码如下：

memset(buf, 0, 1024);
recv(client_sock, buf, 1023, 0);

到这里基本上就结束了，非常简单。

客户端实现

接下来我再说说客户端，
　　客户端的实现与服务端非常相似，而且还简单许多，这是因为需要客户端做的事情真的非常少，我们只需要连接上服务器即可，很多事情都不是客户端需要关心的。
　　经过对服务端的学习，现在你应该可以猜到了，我们只需要获得一个 socket 描述符，然后连接服务器即可。

获取 socket 描述符

不多说，代码一样：

SOCKET client_sock;
client_sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

连接服务器
使用 connect () 来连接服务端：

函数定义及参数：（与 bind () 极其相似，几乎是一个模子刻出来的）

int connect(SOCKET s, const struct sockaddr * name, int namelen);
参数1：socket 描述符
参数2：一个结构体，包含服务端的 IP 地址及端口信息
参数3：第二个参数的长度

如果对细节不太理解，可以回去看一下 bind () 小节的内容。

代码：

struct sockaddr_in socket_addr;

socket_addr.sin_family = AF_INET;
socket_addr.sin_addr.S_un.S_addr = inet_addr(ip);
socket_addr.sin_port = htons(port);

connect(client_sock, (struct sockaddr*) &(socket_addr),sizeof(struct sockaddr));

这里需要注意的是：当我们连接上服务端后，connect () 并不会返回一个新的 socket 描述符作为服务端在本机的化身，而是继续使用我们在开始时定义的 client_sock。

使用 recv () 和 send () 收发数据，用法与服务端相同，不再赘述。

现在我们已经可以运用 TCP 协议自由地收发数据了！

谈一谈阻塞

你可能已经注意到了，尽管这样简单地实现了网络通信确实令人兴奋，但我们这样的服务端及客户端的功能也实在有限。
　　阻塞，大白话说，就是卡在那。
　　就像服务端的 accept() ，他会在那里等待着，直到用户连接才返回。若我们想要在等待连接的同时去接收数据，那么以上的知识确实捉襟见肘。
　　实际上，这里并非说 accept () 函数是阻塞性质的函数，而是说，我们的 socket 描述符是阻塞性质的描述符。
　　在 windows 下，任何创建出来的（包括 accept () 返回的）socket 描述符都被默认为阻塞模式，如果不想这样，我们可以调用 ioctlsocket () 函数来设置某个 socket 描述符为非阻塞模式，这样，我们在调用 accept () 时，它会立即返回，如果没有什么意外，会返回一个非负值以示调用成功。
　　不过我不想讲非阻塞模式下的 socket API 编程，要实现他会很麻烦，而且需要有一定技巧，同时也会浪费很多系统资源。
　　最重要的是：我还没有研究过他（逃）
　　
那么，要完成非阻塞的网络通信，难道就没有其他方法了吗？

通过 select () 实现非阻塞的服务端及客户端

别急，我们还有最后一个函数 select () 没讲呢！
　　距离成功还剩下最后一步！

int select(int nfds, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, const struct timeval * timeout);

select () 是干嘛用的？
顾名思义，他会选择出一个东西来。

选择什么呢？
选择出当前可读写或异常的描述符来。

该函数用于监视文件描述符的变化情况——读写或是异常。——baidu

我们先来解释一下它的参数：

int select(int nfds, fd_set * readfds, fd_set * writefds, fd_set * exceptfds, const struct timeval * timeout);
参数1：最大的文件描述符加1
参数2：欲检查可读性的文件描述符集合
参数3：欲检查可写性的文件描述符集合
参数4：欲检查带外数据的文件描述符集合
参数5：一个指向 timeval 结构的指针

emmm…说实话，我第一次看见它的时候也想跳过，不过实际上它真的很简单，听我慢慢解释！

第一个参数，什么？什么最大文件描述符加1？
如果你不理解的话，就不用理解了，因为他在 windows 下只是为了保持兼容性而存在，你往里填什么都行。
第二、三、四个参数是一种东西，我统一来解释。
他要求传入一个 fd_set 类型的数据，我们可以把它抽象为一个集合，在 socket 的范围里，这个集合里包含有我们想要添加进去的 socket 描述符。
如果你想让 select () 监视一个 socket 描述符，那么就把它添加进这个集合中即可。

如何添加？
　　实际上，fd_set 是一个结构体。
　　事情好像变得麻烦了起来吗？
　　并没有，我们不必去关注它的实现细节，因为它已经被前辈们贴心地定义为了四个宏。

FD_SET(int fd, fd_set * set)// - 添加fd到集合
FD_CLR(int fd, fd_set * set) //- 从集合中移去fd
FD_ISSET(int fd, fd_set * set)// - 测试fd是否在集合中
FD_ZERO(fd_set * set) //- 清除一个文件描述符集合

具体定义可以在 “winsock2.h” 中找到。

第五个参数也很简单，一个指向结构体 timeval 的指针。
这是其定义：

struct timeval {
        long    tv_sec;         /* seconds */
        long    tv_usec;        /* and microseconds */
};

它用来表示一个时间长度，第一个成员是秒数，第二个成员是微秒数（居然是微秒！），两者加起来就是我们要表示的时间长度。
　　传入 select () 后，此数据结构即代表 select () 的超时时间。
　　若将此结构全部置 0 ，select () 将立即返回。
　　若此参数传入 NULL ，则 select () 将永远等待，直到下一个文件描述符可读写时返回。

我们该如何运用 select () ？
　　当 select () 监视的某个文件描述符可读写时将会立即返回，并更改文件描述符集合使其仅留下可读写的文件描述符。然后我们便可以根据上述宏的其中之一来判断到底是谁可读写。

FD_ISSET(int fd, fd_set * set)// - 测试fd是否在集合中

要注意的是，我们需要保存文件描述符集合的初始状态，并在下一次调用 select () 前为传入的文件描述符集合重新赋值。
　　因为每次返回时，传入的文件描述符集合已经被修改，所以我们要保证在下一次调用 select () 前，传入的文件描述符集合里面确实存在我们需要监视的 socket 描述符。

代码大概是这样的：

...仅演示 select () 的一般用法...之前的代码省略...
typedef struct socket_state {
	SOCKET socket;
	SOCKADDR_IN socket_addr;
}Client_state, Server_state;//方便处理客户信息

while (1)
	{
		select(0, &temp_REDfd, NULL, NULL, &timv);
		
		//1. 首先判断 server 的 listen 
		if (FD_ISSET(server.socket, &temp_REDfd))
		{//client 请求连接
			...
			...调用 accept () 处理连接请求
			...
			FD_SET(s_client[arr_size].socket, &source_REDfd);//添加到主描述符集合
		}

		//2. 再判断各 client 是否可读 
		for (int i = 0; i <= arr_size; i++)
		{
			if (FD_ISSET(s_client[i].socket, &temp_REDfd))
			{
				...
				...调用 recv () 接收数据
				...
			}
		}
		temp_REDfd = source_REDfd;//复原集合
	}

动手写一写，你会发现它很简单。

另外，我写了一套 socket 接口，
其中包含两个主要接口，可以方便地创建一个服务端及客户端，并提供了数个回调函数。

我上传在了 CSDN 上：
https://download.csdn.net/download/qq_16181837/12027371

压缩文件中包含：
1.静态库
2.源文件
3.头文件
4.服务端和客户端的 demo

感谢

感谢这篇 blog 的作者，讲解地非常系统，非常全面。
如果你想对 socket 继续深究，大可读一下这篇文章。
http://blog.sina.com.cn/s/blog_79b01f66010163q3.html

posted @ 2019-12-04 01:52 高厉害阅读(1090) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部