网络编程——完成端口
一、创建 I/O 完成端口对象
使用这种模型之前,首先要创建一个 I/O 完成端口对象,需要调用 CreateCompletionPort 函数HANDLE WINAPI CreateIoCompletionPort(
__in HANDLE FileHandle,
__in HANDLE ExistingCompletionPort,
__in ULONG_PTR CompletionKey,
__in DWORD NumberOfConcurrentThreads
);
要注意该函数有两个功能:
● 用于创建一个完成端口对象;HANDLECompletionPort = CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0, 0);
如果仅仅为了创建一个完成端口对象,需要特别注意的参数便是 NumberOfConcurrentThreads(并发线程的数量),它定义了在一个完成端口上,同时允许执行的线程数量。 理想情况下,我们希望每个处理器各自负责一个线程的运行,为完成端口提供服务,避免过于频繁的线程上下文切换。 若将该参数设为 0,表明系统内安装了多少个处理器,便允许同时运行多少个工作者线程!
● 将一个句柄同完成端口对象关联到一起。
CreateIoCompletionPort((HANDLE)sClient,CompletionPort, (DWORD)PerHandleData, 0);
参数解析:
其中第一个参数是句柄,可以是文件句柄、SOCKET句柄;
第二个就是我们上面创建出来的完成端口;
第三个参数很关键,叫做PerHandleData,对应于每个句柄的数据块。我们可以使用这个参数在后面取到与这个SOCKET对应的数据。
最后一个参数给0,意思就是根据CPU的个数,允许尽可能多的线程并发执行。
★1、工作者线程与完成端口
Q:成功创建一个完成端口后,便可开始将套接字句柄与其关联到一起。但在关联套接字之前,首先必须创建一个或多个“工作者线程”,以便在 I/O 请求投递给完成端口后,为完成端口提供服务。在这个时候,大家或许会觉得奇怪,到底应创建多少个线程,以便为完成端口提供服务呢?
需要说明一点,我们调用 CreateIoComletionPort 时指定的并发线程数量,与打算创建的工作者线程数量,它们不是同一回事。
CreateIoCompletionPort 函数的 NumberOfConcurrentThreads 参数明确指示操作系统在一个完成端口上,一次只允许 n 个工作者线程运行。假如在完成端口上创建的工作者线程数量超出 n 个,那么在同一时刻,也只允许n个线程运行。
Q:那么,为何实际创建的工作者线程数量有时要比 CreateIoCompletionPort 函数设定的多一些呢?这样做有必要吗?
假定我们的某个工作者线程调用了一个函数,比如 Sleep 或 WaitForSingleObject,线程此时就进入了暂停(锁定或挂起)状态,那么允许另一个线程代替它的位置。用个生活中的例子来比喻,足球比赛的人数是11人(正式队员),但是去比赛现场的还包括替补队员,这里的“正式队员”好比CreateIoComletionPort 时指定的并发线程数量N1,而创建工作线程N2往往比比N1多,多出来的线程就好比替补队员,但正式队员在场上受伤、累了、或者需要临时休息时,这时候替补队员就顶正式队员的位置,发挥作用。尽可能高效的利用CPU的时间片。
==========================================
一旦在完成端口上拥有足够多的工作者线程来为 I/O 请求提供服务,便可着手将套接字句柄同完成端口关联到一起。
这要求我们在一个现有的完成端口上,调用 CreateIoCompletionPort 函数,
同时为前三个参数— FileHandle,ExistingCompletionPort 和 CompletionKey—提供套接字的信息。
● FileHandle 参数指定一个要同完成端口关联在一起的套接字句柄;
● ExistingCompletionPort 参数指定的是一个现有的完成端口;
● CompletionKey(完成键)参数指定与某个套接字句柄关联在一起的“单句柄数据”,可将其作为指向一个数据结构的指针,
在此数据结构中,同时包含了套接字的句柄,以及与套接字有关的其他信息,如 IP 地址等。为完成端口提供服务的线程函数可通过这个参数,取得与套接字句柄有关的信息。
Q:使用完成端口模型来开发一个服务器程序,大概步骤是什么呢?
我们按照以下步骤进行:
1) 创建一个完成端口,最后参数指定CPU数量
2) 判断系统处理器数量;
3) 根据处理器数量创建工作者线程,处理完成I/O通知
4) 创建监听套接字,绑定,侦听,然后将监听socket和完成端口绑定,帮助我们进行监听工作。
5) 使用 accept 函数,接受客户端连接请求;
6) 创建一个数据结构,保存新连接的socket句柄和网络地址信息
7) 调用CreateIoCompletionPort函数,将从accept返回的新套接字句柄同完成端口关联到一起,
通过完成键(CompletionKey)参数,将单句柄数据结构传递给 CreateIoCompletionPort 函数;
8) 开始在已接受的连接上进行 I/O 操作,在此,我们希望通过重叠 I/O 机制,在新建的套接字上投递一个或多个异步 WSARecv 或 WSASend 请求。这些 I/O 请求完成后,一个工作者线程会为 I/O 请求提供服务,同时继续处理未来的其他 I/O 请求,稍后便会在步骤 3) 指定的工作者例程中,体验到这一点;
9)重复步骤 5) ~ 8),直至服务器中止。
代码如下:
HANDLE CompletionPort;
WSADATA wsd;
SYSTEM_INFO SystemInfo;
SOCKADDR_IN InternetAddr;
SOCKET Listen;
int i;
typedef struct _PER_HANDLE_DATA
{
SOCKET Socket;
SOCKADDR_STORAGE ClientAddr;
// Other information useful to be associated with the handle
} PER_HANDLE_DATA, * LPPER_HANDLE_DATA;
// Load Winsock
StartWinsock(MAKEWORD(2,2), &wsd);
// Step 1:
// 创建一个完成端口
CompletionPort = CreateIoCompletionPort(
INVALID_HANDLE_VALUE, NULL, 0, 0);
// Step 2:
// 判断系统内到底安装了多少个处理器
GetSystemInfo(&SystemInfo);
// Step 3:
// 根据处理器的数量创建工作者线程
for(i = 0; i < SystemInfo.dwNumberOfProcessors; i++)
{
HANDLE ThreadHandle;
// Create a server worker thread, and pass the
// completion port to the thread. NOTE: the
// ServerWorkerThread procedure is not defined
// in this listing.
ThreadHandle = CreateThread(NULL, 0,
ServerWorkerThread, CompletionPort,
0, NULL;
// Close the thread handle
CloseHandle(ThreadHandle);
}
// Step 4:
// 准备好一个监听套接字
Listen = WSASocket(AF_INET, SOCK_STREAM, 0, NULL, 0,
WSA_FLAG_OVERLAPPED);
InternetAddr.sin_family = AF_INET;
InternetAddr.sin_addr.s_addr = htonl(INADDR_ANY);
InternetAddr.sin_port = htons(9527);
bind(Listen, (PSOCKADDR) &InternetAddr,
sizeof(InternetAddr));
listen(Listen, 5);
while(TRUE)
{
PER_HANDLE_DATA *PerHandleData=NULL;
SOCKADDR_IN saRemote;
SOCKET Accept;
int RemoteLen;
RemoteLen = sizeof(saRemote);
// Step 5:
// 接受客户端的连接
Accept = WSAAccept(Listen, (SOCKADDR *)&saRemote,
&RemoteLen);
// Step 6:
// 创建一个数据结构,用于容纳“单句柄数据”
PerHandleData = (LPPER_HANDLE_DATA)GlobalAlloc(GPTR, sizeof(PER_HANDLE_DATA));
printf("Socket number %d connected\n", Accept);
PerHandleData->Socket = Accept;
memcpy(&PerHandleData->ClientAddr, &saRemote, RemoteLen);
// Step 7:
// 调用 CreateIoCompletionPort 函数,将从 accept 返回的新套接字句柄同完成端口关联到一起
CreateIoCompletionPort((HANDLE) Accept,
CompletionPort, (DWORD) PerHandleData, 0);
// Step 8:
// 开始在已接受的连接上进行 I/O 操作
WSARecv(...);
}
DWORD WINAPI ServerWorkerThread(LPVOID lpParam)
{
// The requirements for the worker thread will be
// discussed later.
return 0;
}
★2、完成端口和重叠 I/O(工作者线程要做的事情)
将套接字句柄与一个完成端口关联在一起后,便可投递发送与接收请求,开始对 I/O 请求的处理。
接下来,可开始依赖完成端口,来接收有关 I/O 操作完成情况的通知。
从本质上说,完成端口模型利用了 Win32 重叠 I/O 机制。在这种机制中,象 WSASend 和 WSARecv 这样的 WinsockAPI 调用会立即返回。
此时,需要由我们的应用程序负责在以后的某个时间,通过一个 OVERLAPPED 结构,来接收之前调用请求的结果。
在完成端口模型中,要想做到这一点,需要使用 GetQueuedCompletionStatus(获取排队完成状态)函数,
让一个或多个工作者线程在完成端口上等待 I/O 请求完成的通知。该函数的定义如下:
BOOL WINAPI GetQueuedCompletionStatus(
__in HANDLE CompletionPort,
__out LPDWORD lpNumberOfBytes,
__out PULONG_PTR lpCompletionKey,
__out LPOVERLAPPED* lpOverlapped,
__in DWORD dwMilliseconds
);
● CompletionPort 参数对应于要在上面等待的完成端口;
● lpNumberOfBytes 参数负责在完成了一次 I/O 操作后(如:WSASend 或 WSARecv),接收实际传输的字节数。
● lpCompletionKey 参数为原先传递给CreateIoCompletionPort 函数第三个参数“单句柄数据”,如我们早先所述,大家最好将套接字句柄保存在这个“键”(Key)中。
● lpOverlapped 参数用于接收完成 I/O 操作的重叠结果。这实际是一个相当重要的参数,因为可用它获取每个 I/O 操作的数据。
● dwMilliseconds 参数用于指定希望等待一个完成数据包在完成端口上出现的时间,即,超时时间。假如将其设为 INFINITE,会一直等待下去。
Q:“单句柄数据”和 “单 I/O 操作数据”到底是什么?怎么来理解他们?
工作者线程调用GetQueuedCompletionStatus 函数获取到 I/O 完成通知后,lpCompletionKey 和 lpOverlapped 参数中保存着返回的信息。
lpCompletionKey参数包含了“单句柄数据”,因为在一个套接字首次与完成端口关联到一起的时候,
那些数据便与一个特定的套接字句柄对应起来了。这些数据正是我们在调用 CreateIoCompletionPort 函数时候,通过 CompletionKey 参数传递的。
lpOverlapped 包含“单IO操作数据”。例如每次的WSARecv/WSASend等等。例如我们自己定义一个结构体:
将 OVERLAPPED 结构作为新结构的第一个元素使用,自己如果还有需要的话,则在OVERLAPPED 结构的后面添加即可。
Q:调用函数时传递的是指向OVERLAPPED 结构的指针,返回其在内存中的地址,而这个地址也就是我们定义的这个结构体的地址,然后我们就可以使用这个结构体了。
typedef struct
{
OVERLAPPED Overlapped;
WSABUF DataBuf;
char szBuffer[DATA_BUF_SIZE];
int OperationType;
} PER_IO_OPERATION_DATA;
该结构演示了通常与 I/O 操作关联的一些重要的数据元素,比如刚才完成的那个 I/O 操作的类型(发送或接收请求),用 OperationType 字段表示,已完成 I/O 操作数据的缓冲区 szBuffer 也是非常有用的。如果想调用一个 Winsock API 函数(如:WSASend、WSARecv),要为其分配一个 OVERLAPPED 结构,
这时,就可以将我们的结构强制转换成一个 OVERLAPPED 指针,或者从结构中将 OVERLAPPED 元素的地址取出来。如下例所示:
PER_IO_OPERATION_DATA PerIoData;
//可以这样调用:
WSARecv(socket, ..., (OVERLAPPED *)&PerIoData);
//也可以这样调用:
WSARecv(socket, ..., &(PerIoData.Overlapped));
在工作线程的后面部分,等 GetQueuedCompletionStatus 函数返回了一个重叠结构(和完成键)后,便可通过 OperationType 成员,看出到底是哪个操作投递到了这个句柄之上。
DWORD WINAPI ServerWorkerThread(LPVOID CompletionPortID)
{
HANDLE CompletionPort = (HANDLE) CompletionPortID;
DWORD BytesTransferred;
LPOVERLAPPED Overlapped;
LPPER_HANDLE_DATA PerHandleData;
LPPER_IO_DATA PerIoData;
DWORD SendBytes, RecvBytes;
DWORD Flags;
while(TRUE)
{
// Wait for I/O to complete on any socket
// associated with the completion port
ret = GetQueuedCompletionStatus(CompletionPort,
&BytesTransferred,(LPDWORD)&PerHandleData,
(LPOVERLAPPED *) &PerIoData, INFINITE);
// First check to see if an error has occurred
// on the socket; if so, close the
// socket and clean up the per-handle data
// and per-I/O operation data associated with
// the socket
if (BytesTransferred == 0 &&
(PerIoData->OperationType == RECV_POSTED ││
PerIoData->OperationType == SEND_POSTED))
{
// A zero BytesTransferred indicates that the
// socket has been closed by the peer, so
// you should close the socket. Note:
// Per-handle data was used to reference the
// socket associated with the I/O operation.
closesocket(PerHandleData->Socket);
GlobalFree(PerHandleData);
GlobalFree(PerIoData);
continue;
}
// Service the completed I/O request. You can
// determine which I/O request has just
// completed by looking at the OperationType
// field contained in the per-I/O operation data.
if (PerIoData->OperationType == RECV_POSTED)
{
// Do something with the received data
// in PerIoData->Buffer
}
// Post another WSASend or WSARecv operation.
// As an example, we will post another WSARecv()
// I/O operation.
Flags = 0;
// Set up the per-I/O operation data for the next
// overlapped call
ZeroMemory(&(PerIoData->Overlapped),
sizeof(OVERLAPPED));
PerIoData->DataBuf.len = DATA_BUFSIZE;
PerIoData->DataBuf.buf = PerIoData->Buffer;
PerIoData->OperationType = RECV_POSTED;
WSARecv(PerHandleData->Socket,
&(PerIoData->DataBuf), 1, &RecvBytes,
&Flags, &(PerIoData->Overlapped), NULL);
}
}
★4、正确地关闭 I/O 完成端口
如何正确地关闭 I/O 完成端口,特别是同时运行了一个或多个线程,在几个不同的套接字上执行 I/O 操作的时候。
要避免的一个重要问题是在进行重叠 I/O 操作的同时,强行释放一个 OVERLAPPED 结构。
要想避免出现这种情况,最好的办法是针对每个套接字句柄,调用 closesocket 函数,任何尚未进行的重叠 I/O 操作都会完成。一旦所有套接字句柄都已关闭,
便需在完成端口上,终止所有工作者线程的运行。要想做到这一点,需要使用 PostQueuedCompletionStatus 函数,向每个工作者线程都发送一个特殊的完成数据包。
该函数会指示每个线程都“立即结束并退出”。下面是 PostQueuedCompletionStatus 函数的定义:
BOOL WINAPI PostQueuedCompletionStatus(
__in HANDLE CompletionPort,
__in DWORD dwNumberOfBytesTransferred,
__in ULONG_PTR dwCompletionKey,
__in LPOVERLAPPED lpOverlapped
);
● CompletionPort 参数指定想向其发送一个完成数据包的完成端口对象;
● 而就 dwNumberOfBytesTransferred、dwCompletionKey 和 lpOverlapped 三个参数来说,每一个都允许我们指定一个值,
直接传递给 GetQueuedCompletionStatus 函数中对应的参数。这样一来,一个工作者线程收到传递过来的三个 GetQueuedCompletionStatus 函数参数后,
便可根据由这三个参数的某一个设置的特殊值,决定何时或者应该怎样退出。
例如,可用 dwCompletionPort 参数传递 0 值,而一个工作者线程会将其解释成中止指令。
一旦所有工作者线程都已关闭,便可使用 CloseHandle 函数,关闭完成端口,最终安全退出程序。
现在,我们来个总结:
Q:微软为什么要提出完成端口模型,以及完成端口模型是为了解决什么问题的呢?
第一点,写高性能的服务器程序,要求通信一定要是异步的。
异步通信就 是在咱们与外部的I/O设备进行打交道的时候,我们没有必要等待着I/O操作完成再执行后续的代码,而是将这个请求交给设备的驱动程序自己去处理,我们的线程可以继续做其他更重要的事情,大体的流程如 下图所示:
在Windows中实现异步的机制同样有好几种,关键在于“通知应用程序处理网络数据”这一步上。
第二点,使用“同步通信(阻塞通信)+多线程”的方式,服务器端在每一个客户端连入之后,都要启动一个新的Thread和客户端进行通信,有多少个客户端,就需要启动多少个线程,对吧?但是由于这些线程都是处于运行状态,所以系统不得不在所有可运行的线程之间进行上下文的切换,我们自己是没啥感觉,但是CPU却痛苦不堪,因为线程切换是相当浪费CPU时间的,如果客户端的连入线程过多,这就会弄得CPU都忙着去切换线程了,根本没有多少时间去执行线程体了,所以效率是非常低下的,承认坑爹了不?
第三点,微软提出完成端口模型的初衷,就是为了解决这种"one-thread-per-client"的缺点的,它充分利用内核对象的调度,只使用少量的几个线程来处理和客户端的所有通信,消除了无谓的线程上下文切换,最大限度的提高了网络通信的性能。
第四点,这里我想要解释的是,重叠结构Overlapped是异步通信机制实现的一个核心数据结构,因为你看到后面的代码你会发现,几乎所有的网络操作例如发送/接收之类的,都会 用WSASend()和WSARecv()代替,参数里面都会附带一个重叠结构,这是为什么呢?因为重叠结构我们就可以理解成为是一个网络操作的ID号, 也就是说我们要利用重叠I/O提供的异步机制的话,每一个网络操作都要有一个唯一的ID号,因为进了系统内核,里面黑灯瞎火的,也不了解上面出了什么状况,一看到有重叠I/O的调用进来了,就会使用其异步机制,并且操作系统就只能靠这个重叠结构带有的ID号来区分是哪一个网络操作了,然后内核里面处理完毕之后,根据这个ID号,把对应的数据传上去。
PS:完成端口的基本原理和一些基本的操作我是懂了,但是还需要多多的写代码来实践,不断的提高写的服务器的效率,加油,少年!
附上的程序是csdn上比较不错的源代码,我自己写的代码就先不发了,担心误人子弟哈,哈哈