IOCP(I/OCompletionPort,I/O完成端口)是性能最好的一種I/O模型。它是應(yīng)用程序使用線程池處理異步I/O請求的一種機(jī)制。在處理多個(gè)并發(fā)的異步I/O請求時(shí),以往的模型都是在接收請求是創(chuàng)建一個(gè)線程來應(yīng)答請求。這樣就有很多的線程并行地運(yùn)行在系統(tǒng)中。而這些線程都是可運(yùn)行的,Windows內(nèi)核花費(fèi)大量的時(shí)間在進(jìn)行線程的上下文切換,并沒有多少時(shí)間花在線程運(yùn)行上。再加上創(chuàng)建新線程的開銷比較大,所以造成了效率的低下。
調(diào)用的步驟如下:
抽象出一個(gè)完成端口大概的處理流程:
1:創(chuàng)建一個(gè)完成端口。
2:創(chuàng)建一個(gè)線程A。
3:A線程循環(huán)調(diào)用GetQueuedCompletionStatus()函數(shù)來得到IO操作結(jié)果,這個(gè)函數(shù)是個(gè)阻塞函數(shù)。
4:主線程循環(huán)里調(diào)用accept等待客戶端連接上來。
5:主線程里accept返回新連接建立以后,把這個(gè)新的套接字句柄用CreateIoCompletionPort關(guān)聯(lián)到完成端口,然后發(fā)出一個(gè)異步的WSASend或者WSARecv調(diào)用,因?yàn)槭钱惒胶瘮?shù),WSASend/WSARecv會(huì)馬上返回,實(shí)際的發(fā)送或者接收數(shù)據(jù)的操作由WINDOWS系統(tǒng)去做。
6:主線程繼續(xù)下一次循環(huán),阻塞在accept這里等待客戶端連接。
7:WINDOWS系統(tǒng)完成WSASend或者WSArecv的操作,把結(jié)果發(fā)到完成端口。
8:A線程里的GetQueuedCompletionStatus()馬上返回,并從完成端口取得剛完成的WSASend/WSARecv的結(jié)果。
9:在A線程里對這些數(shù)據(jù)進(jìn)行處理(如果處理過程很耗時(shí),需要新開線程處理),然后接著發(fā)出WSASend/WSARecv,并繼續(xù)下一次循環(huán)阻塞在GetQueuedCompletionStatus()這里。
歸根到底概括完成端口模型一句話:
我們不停地發(fā)出異步的WSASend/WSARecvIO操作,具體的IO處理過程由WINDOWS系統(tǒng)完成,WINDOWS系統(tǒng)完成實(shí)際的IO處理后,把結(jié)果送到完成端口上(如果有多個(gè)IO都完成了,那么就在完成端口那里排成一個(gè)隊(duì)列)。我們在另外一個(gè)線程里從完成端口不斷地取出IO操作結(jié)果,然后根據(jù)需要再發(fā)出WSASend/WSARecvIO操作。
而IOCP模型是事先開好了N個(gè)線程,存儲(chǔ)在線程池中,讓他們hold。然后將所有用戶的請求都投遞到一個(gè)完成端口上,然后N個(gè)工作線程逐一地從完成端口中取得用戶消息并加以處理。這樣就避免了為每個(gè)用戶開一個(gè)線程。既減少了線程資源,又提高了線程的利用率。
完成端口模型是怎樣實(shí)現(xiàn)的呢?我們先創(chuàng)建一個(gè)完成端口(::CreateIoCompletioPort())。然后再創(chuàng)建一個(gè)或多個(gè)工作線程,并指定他們到這個(gè)完成端口上去讀取數(shù)據(jù)。我們再將遠(yuǎn)程連接的套接字句柄關(guān)聯(lián)到這個(gè)完成端口(還是用::CreateIoCompletionPort())。一切就OK了。
工作線程都干些什么呢?首先是調(diào)用::GetQueuedCompletionStatus()函數(shù)在關(guān)聯(lián)到這個(gè)完成端口上的所有套接字上等待I/O的完成。再判斷完成了什么類型的I/O。一般來說,有三種類型的I/O,OP_ACCEPT,OP_READ和OP_WIRTE。我們到數(shù)據(jù)緩沖區(qū)內(nèi)讀取數(shù)據(jù)后,再投遞一個(gè)或是多個(gè)同類型的I/O即可(::AcceptEx()、::WSARecv()、::WSASend())。對讀取到的數(shù)據(jù),我們可以按照自己的需要來進(jìn)行相應(yīng)的處理。
為此,我們需要一個(gè)以O(shè)VERLAPPED(重疊I/O)結(jié)構(gòu)為第一個(gè)字段的per-I/O數(shù)據(jù)自定義結(jié)構(gòu)。
typedef struct _PER_IO_DATA
{
OVERLAPPED ol; // 重疊I/O結(jié)構(gòu)
char buf[BUFFER_SIZE]; // 數(shù)據(jù)緩沖區(qū)
int nOperationType; //I/O操作類型
#define OP_READ 1
#define OP_WRITE 2
#define OP_ACCEPT 3
} PER_IO_DATA, *PPER_IO_DATA;
將一個(gè)PER_IO_DATA結(jié)構(gòu)強(qiáng)制轉(zhuǎn)化成一個(gè)OVERLAPPED結(jié)構(gòu)傳給::GetQueuedCompletionStatus()函數(shù),返回的這個(gè)PER_IO_DATA結(jié)構(gòu)的的nOperationType就是I/O操作的類型。當(dāng)然,這些類型都是在投遞I/O請求時(shí)自己設(shè)置的。
這樣一個(gè)IOCP服務(wù)器的框架就出來了。當(dāng)然,要做一個(gè)好的IOCP服務(wù)器,還有考慮很多問題,如內(nèi)存資源管理、接受連接的方法、惡意的客戶連接、包的重排序等等。以上是個(gè)人對于IOCP模型的一些理解與看法,還有待完善。另外各Winsock API的用法參見MSDN。
補(bǔ)充IOCP模型的實(shí)現(xiàn):
//創(chuàng)建一個(gè)完成端口
HANDLE FCompletPort = CreateIoCompletionPort( INVALID_HANDLE_VALUE, 0,0,0 );
//接受遠(yuǎn)程連接,并把這個(gè)連接的socket句柄綁定到剛才創(chuàng)建的IOCP上
AConnect = accept( FListenSock, addr, len);
CreateIoCompletionPort( AConnect, FCompletPort, NULL, 0 );
//創(chuàng)建CPU數(shù)*2 + 2個(gè)線程
SYSTEM_INFO si;
GetSystemInfo(&si);
for (int i=1;si.dwNumberOfProcessors*2+2;i++)
{
AThread = TRecvSendThread.Create( false );
AThread.CompletPort = FCompletPort;//告訴這個(gè)線程,你要去這個(gè)IOCP去訪問數(shù)據(jù)
}
OK,就這么簡單,我們要做的就是建立一個(gè)IOCP,把遠(yuǎn)程連接的socket句柄綁定到剛才創(chuàng)建的IOCP上,最后創(chuàng)建n個(gè)線程,并告訴這n個(gè)線程到這個(gè)IOCP上去訪問數(shù)據(jù)就可以了。
再看一下TRecvSendThread線程都干些什么:
void TRecvSendThread.Execute(...)
{
while (!self.Terminated)
{
//查詢IOCP狀態(tài)(數(shù)據(jù)讀寫操作是否完成)
GetQueuedCompletionStatus( CompletPort, BytesTransd, CompletKey, POVERLAPPED(pPerIoDat), TIME_OUT );
if (BytesTransd !=0) .......
....;//數(shù)據(jù)讀寫操作完成
//再投遞一個(gè)讀數(shù)據(jù)請求
WSARecv( CompletKey, &(pPerIoDat->BufData), 1, BytesRecv, Flags, &(pPerIoDat->Overlap), NULL );
}
}
讀寫線程只是簡單地檢查IOCP是否完成了我們投遞的讀寫操作,如果完成了則再投遞一個(gè)新的讀寫請求。
應(yīng)該注意到,我們創(chuàng)建的所有TRecvSendThread都在訪問同一個(gè)IOCP(因?yàn)槲覀冎粍?chuàng)建了一個(gè)IOCP),并且我們沒有使用臨界區(qū)!難道不會(huì)產(chǎn)生沖突嗎?不用考慮同步問題嗎?
呵呵,這正是IOCP的奧妙所在。IOCP不是一個(gè)普通的對象,不需要考慮線程安全問題。它會(huì)自動(dòng)調(diào)配訪問它的線程:如果某個(gè)socket上有一個(gè)線程A正在訪問,那么線程B的訪問請求會(huì)被分配到另外一個(gè)socket。這一切都是由系統(tǒng)自動(dòng)調(diào)配的,我們無需過問。
實(shí)例:
簡單實(shí)現(xiàn),適合IOCP入門
參考:《WINDOWS網(wǎng)絡(luò)與通信程序設(shè)計(jì)》
/******************************************************************
*
* Copyright (c) 2008, xxxxx有限公司
* All rights reserved.
*
* 文件名稱:IOCPHeader.h
* 摘 要: IOCP定義文件
*
* 當(dāng)前版本:1.0
* 作 者:吳會(huì)然
* 完成日期:2008-9-16
*
* 取代版本:
* 原 作者:
* 完成日期:
*
******************************************************************/
#ifndef _IOCPHEADER_H_20080916_
#define _IOCPHEADER_H_20080916_
#include <WINSOCK2.H>
#include <windows.h>
#define BUFFER_SIZE 1024
/******************************************************************
* per_handle 數(shù)據(jù)
*******************************************************************/
typedef struct _PER_HANDLE_DATA
{
SOCKET s; // 對應(yīng)的套接字句柄
sockaddr_in addr; // 對方的地址
}PER_HANDLE_DATA, *PPER_HANDLE_DATA;
/******************************************************************
* per_io 數(shù)據(jù)
*******************************************************************/
typedef struct _PER_IO_DATA
{
OVERLAPPED ol; // 重疊結(jié)構(gòu)
char buf[BUFFER_SIZE]; // 數(shù)據(jù)緩沖區(qū)
int nOperationType; // 操作類型
#define OP_READ 1
#define OP_WRITE 2
#define OP_ACCEPT 3
}PER_IO_DATA, *PPER_IO_DATA;
#endif
/******************************************************************
*
* Copyright (c) 2008, xxxxx有限公司
* All rights reserved.
*
* 文件名稱:main.cpp
* 摘 要: iocp demo
*
* 當(dāng)前版本:1.0
* 作 者:吳會(huì)然
* 完成日期:2008-9-16
*
* 取代版本:
* 原 作者:
* 完成日期:
*
******************************************************************/
#include <iostream>
#include <string>
#include "IOCPHeader.h"
using namespace std;
DWORD WINAPI ServerThread( LPVOID lpParam );
int main( int argc, char *argv[] )
{
//////////////////////////////////////////////////////////////////////////
WSADATA wsaData;
if( 0 != WSAStartup( MAKEWORD( 2, 2 ), &wsaData ) )
{
printf( "Using %s (Status:%s)\n", wsaData.szDescription, wsaData.szSystemStatus );
printf( "with API versions: %d.%d to %d.%d",
LOBYTE( wsaData.wVersion), HIBYTE( wsaData.wVersion ),
LOBYTE( wsaData.wHighVersion), HIBYTE( wsaData.wHighVersion) );
return -1;
}
else
{
printf("Windows sockets 2.2 startup\n");
}
//////////////////////////////////////////////////////////////////////////
int nPort = 20055;
// 創(chuàng)建完成端口對象
// 創(chuàng)建工作線程處理完成端口對象的事件
HANDLE hIocp = ::CreateIoCompletionPort( INVALID_HANDLE_VALUE, 0, 0, 0 );
::CreateThread( NULL, 0, ServerThread, (LPVOID)hIocp, 0, 0 );
// 創(chuàng)建監(jiān)聽套接字,綁定本地端口,開始監(jiān)聽
SOCKET sListen = ::socket( AF_INET,-SOCK_STREAM, 0 );
SOCKADDR_IN addr;
addr.sin_family = AF_INET;
addr.sin_port = ::htons( nPort );
addr.sin_addr.S_un.S_addr = INADDR_ANY;
::bind( sListen, (sockaddr *)&addr, sizeof( addr ) );
::listen( sListen, 5 );
printf( "iocp demo start......\n" );
// 循環(huán)處理到來的請求
while ( TRUE )
{
// 等待接受未決的連接請求
SOCKADDR_IN saRemote;
int nRemoteLen = sizeof( saRemote );
SOCKET sRemote = ::accept( sListen, (sockaddr *)&saRemote, &nRemoteLen );
// 接受到新連接之后,為它創(chuàng)建一個(gè)per_handle數(shù)據(jù),并將他們關(guān)聯(lián)到完成端口對象
PPER_HANDLE_DATA pPerHandle = ( PPER_HANDLE_DATA )::GlobalAlloc( GPTR, sizeof( PPER_HANDLE_DATA ) );
if( pPerHandle == NULL )
{
break;
}
pPerHandle->s = sRemote;
memcpy( &pPerHandle->addr, &saRemote, nRemoteLen );
::CreateIoCompletionPort( ( HANDLE)pPerHandle->s, hIocp, (DWORD)pPerHandle, 0 );
// 投遞一個(gè)接受請求
PPER_IO_DATA pIoData = ( PPER_IO_DATA )::GlobalAlloc( GPTR, sizeof( PPER_IO_DATA ) );
if( pIoData == NULL )
{
break;
}
pIoData->nOperationType = OP_READ;
WSABUF buf;
buf.buf = pIoData->buf;
buf.len = BUFFER_SIZE;
DWORD dwRecv = 0;
DWORD dwFlags = 0;
::WSARecv( pPerHandle->s, &buf, 1, &dwRecv, &dwFlags, &pIoData->ol, NULL );
}
//////////////////////////////////////////////////////////////////////////
ERROR_PROC:
WSACleanup();
//////////////////////////////////////////////////////////////////////////
return 0;
}
/******************************************************************
* 函數(shù)介紹:處理完成端口對象事件的線程
* 輸入?yún)?shù):
* 輸出參數(shù):
* 返回值 :
*******************************************************************/
DWORD WINAPI ServerThread( LPVOID lpParam )
{
HANDLE hIocp = ( HANDLE )lpParam;
if( hIocp == NULL )
{
return -1;
}
DWORD dwTrans = 0;
PPER_HANDLE_DATA pPerHandle;
PPER_IO_DATA pPerIo;
while( TRUE )
{
// 在關(guān)聯(lián)到此完成端口的所有套接字上等待I/O完成
BOOL bRet = ::GetQueuedCompletionStatus( hIocp, &dwTrans,(LPDWORD)&pPerHandle, (LPOVERLAPPED*)&pPerIo, WSA_INFINITE );
if( !bRet ) // 發(fā)生錯(cuò)誤
{
::closesocket( pPerHandle->s );
::GlobalFree( pPerHandle );
::GlobalFree( pPerIo );
cout << "error" << endl;
continue;
}
// 套接字被對方關(guān)閉
if( dwTrans == 0 && ( pPerIo->nOperationType ==OP_READ || pPerIo->nOperationType&nb-sp;== OP_WRITE ) )
{
::closesocket( pPerHandle->s );
::GlobalFree( pPerHandle );
::GlobalFree( pPerIo );
cout << "client closed" << endl;
continue;
}
switch ( pPerIo->nOperationType )
{
case OP_READ: // 完成一個(gè)接收請求
{
pPerIo->buf[dwTrans] = '\0';
printf( "%s\n", pPerIo->buf );
// 繼續(xù)投遞接受操作
WSABUF buf;
buf.buf = pPerIo->buf;
buf.len = BUFFER_SIZE;
pPerIo->nOperationType = OP_READ;
DWORD dwRecv = 0;
DWORD dwFlags = 0;
::WSARecv( pPerHandle->s, &buf, 1, &dwRecv, &dwFlags, &pPerIo->ol, NULL );
}
break;
case OP_WRITE:
case OP_ACCEPT:
break;
}
}
return 0;
}
聯(lián)系客服