要寫網(wǎng)絡(luò)程序就必須用Socket,這是程序員都知道的。而且,面試的時(shí)候,我們也會(huì)問對(duì)方會(huì)不會(huì)Socket編程?一般來(lái)說(shuō),很多人都會(huì)說(shuō),Socket編程基本就是listen,accept以及send,write等幾個(gè)基本的操作。是的,就跟常見的文件操作一樣,只要寫過(guò)就一定知道。
對(duì)于網(wǎng)絡(luò)編程,我們也言必稱TCP/IP,似乎其它網(wǎng)絡(luò)協(xié)議已經(jīng)不存在了。對(duì)于TCP/IP,我們還知道TCP和UDP,前者可以保證數(shù)據(jù)的正確和可靠性,后者則允許數(shù)據(jù)丟失。最后,我們還知道,在建立連接前,必須知道對(duì)方的IP地址和端口號(hào)。除此,普通的程序員就不會(huì)知道太多了,很多時(shí)候這些知識(shí)已經(jīng)夠用了。最多,寫服務(wù)程序的時(shí)候,會(huì)使用多線程來(lái)處理并發(fā)訪問。
我們還知道如下幾個(gè)事實(shí):
1。一個(gè)指定的端口號(hào)不能被多個(gè)程序共用。比如,如果IIS占用了80端口,那么Apache就不能也用80端口了。
2。很多防火墻只允許特定目標(biāo)端口的數(shù)據(jù)包通過(guò)。
3。服務(wù)程序在listen某個(gè)端口并accept某個(gè)連接請(qǐng)求后,會(huì)生成一個(gè)新的socket來(lái)對(duì)該請(qǐng)求進(jìn)行處理。
于是,一個(gè)困惑了我很久的問題就產(chǎn)生了。如果一個(gè)socket創(chuàng)建后并與80端口綁定后,是否就意味著該socket占用了80端口呢?如果是這樣的,那么當(dāng)其accept一個(gè)請(qǐng)求后,生成的新的socket到底使用的是什么端口呢(我一直以為系統(tǒng)會(huì)默認(rèn)給其分配一個(gè)空閑的端口號(hào))?如果是一個(gè)空閑的端口,那一定不是80端口了,于是以后的TCP數(shù)據(jù)包的目標(biāo)端口就不是80了--防火墻一定會(huì)阻止其通過(guò)的!實(shí)際上,我們可以看到,防火墻并沒有阻止這樣的連接,而且這是最常見的連接請(qǐng)求和處理方式。我的不解就是,為什么防火墻沒有阻止這樣的連接?它是如何判定那條連接是因?yàn)閏onnet80端口而生成的?是不是TCP數(shù)據(jù)包里有什么特別的標(biāo)志?或者防火墻記住了什么東西?后來(lái),我又仔細(xì)研讀了TCP/IP的協(xié)議棧的原理,對(duì)很多概念有了更深刻的認(rèn)識(shí)。比如,在TCP和UDP同屬于傳輸層,共同架設(shè)在IP層(網(wǎng)絡(luò)層)之上。而IP層主要負(fù)責(zé)的是在節(jié)點(diǎn)之間(End to End)的數(shù)據(jù)包傳送,這里的節(jié)點(diǎn)是一臺(tái)網(wǎng)絡(luò)設(shè)備,比如計(jì)算機(jī)。因?yàn)镮P層只負(fù)責(zé)把數(shù)據(jù)送到節(jié)點(diǎn),而不能區(qū)分上面的不同應(yīng)用,所以TCP和UDP協(xié)議在其基礎(chǔ)上加入了端口的信息,端口于是標(biāo)識(shí)的是一個(gè)節(jié)點(diǎn)上的一個(gè)應(yīng)用。除了增加端口信息,UPD協(xié)議基本就沒有對(duì)IP層的數(shù)據(jù)進(jìn)行任何的處理了。而TCP協(xié)議還加入了更加復(fù)雜的傳輸控制,比如滑動(dòng)的數(shù)據(jù)發(fā)送窗口(Slice Window),以及接收確認(rèn)和重發(fā)機(jī)制,以達(dá)到數(shù)據(jù)的可靠傳送。不管應(yīng)用層看到的是怎樣一個(gè)穩(wěn)定的TCP數(shù)據(jù)流,下面?zhèn)魉偷亩际且粋€(gè)個(gè)的IP數(shù)據(jù)包,需要由TCP協(xié)議來(lái)進(jìn)行數(shù)據(jù)重組。
所以,我有理由懷疑,防火墻并沒有足夠的信息判斷TCP數(shù)據(jù)包的更多信息,除了IP地址和端口號(hào)。而且,我們也看到,所謂的端口,是為了區(qū)分不同的應(yīng)用的,以在不同的IP包來(lái)到的時(shí)候能夠正確轉(zhuǎn)發(fā)。
TCP/IP只是一個(gè)協(xié)議棧,就像操作系統(tǒng)的運(yùn)行機(jī)制一樣,必須要具體實(shí)現(xiàn),同時(shí)還要提供對(duì)外的操作接口。就像操作系統(tǒng)會(huì)提供標(biāo)準(zhǔn)的編程接口,比如Win32編程接口一樣,TCP/IP也必須對(duì)外提供編程接口,這就是Socket編程接口--原來(lái)是這么回事?。?br>在Socket編程接口里,設(shè)計(jì)者提出了一個(gè)很重要的概念,那就是socket。這個(gè)socket跟文件句柄很相似,實(shí)際上在BSD系統(tǒng)里就是跟文件句柄一樣存放在一樣的進(jìn)程句柄表里。這個(gè)socket其實(shí)是一個(gè)序號(hào),表示其在句柄表中的位置。這一點(diǎn),我們已經(jīng)見過(guò)很多了,比如文件句柄,窗口句柄等等。這些句柄,其實(shí)是代表了系統(tǒng)中的某些特定的對(duì)象,用于在各種函數(shù)中作為參數(shù)傳入,以對(duì)特定的對(duì)象進(jìn)行操作--這其實(shí)是C語(yǔ)言的問題,在C++語(yǔ)言里,這個(gè)句柄其實(shí)就是this指針,實(shí)際就是對(duì)象指針啦。
現(xiàn)在我們知道,socket跟TCP/IP并沒有必然的聯(lián)系。Socket編程接口在設(shè)計(jì)的時(shí)候,就希望也能適應(yīng)其他的網(wǎng)絡(luò)協(xié)議。所以,socket的出現(xiàn)只是可以更方便的使用TCP/IP協(xié)議棧而已,其對(duì)TCP/IP進(jìn)行了抽象,形成了幾個(gè)最基本的函數(shù)接口。比如create,listen,accept,connect,read和write等等。
現(xiàn)在我們明白,如果一個(gè)程序創(chuàng)建了一個(gè)socket,并讓其監(jiān)聽80端口,其實(shí)是向TCP/IP協(xié)議棧聲明了其對(duì)80端口的占有。以后,所有目標(biāo)是80端口的TCP數(shù)據(jù)包都會(huì)轉(zhuǎn)發(fā)給該程序(這里的程序,因?yàn)槭褂玫氖荢ocket編程接口,所以首先由Socket層來(lái)處理)。所謂accept函數(shù),其實(shí)抽象的是TCP的連接建立過(guò)程。accept函數(shù)返回的新socket其實(shí)指代的是本次創(chuàng)建的連接,而一個(gè)連接是包括兩部分信息的,一個(gè)是源IP和源端口,另一個(gè)是宿IP和宿端口。所以,accept可以產(chǎn)生多個(gè)不同的socket,而這些socket里包含的宿IP和宿端口是不變的,變化的只是源IP和源端口。這樣的話,這些socket宿端口就可以都是80,而Socket層還是能根據(jù)源/宿對(duì)來(lái)準(zhǔn)確地分辨出IP包和socket的歸屬關(guān)系,從而完成對(duì)TCP/IP協(xié)議的操作封裝!而同時(shí),放火墻的對(duì)IP包的處理規(guī)則也是清晰明了,不存在前面設(shè)想的種種復(fù)雜的情形。
明白socket只是對(duì)TCP/IP協(xié)議棧操作的抽象,而不是簡(jiǎn)單的映射關(guān)系,這很重要!
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。