本文章出自cnntec.com的AZ貓著,如需要轉(zhuǎn)發(fā),請(qǐng)注明來(lái)自cnntec.com
Peer-To-Peer縮寫P2P
中文稱之為對(duì)等聯(lián)網(wǎng)。
用途于交流,比如QQ,MSN等等。
文件傳輸、分布式數(shù)據(jù)計(jì)算等等。
這里我們主要是是簡(jiǎn)單講解一下UDP實(shí)現(xiàn)NAT的穿透(俗稱打洞)
當(dāng)然TCP與之相似,可以以此類推。
首先我們要確認(rèn)以下事實(shí):
. 兩個(gè)獨(dú)立內(nèi)網(wǎng)是無(wú)法連通的;
. 但是內(nèi)網(wǎng)計(jì)算機(jī)可以主動(dòng)連接其他有獨(dú)立IP的外網(wǎng)計(jì)算機(jī);
. UDP協(xié)議通訊是非持續(xù)連接的, 所以網(wǎng)關(guān)那邊會(huì)給你開一個(gè)臨時(shí)端口,讓你能夠接受外網(wǎng)計(jì)算機(jī)返回給你的udp包,如果一段時(shí)間內(nèi)沒(méi)有傳輸,臨時(shí)端口便會(huì)取消。這就給了我們可鉆之機(jī).
NAT最開始出現(xiàn)在路由器上。詳細(xì)的大家可以在網(wǎng)上查下資料
NAT的全稱是Network Address Translator中文稱之為網(wǎng)絡(luò)地址轉(zhuǎn)換
NAT分為兩大類,NAT和NAPT(Network Address Port Translator)這個(gè)不用說(shuō)了,端口地址轉(zhuǎn)換。
用于實(shí)例,簡(jiǎn)單的說(shuō),實(shí)現(xiàn)P2P需要一個(gè)中轉(zhuǎn)服務(wù)器。也就是需要一個(gè)第三方。(一會(huì)兒我們來(lái)說(shuō)為什么需要一個(gè)第三方)
以簡(jiǎn)單的通迅來(lái)講,首先我們來(lái)看一個(gè)示例圖。
A<——————>B A與B之間進(jìn)行的通迅
A的IP地址為222.182.100.1
B的IP地址為222.182.100.2
如果這兩個(gè)用戶都是采用的全球唯一的IP地址,那么他們通迅很簡(jiǎn)單,也不需要實(shí)現(xiàn)P2P。
A<------------------>Nat<-------------------->B
如果其中一方為內(nèi)網(wǎng)用戶,即IP地址不為全球唯一IP, 就需要路由器來(lái)幫助通迅了。
數(shù)據(jù)包在經(jīng)過(guò)路由器的時(shí)候,路由器會(huì)完成IP地址和端口的映射。
如:A為內(nèi)網(wǎng)用戶。B為外網(wǎng)用戶。則B的IP為全球唯一IP地址??梢灾苯油ㄑ?。
A的IP地址為:192.168.1.100:1025, 這當(dāng)然是內(nèi)網(wǎng)的地址.
A(內(nèi)網(wǎng))<------------------>R(Nat)<-------------------->B(外網(wǎng))
假設(shè)數(shù)據(jù)從A先發(fā)送到路由器R,R會(huì)產(chǎn)生一個(gè)會(huì)話(Session),保存時(shí)間為幾分鐘到數(shù)小時(shí),這個(gè)Session映射(保存)了數(shù)據(jù)包的源地址(192.168.1.100:1025),并修改為222.182.100.1:3645(假設(shè)),
之后R繼續(xù)將數(shù)據(jù)包轉(zhuǎn)發(fā)給B.
這個(gè)時(shí)候?qū)嶋H上A就是在進(jìn)行路由NAT的穿透,
如果我們?cè)贐向A發(fā)送信息的時(shí)候采用192.168.1.100:1025這樣的IP和端口,是找不到A的;
那么B需要的是在收到A的信息的時(shí)候,獲取其IP地址和端口,那么獲取到的就是222.182.100.1:3645這個(gè)路由器的映射Session地址。
B現(xiàn)在只需要向這個(gè)映射地址發(fā)送消息,路由器就會(huì)自動(dòng)將消息發(fā)送到對(duì)應(yīng)的A方去。否則路由器將當(dāng)作無(wú)用包,將這個(gè)消息丟棄。
那如,我們現(xiàn)在就實(shí)現(xiàn)了局域網(wǎng)向某單個(gè)固定外網(wǎng)機(jī)器發(fā)送消息。
如果再來(lái)一臺(tái)C端,也是外網(wǎng)的IP。C通過(guò)222.182.100.1:3645向A發(fā)送消息,A是否能收到呢?答案是否定的,A不能收到。為什么?因?yàn)槁酚稍谟成銩的穿透時(shí)就記錄了B的地址,也就是除了B向這個(gè)映射點(diǎn)發(fā)送消息可以通向A,其它的地址是不行的。路由器此時(shí)會(huì)將其當(dāng)作無(wú)用包消息給丟棄掉。
那怎么辦呢?只有A再向C發(fā)送一個(gè)穿透,C才可以向A發(fā)送消息。
以上我們只是說(shuō)了一點(diǎn)基本的理論。接下來(lái)我們要實(shí)現(xiàn)什么?不同內(nèi)網(wǎng)通過(guò)internet網(wǎng)進(jìn)行通迅。
再來(lái),我們舉個(gè)圖例
A<----------->NatA<---------->NatB<---------->B
A的地址是:192.168.1.100端口4000
B的地址是:192.168.1.100端口4000
它們兩個(gè)都是內(nèi)網(wǎng)的地址。及局域網(wǎng)內(nèi)部地址。并不是全球唯一地址。
兩個(gè)路由:
NatA的地址是:222.182.100.1
NatB的地址是:222.182.100.2
這兩個(gè)路由是外網(wǎng)的地址,及全球唯一地址。
現(xiàn)在我們要實(shí)現(xiàn)A與B的通迅。
因?yàn)锳與B都不是外網(wǎng)地址。所以A不可能向192.168.1.100發(fā)送消息。這消息只會(huì)它自己收到,因?yàn)檫@個(gè)IP是它自己的。同樣B也不可以。
那么A向NatB發(fā)送消息,B能收到嗎?答案是否定的,不能收到。剛才我們提到過(guò)。因?yàn)槁酚蓻](méi)有映射B的地址。A并不知道這個(gè)Session就連NatB也不知道這個(gè)Session因?yàn)锽沒(méi)有向A發(fā)送消息,并不產(chǎn)生這個(gè)Session。
就算B和A同時(shí)向雙方的路由發(fā)送消息,產(chǎn)生的Session,A和B也得不到。因?yàn)樵诼酚缮暇桶堰@個(gè)消息當(dāng)做為無(wú)用包給丟棄掉了。
那么這樣的情況我們要進(jìn)行通迅怎么辦呢?
對(duì),就是剛才我們提到的第三方。第三方是個(gè)什么方呢?
第三方必須是一個(gè)擁有固定外網(wǎng)IP的服務(wù)方。及一個(gè)外網(wǎng)服務(wù)器。全唯一IP地址。
圖例:
假定我們這個(gè)第三方為C
C IP:222.182.100.3端口4001
A<----------->NatA<--------------->C<-------------------->NatB<------------->B
↑______________________________↑
原理如下
A通過(guò)路由向C發(fā)送消息,C獲取A的在路由上的Session地址,映射的IP和端口
B同樣。
這時(shí)候C就有了A和B的地址。
C可以和A、B進(jìn)行通迅,但是A和B還不行。
現(xiàn)在C需要通知A方B的映射IP和端口。也要通知B方A的映射IP和端口。
這樣A就有了B的映射地址,B也有了A的。但是現(xiàn)在還不能進(jìn)行通迅。
因?yàn)樵诼酚缮螦和B都只有對(duì)C的穿透。并沒(méi)有相互之前的穿透。
那么A要向B發(fā)送消息怎么辦呢?需要C向B發(fā)送一個(gè)消息告訴B方A的地址讓B向這個(gè)地址發(fā)送一個(gè)消息,對(duì)A進(jìn)行一個(gè)穿透。
這樣A就可以向B發(fā)送消息了。在A向B發(fā)送消息的同時(shí),A也在向B進(jìn)行穿透。
這樣就可以實(shí)現(xiàn)相互的通迅了。如果有多個(gè)端點(diǎn),也就以此類推了。
宗上所述就是P2P的UDP實(shí)現(xiàn)原理了。TCP也是一樣的。提示一點(diǎn)。Session在路由上是有時(shí)限的,一分鐘到幾小時(shí)不定。不同的路由不同的時(shí)間,為了保持這個(gè)Session的存在,你需要在固定時(shí)間點(diǎn)進(jìn)行通迅,保持這個(gè)穿透,否則就得重新穿透。
值得注意的一點(diǎn)。
路由上的映射有兩種情況
第一種情況是:Cone NAT
第二種情況是:Symmetric NAT
我們以上的實(shí)現(xiàn)是以Cone Nat為基礎(chǔ)的。為什么呢?因?yàn)镃one Nat在映射的時(shí)候端口是不變的。無(wú)論你內(nèi)網(wǎng)有多少臺(tái)機(jī)器,向外網(wǎng)發(fā)送消息在路由上映射的端口都是不變的。
而Symmetric Nat則相反,一個(gè)映射一個(gè)端口。如果碰到這種情況只有祝你好運(yùn)了,最好不要猜。(十有八九猜不到。所以不推薦猜)
----------------------------------------------------------------------------------------------------
首先先介紹一些基本概念:
網(wǎng)絡(luò)地址轉(zhuǎn)換, NAT(Network Address Translators). 網(wǎng)絡(luò)地址轉(zhuǎn)換是在IP地址日益缺乏的情況下產(chǎn)生的,它的主要目的就是為了能夠地址重用。NAT分為兩大類,基本的NAT和NAPT(Network Address/Port Translator)。
最開始NAT是運(yùn)行在路由器上的一個(gè)功能模塊.
最先提出的是基本的NAT, 它的產(chǎn)生基于如下事實(shí):一個(gè)私有網(wǎng)絡(luò)(域)中的節(jié)點(diǎn)中只有很少的節(jié)點(diǎn)需要與外網(wǎng)連接(呵呵,這是在上世紀(jì)90年代中期提出的)。那么這個(gè)子網(wǎng)中其實(shí)只有少數(shù)的節(jié)點(diǎn)需要全球唯一的IP地址,其他的節(jié)點(diǎn)的IP地址應(yīng)該是可以重用的。因此,基本的NAT實(shí)現(xiàn)的功能很簡(jiǎn)單,在子網(wǎng)內(nèi)使用一個(gè)保留的IP子網(wǎng)段,這些IP對(duì)外是不可見的。子網(wǎng)內(nèi)只有少數(shù)一些IP地址可以對(duì)應(yīng)到真正全球唯一 的IP地址。如果這些節(jié)點(diǎn)需要訪問(wèn)外部網(wǎng)絡(luò),那么基本NAT就負(fù)責(zé)將這個(gè)節(jié)點(diǎn)的子網(wǎng)內(nèi)IP轉(zhuǎn)化為一個(gè)全球唯一的IP然后發(fā)送出去。(基本的NAT會(huì)改變 IP包中的原IP地址,但是不會(huì)改變IP包中的端口).
(關(guān)于基本的NAT可以參看RFC 1631)
另外一種NAT叫做NAPT,從名稱上我們也可以看得出,NAPT不但會(huì)改變經(jīng)過(guò)這個(gè)NAT設(shè)備的IP數(shù)據(jù)報(bào)的IP地址,還會(huì)改變IP數(shù)據(jù)報(bào)的 TCP/UDP端口。基本NAT的設(shè)備可能我們見的不多(呵呵我沒(méi)有見到過(guò)),NAPT才是我們真正討論的主角??聪聢D:
有一個(gè)私有網(wǎng)絡(luò)10.*.*.*,Client A是其中的一臺(tái)計(jì)算機(jī),這個(gè)網(wǎng)絡(luò)的網(wǎng)關(guān)(一個(gè)NAT設(shè)備)的外網(wǎng)IP是155.99.25.11(應(yīng)該還有一個(gè)內(nèi)網(wǎng)的IP地址,比如 10.0.0.10)。如果Client A中的某個(gè)進(jìn)程(這個(gè)進(jìn)程創(chuàng)建了一個(gè)UDP Socket,這個(gè)Socket綁定1234端口)想訪問(wèn)外網(wǎng)主機(jī)18.181.0.31的1235端口,那么當(dāng)數(shù)據(jù)包通過(guò)NAT時(shí)會(huì)發(fā)生什么事情呢?
首先NAT會(huì)改變這個(gè)數(shù)據(jù)包的原IP地址,改為155.99.25.11。接著NAT會(huì)為這個(gè)傳輸創(chuàng)建一個(gè)Session(Session是一個(gè)抽象的 概念,如果是TCP,也許Session是由一個(gè)SYN包開始,以一個(gè)FIN包結(jié)束。而UDP呢,以這個(gè)IP的這個(gè)端口的第一個(gè)UDP開始,結(jié)束呢,呵 呵,也許是幾分鐘,也許是幾小時(shí),這要看具體的實(shí)現(xiàn)了)并且給這個(gè)Session分配一個(gè)端口,比如62000,然后改變這個(gè)數(shù)據(jù)包的源端口為 62000。所以本來(lái)是(10.0.0.1:1234->18.181.0.31:1235)的數(shù)據(jù)包到了互聯(lián)網(wǎng)上變?yōu)榱?(155.99.25.11:62000->18.181.0.31:1235)。
一旦NAT創(chuàng)建了一個(gè)Session后,NAT會(huì)記住62000端口對(duì)應(yīng)的是10.0.0.1的1234端口,以后從18.181.0.31發(fā)送到 62000端口的數(shù)據(jù)會(huì)被NAT自動(dòng)的轉(zhuǎn)發(fā)到10.0.0.1上。(注意:這里是說(shuō)18.181.0.31發(fā)送到62000端口的數(shù)據(jù)會(huì)被轉(zhuǎn)發(fā),其他的 IP發(fā)送到這個(gè)端口的數(shù)據(jù)將被NAT拋棄)這樣Client A就與Server S1建立以了一個(gè)連接。
呵呵,上面的基礎(chǔ)知識(shí)可能很多人都知道了,那么下面是關(guān)鍵的部分了。
接上面的例子,如果Client A的原來(lái)那個(gè)Socket(綁定了1234端口的那個(gè)UDP Socket)又接著向另外一個(gè)Server S2發(fā)送了一個(gè)UDP包,那么這個(gè)UDP包在通過(guò)NAT時(shí)會(huì)怎么樣呢?
這時(shí)可能會(huì)有兩種情況發(fā)生,一種是NAT再次創(chuàng)建一個(gè)Session,并且再次為這個(gè)Session分配一個(gè)端口號(hào)(比如:62001)。另外一種是 NAT再次創(chuàng)建一個(gè)Session,但是不會(huì)新分配一個(gè)端口號(hào),而是用原來(lái)分配的端口號(hào)62000。前一種NAT叫做Symmetric NAT,后一種叫做Cone NAT。我們期望我們的NAT是第二種,呵呵,如果你的NAT剛好是第一種,那么很可能會(huì)有很多P2P軟件失靈。(可以慶幸的是,現(xiàn)在絕大多數(shù)的NAT屬 于后者,即Cone NAT)
好了,我們看到,通過(guò)NAT,子網(wǎng)內(nèi)的計(jì)算機(jī)向外連結(jié)是很容易的(NAT相當(dāng)于透明的,子網(wǎng)內(nèi)的和外網(wǎng)的計(jì)算機(jī)不用知道NAT的情況)。
但是如果外部的計(jì)算機(jī)想訪問(wèn)子網(wǎng)內(nèi)的計(jì)算機(jī)就比較困難了(而這正是P2P所需要的)。
那么我們?nèi)绻霃耐獠堪l(fā)送一個(gè)數(shù)據(jù)報(bào)給內(nèi)網(wǎng)的計(jì)算機(jī)有什么辦法呢?首先,我們必須在內(nèi)網(wǎng)的NAT上打上一個(gè)“洞”(也就是前面我們說(shuō)的在NAT上建立一 個(gè)Session),這個(gè)洞不能由外部來(lái)打,只能由內(nèi)網(wǎng)內(nèi)的主機(jī)來(lái)打。而且這個(gè)洞是有方向的,比如從內(nèi)部某臺(tái)主機(jī)(比如:192.168.0.10)向外 部的某個(gè)IP(比如:219.237.60.1)發(fā)送一個(gè)UDP包,那么就在這個(gè)內(nèi)網(wǎng)的NAT設(shè)備上打了一個(gè)方向?yàn)?19.237.60.1的“洞”, (這就是稱為UDP Hole Punching的技術(shù))以后219.237.60.1就可以通過(guò)這個(gè)洞與內(nèi)網(wǎng)的192.168.0.10聯(lián)系了。(但是其他的IP不能利用這個(gè)洞)。
呵呵,現(xiàn)在該輪到我們的正題P2P了。有了上面的理論,實(shí)現(xiàn)兩個(gè)內(nèi)網(wǎng)的主機(jī)通訊就差最后一步了:那就是雞生蛋還是蛋生雞的問(wèn)題了,兩邊都無(wú)法主動(dòng)發(fā)出連接請(qǐng)求,誰(shuí)也不知道誰(shuí)的公網(wǎng)地址,那我們?nèi)绾蝸?lái)打這個(gè)洞呢?我們需要一個(gè)中間人來(lái)聯(lián)系這兩個(gè)內(nèi)網(wǎng)主機(jī)。
現(xiàn)在我們來(lái)看看一個(gè)P2P軟件的流程,以下圖為例:
首先,Client A登錄服務(wù)器,NAT A為這次的Session分配了一個(gè)端口60000,那么Server S收到的Client A的地址是202.187.45.3:60000,這就是Client A的外網(wǎng)地址了。同樣,Client B登錄Server S,NAT B給此次Session分配的端口是40000,那么Server S收到的B的地址是187.34.1.56:40000。
此時(shí),Client A與Client B都可以與Server S通信了。如果Client A此時(shí)想直接發(fā)送信息給Client B,那么他可以從Server S那兒獲得B的公網(wǎng)地址187.34.1.56:40000,是不是Client A向這個(gè)地址發(fā)送信息Client B就能收到了呢?答案是不行,因?yàn)槿绻@樣發(fā)送信息,NAT B會(huì)將這個(gè)信息丟棄(因?yàn)檫@樣的信息是不請(qǐng)自來(lái)的,為了安全,大多數(shù)NAT都會(huì)執(zhí)行丟棄動(dòng)作)。現(xiàn)在我們需要的是在NAT B上打一個(gè)方向?yàn)?02.187.45.3(即Client A的外網(wǎng)地址)的洞,那么Client A發(fā)送到187.34.1.56:40000的信息,Client B就能收到了。這個(gè)打洞命令由誰(shuí)來(lái)發(fā)呢,呵呵,當(dāng)然是Server S。
總結(jié)一下這個(gè)過(guò)程:如果Client A想向Client B發(fā)送信息,那么Client A發(fā)送命令給Server S,請(qǐng)求Server S命令Client B向Client A方向打洞。呵呵,是不是很繞口,不過(guò)沒(méi)關(guān)系,想一想就很清楚了,何況還有源代碼呢(侯老師說(shuō)過(guò):在源代碼面前沒(méi)有秘密 8)),然后Client A就可以通過(guò)Client B的外網(wǎng)地址與Client B通信了。
注意:以上過(guò)程只適合于Cone NAT的情況,如果是Symmetric NAT,那么當(dāng)Client B向Client A打洞的端口已經(jīng)重新分配了,Client B將無(wú)法知道這個(gè)端口(如果Symmetric NAT的端口是順序分配的,那么我們或許可以猜測(cè)這個(gè)端口號(hào),可是由于可能導(dǎo)致失敗的因素太多,我們不推薦這種猜測(cè)端口的方法).
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。