在進(jìn)入集群系統(tǒng)架構(gòu)探討之前,先定義一些專門術(shù)語:
1. 集群(Cluster):是一組獨立的計算機系統(tǒng)構(gòu)成一個松耦合的多處理器系統(tǒng),它們之間通過網(wǎng)絡(luò)實現(xiàn)進(jìn)程間的通信。應(yīng)用程序可以通過網(wǎng)絡(luò)共享內(nèi)存進(jìn)行消息傳送,實現(xiàn)分布式計算機。
2. 負(fù)載均衡(Load Balance):先得從集群講起,集群就是一組連在一起的計算機,從外部看它是一個系統(tǒng),各節(jié)點可以是不同的操作系統(tǒng)或不同硬件構(gòu)成的計算機。如一個提供Web服務(wù)的集群,對外界來看是一個大Web服務(wù)器。不過集群的節(jié)點也可以單獨提供服務(wù)。
3. 特點:在現(xiàn)有網(wǎng)絡(luò)結(jié)構(gòu)之上,負(fù)載均衡提供了一種廉價有效的方法擴展服務(wù)器帶寬和增加吞吐量,加強網(wǎng)絡(luò)數(shù)據(jù)處理能力,提高網(wǎng)絡(luò)的靈活性和可用性。集群系統(tǒng)(Cluster)主要解決下面幾個問題:
高可靠性(HA):利用集群管理軟件,當(dāng)主服務(wù)器故障時,備份服務(wù)器能夠自動接管主服務(wù)器的工作,并及時切換過去,以實現(xiàn)對用戶的不間斷服務(wù)。
高性能計算(HP):即充分利用集群中的每一臺計算機的資源,實現(xiàn)復(fù)雜運算的并行處理,通常用于科學(xué)計算領(lǐng)域,比如基因分析,化學(xué)分析等。
負(fù)載平衡:即把負(fù)載壓力根據(jù)某種算法合理分配到集群中的每一臺計算機上,以減輕主服務(wù)器的壓力,降低對主服務(wù)器的硬件和軟件要求。
目前比較常用的負(fù)載均衡技術(shù)主要有:
1. 基于DNS的負(fù)載均衡
通過DNS服務(wù)中的隨機名字解析來實現(xiàn)負(fù)載均衡,在DNS服務(wù)器中,可以為多個不同的地址配置同一個名字,而最終查詢這個名字的客戶機將在解析這個名字時得到其中一個地址。因此,對于同一個名字,不同的客戶機會得到不同的地址,他們也就訪問不同地址上的Web服務(wù)器,從而達(dá)到負(fù)載均衡的目的。
2. 反向代理負(fù)載均衡 (如Apache+JK2+Tomcat這種組合)
使用代理服務(wù)器可以將請求轉(zhuǎn)發(fā)給內(nèi)部的Web服務(wù)器,讓代理服務(wù)器將請求均勻地轉(zhuǎn)發(fā)給多臺內(nèi)部Web服務(wù)器之一上,從而達(dá)到負(fù)載均衡的目的。這種代理方式與普通的代理方式有所不同,標(biāo)準(zhǔn)代理方式是客戶使用代理訪問多個外部Web服務(wù)器,而這種代理方式是多個客戶使用它訪問內(nèi)部Web服務(wù)器,因此也被稱為反向代理模式。
3. 基于NAT(Network Address Translation)的負(fù)載均衡技術(shù) (如Linux Virtual Server,簡稱LVS)
網(wǎng)絡(luò)地址轉(zhuǎn)換為在內(nèi)部地址和外部地址之間進(jìn)行轉(zhuǎn)換,以便具備內(nèi)部地址的計算機能訪問外部網(wǎng)絡(luò),而當(dāng)外部網(wǎng)絡(luò)中的計算機訪問地址轉(zhuǎn)換網(wǎng)關(guān)擁有的某一外部地址時,地址轉(zhuǎn)換網(wǎng)關(guān)能將其轉(zhuǎn)發(fā)到一個映射的內(nèi)部地址上。因此如果地址轉(zhuǎn)換網(wǎng)關(guān)能將每個連接均勻轉(zhuǎn)換為不同的內(nèi)部服務(wù)器地址,此后外部網(wǎng)絡(luò)中的計算機就各自與自己轉(zhuǎn)換得到的地址上服務(wù)器進(jìn)行通信,從而達(dá)到負(fù)載分擔(dān)的目的。
介紹完上面的集群技術(shù)之后,下面就基于Tomcat的集群架構(gòu)方案進(jìn)行說明:
上面是采用了Apache httpd作為web服務(wù)器的,即作為Tomcat的前端處理器,根據(jù)具體情況而定,有些情況下是不需要Apache httpd作為 web 服務(wù)器的,如系統(tǒng)展現(xiàn)沒有靜態(tài)頁面那就不需要Apache httpd,那時可以直接使用Tomcat作為web 服務(wù)器來使用。使用Apache httpd主要是它在處理靜態(tài)頁面方面的能力比Tomcat強多了。
1、 用戶的網(wǎng)頁瀏覽器做完本地 DNS和企業(yè)授權(quán)的DNS之的請求/響應(yīng)后,這時候企業(yè)授權(quán)的DNS(即21cn BOSS DNS)會給用戶本地的DNS服務(wù)器提供一個NAT請求分配器(即網(wǎng)關(guān))IP。
2、 NAT分配器,它會根據(jù)特定的分配算法,來決定要將連接交給哪一臺內(nèi)部 Apache httpd來處理請求。大多數(shù)的NAT請求分配器提供了容錯能力:根據(jù)偵測各種WEB服務(wù)器的失效狀況,停止將請求分配給已經(jīng)宕掉的服務(wù)器。并且有些分配器還可以監(jiān)測到WEB服務(wù)器機器的負(fù)載情況,并將請求分配給負(fù)載最輕的服務(wù)器等等。Linux Virtual Server是一個基于Linux操作系統(tǒng)上執(zhí)行的VS-NAT開源軟件套件,而且它有豐富的功能和良好的說明文件。商業(yè)硬件解決方案 Foundry Networks的ServerIron是目前業(yè)界公認(rèn)最佳的請求分配器之一。
3、 Apache httpd + Mod_JK2在這里是作為負(fù)載均衡器,那為什么要做集群呢?如果集群系統(tǒng)要具備容錯能力,以便在任何單一的硬件或軟件組件失效時還能100%可用,那么集群系統(tǒng)必須沒有單點故障之憂。所以,不能只架設(shè)一臺有mod_jk2的Apache httpd,因為如果 httpd或mod_jk2失效了,將不會再有請求被會送交到任何一個Tomcat 實例。這種情況下,Apache httpd就是瓶勁,特別在訪問量大的網(wǎng)站。
4、 Mod_JK2負(fù)載均衡與故障復(fù)原,決定把Apache httpd當(dāng)成web服務(wù)器,而且使用mod_jk2將請求傳送給Tomcat,則可以使用mod_jk2的負(fù)載均衡與容錯功能。在集群系統(tǒng)中,帶有mod_jk2的Apache httpd可以做的事情包括:
A、 將請求分配至一或多個Tomcat實例上
你可以在mod_jk2的workers.properties文件中,設(shè)定許多Tomcat實例,并賦于每個實例一個lb_factor值,以作為請求分配的加權(quán)因子。
B、 偵測Tomcat實例是否失敗
當(dāng)Tomcat實例的連接器服務(wù)不再響應(yīng)時,mod_jk2會及時偵測到,并停止將請求送給它。其他的Tomcat實例則會接受失效實例的負(fù)載。
C、 偵測Tomcat實例在失效后的何時恢復(fù)
因連接器服務(wù)失效,而停止將請求分配給Tomcat實例之后,mod_jk2會周期性地檢查是否已恢復(fù)使用性,并自動將其加入現(xiàn)行的Tomcat實例池中。
5、 Tomcat中的集群原理是通過組播的方式進(jìn)行節(jié)點的查找并使用TCP連接進(jìn)行會話的復(fù)制。這里提示一下就是,對每個請求的處理,Tomcat都會進(jìn)行會話復(fù)制,復(fù)制后的會話將會慢慢變得龐大。
6、 Mod_jk2同時支持會話親和和會話復(fù)制。在tomcat 5中如何實現(xiàn)會話親和和會話復(fù)制?把server.xml中的標(biāo)簽去掉就實現(xiàn)會話親和,把標(biāo)簽加上就實現(xiàn)會話復(fù)制。
7、 會話親和:就是表示來自同會話的所有請求都由相同的Tomcat 實例來處理,這種情況下,如果Tomcat實例或所執(zhí)行的服務(wù)器機器失效,也會喪失Servlet的會話數(shù)據(jù)。即使在集群系統(tǒng)中執(zhí)行更多的Tomcat實例,也永遠(yuǎn)不會復(fù)制會話數(shù)據(jù)。這樣是提高集群性能的一種方案,但不具備有容錯能力了。
8、 使用會話復(fù)制,則當(dāng)一個Tomcat實例宕掉時,由于至少還有另一個Tomcat實例保有一份會話狀態(tài)數(shù)據(jù),因而數(shù)據(jù)不會喪失。但性能會有所降低。