1、概念
實現(xiàn)這個反向代理能力并不能算是一個特別復雜的任務,但是在負載均衡中要求特別高的效率,這樣實現(xiàn)起來就不是十分簡單的了。每針對一次代理,代理服務器就 必須打開兩個連接,一個為對外的連接,一個為對內(nèi)的連接,因此對于連接請求數(shù)量非常大的時候,代理服務器的負載也就非常之大了,在最后反向代理服務器會成 為服務的瓶頸。例如,使用Apache的mod_rproxy模塊來實現(xiàn)負載均衡功能時,提供的并發(fā)連接數(shù)量受Apache本身的并發(fā)連接數(shù)量的限制。一 般來講,可以使用它來對連接數(shù)量不是特別大,但每次連接都需要消耗大量處理資源的站點進行負載均衡,例如搜尋。
使用反向代理的好處是,可以將負載均衡和代理服務器的高速緩存技術結合在一起,提供有益的性能,具備額外的安全性,外部客戶不能直接訪問真實的服務器。并且實現(xiàn)起來可以實現(xiàn)較好的負載均衡策略,將負載可以非常均衡的分給內(nèi)部服務器,不會出現(xiàn)負載集中到某個服務器的偶然現(xiàn)象。
2、nginx 實現(xiàn)反向代理負載均衡
1)環(huán)境:
a. 本地使用Windows系統(tǒng),然后使用VirutalBox安裝一個虛擬的Linux系統(tǒng)。
在本地的Windows系統(tǒng)上分別安裝nginx(偵聽8080端口)和apache(偵聽80端口)。在虛擬的Linux系統(tǒng)上安裝apache(偵聽80端口)。這樣相當于擁有了1臺nginx在前端作為反向代理服務器;后面有2臺apache作為應用程序服務器(可以看作是小型的server cluster。);
b. nginx用來作為反向代理服務器,放置到兩臺apache之前,作為用戶訪問的入口;
nginx僅僅處理靜態(tài)頁面,動態(tài)的頁面(php請求)統(tǒng)統(tǒng)都交付給后臺的兩臺apache來處理。也就是說,可以把網(wǎng)站的靜態(tài)頁面或者文件放置到nginx的目錄下;動態(tài)的頁面和數(shù)據(jù)庫訪問都保留到后臺的apache服務器上。
c. 如下兩種方法實現(xiàn)server cluster的負載均衡。
假設前端nginx(為127.0.0.1:8080)僅僅包含一個靜態(tài)頁面index.html;后 臺的兩個apache服務器(分別為localhost:80和158.37.70.143:80),一臺根目錄放置phpMyAdmin文件夾和 test.php(里面測試代碼為print "server1";),另一臺根目錄僅僅放置一個test.php(里面測試代碼為print "server2";)。
2)針對不同請求的負載均衡:
a. 在最簡單地構建反向代理的時候(nginx僅僅處理靜態(tài)不處理動態(tài)內(nèi)容,動態(tài)內(nèi)容交給后臺的apache server來處理),具體的設置為:在nginx.conf中修改:
location ~ \.php$ {
proxy_pass 158.37.70.143:80;
}
>;這樣當客戶端訪問localhost:8080/index.html的時候,前端的nginx會自動進行響應;
>;當用戶訪問localhost:8080/test.php的時候(這個時候nginx目錄下根本就沒有該文件),但是通過上面的設置location ~ \.php$(表示正則表達式匹配以.php結尾的文件,詳情參看location是如何定義和匹配的
),nginx服務器會自動pass給158.37.70.143的apache服務器了。該服務器下的test.php就會被自動解析,然后將html的 結果頁面返回給nginx,然后nginx進行顯示(如果nginx使用memcached模塊或者squid還可以支持緩存),輸出結果為打印 server2。
如上是最為簡單的使用nginx做為反向代理服務器的例子;
b. 我們現(xiàn)在對如上例子進行擴展,使其支持如上的兩臺服務器。
設置nginx.conf的server模塊部分,將對應部分修改為:
location ^~ /phpMyAdmin/ {
proxy_pass 127.0.0.1:80;
}
location ~ \.php$ {
proxy_pass 158.37.70.143:80;
}
上面第一個部分location ^~ /phpMyAdmin/,表示不使用正則表達式匹配(^~),而是直接匹配,也就是如果客戶端訪問的URL是以
http://localhost:8080/phpMyAdmin/開頭的話(本地的nginx目錄下根本沒有phpMyAdmin目錄),nginx會自動pass到127.0.0.1:80的Apache服務器,該服務器對phpMyAdmin目錄下的頁面進行解析,然后將結果發(fā)送給nginx,后者顯示;
如果客戶端訪問URL是http://localhost/test.php的話,則會被pass到158.37.70.143:80的apache進行處理。
因此綜上,實現(xiàn)了針對不同請求的負載均衡。
>;如果用戶訪問靜態(tài)頁面index.html,最前端的nginx直接進行響應;
>;如果用戶訪問test.php頁面的話,158.37.70.143:80的Apache進行響應;
>;如果用戶訪問目錄phpMyAdmin下的頁面的話,127.0.0.1:80的Apache進行響應;
3)訪問同一頁面的負載均衡:
即用戶訪問http://localhost:8080/test.php這個同一頁面的時候,實現(xiàn)了兩臺服務器的負載均衡(實際情況中,這兩個服務器上的數(shù)據(jù)要求同步一致,這里我們分別定義了打印server1和server2是為了進行辨認區(qū)別)。
a. 現(xiàn)在的情況是在windows下nginx是localhost偵聽8080端口;
兩臺apache,一臺是127.0.0.1:80(包含test.php頁面但是打印server1),另一臺是虛擬機的158.37.70.143:80(包含test.php頁面但是打印server2)。
b. 因此重新配置nginx.conf為:
>;首先在nginx的配置文件nginx.conf的http模塊中添加,服務器集群server cluster(我們這里是兩臺)的定義:
upstream myCluster{
server 127.0.0.1:80;
server 158.37.70.143:80;
}
表示這個server cluster包含2臺服務器
>;然后在server模塊中定義,負載均衡:
location ~ \.php$ {
proxy_pass http://myCluster; #這里的名字和上面的cluster的名字相同
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For$proxy_add_x_forwarded_for;
}
這樣的話,如果訪問
http://localhost:8080/test.php頁面的話,nginx目錄下根本沒有該文件,但是它會自動將其pass到myCluster定義的服務區(qū)機群中,分別由127.0.0.1:80;或者158.37.70.143:80;來做處理。上面在定義upstream的時候每個server之后沒有定義權重,表示兩者均衡;如果希望某個更多響應的話例如:
upstream myCluster {
server 127.0.0.1:80 weight=5 max_fails=2 fail_timeout=30s;;
server 158.37.70.143:80 weight=1 max_fails=2 fail_timeout=30s;
}
這樣表示5/6的幾率訪問第一個server,1/6訪問第二個。同時還可以定義max_fails和fail_timeout等參數(shù)。
====================
綜上,通過使用nginx的反向代理服務器reverse proxy server的功能,將其布置到多臺apache server的前端。nginx僅僅用來處理靜態(tài)頁面響應和動態(tài)請求的代理pass,后臺的apache server作為app server來對前臺pass過來的動態(tài)頁面進行處理并返回給nginx。
通過以上的架構,我們可以實現(xiàn)nginx和多臺apache構成的機群cluster的負載均衡。
兩種均衡:
1)可以在nginx中定義訪問不同的內(nèi)容,代理到不同的后臺server;如上例子中的訪問phpMyAdmin目錄代理到第一臺server上;訪問test.php代理到第二臺server上;
2)可以在nginx中定義訪問同一頁面,均衡(當然如果服務器性能不同可以定義權重來均衡)地代理到不同的后臺server上。如上的例子訪問test.php頁面,會均衡地代理到server1或者server2上。
實際應用中,server1和server2上分別保留相同的app程序和數(shù)據(jù),需要考慮兩者的數(shù)據(jù)同步。
簡單總結:
主要通過以下手段實現(xiàn)負載均衡:
location:定義需要匹配的請求(文件或目錄,可以使用正則或不使用正則直接匹配)
proxy_pass:定義需要將請求proxy到地方(某臺主機或者某個upstream cluser集群)