每一個模式描述了一個在我們周圍不斷重復(fù)發(fā)生的問題及該問題解決方案的核心。這樣,你就能一次又一次地使用該方案而不必做重復(fù)工作。 所謂網(wǎng)站架構(gòu)模式即為了解決大型網(wǎng)站面臨的高并發(fā)訪問、海量數(shù)據(jù)、高可靠運(yùn)行等一系列問題與挑戰(zhàn)。為此,在實踐中提出了許多解決方案,以實現(xiàn)網(wǎng)站高性能、高可靠性、易伸縮、可擴(kuò)展、安全等各種技術(shù)架構(gòu)目標(biāo)。
分層是企業(yè)應(yīng)用系統(tǒng)中最常見的一種架構(gòu)模式,將系統(tǒng)在橫向維度上切分成幾個部分,每個部分負(fù)責(zé)一部分相對簡單并比較單一的職責(zé),然后通過上層對下層的依賴和調(diào)度組成一個完整的系統(tǒng)。
在網(wǎng)站的分層架構(gòu)中,常見的為3層,即應(yīng)用層、服務(wù)層、數(shù)據(jù)層。
應(yīng)用層,具體負(fù)責(zé)業(yè)務(wù)和視圖的展示;
服務(wù)層,為應(yīng)用層提供服務(wù)支持;
數(shù)據(jù)層,提供數(shù)據(jù)存儲訪問服務(wù),如數(shù)據(jù)庫、緩存、文件、搜索引擎等。
分層架構(gòu)是邏輯上的,在物理部署上,三層架構(gòu)可以部署在同一個物理機(jī)器上,但是隨著網(wǎng)站業(yè)務(wù)的發(fā)展,必然需要對已經(jīng)分層的模塊分離部署,即三層結(jié)構(gòu)分別部署在不同的服務(wù)器上,使網(wǎng)站擁有更多的計算資源,以應(yīng)對越來越多的用戶訪問。
所以,雖然分層架構(gòu)模式最初的目的,是規(guī)劃軟件清晰的邏輯結(jié)構(gòu),以便于開發(fā)維護(hù)。但在網(wǎng)站的發(fā)展過程中,分層結(jié)構(gòu)對網(wǎng)站支持高并發(fā),向分布式方向的發(fā)展至關(guān)重要。
網(wǎng)站需要7×24小時連續(xù)運(yùn)行,那么就得有相應(yīng)的冗余機(jī)制,以防某臺機(jī)器宕掉時無法訪問,而冗余則可以通過部署至少兩臺服務(wù)器構(gòu)成一個集群實現(xiàn)服務(wù)高可用。數(shù)據(jù)庫除了定期備份還需要實現(xiàn)冷熱備份。甚至可以在全球范圍內(nèi)部署災(zāi)備數(shù)據(jù)中心。
如果說分層是將軟件在橫向方面進(jìn)行切分,那么分隔就是在縱向方面對軟件進(jìn)行切分。
網(wǎng)站越大,功能越復(fù)雜,服務(wù)和數(shù)據(jù)處理的種類也越多,將這些不同的功能和服務(wù)分隔開來,包裝成高內(nèi)聚低耦合的模塊單元,不僅有助于軟件的開發(fā)維護(hù)也便于不同模塊的分布式部署,提高網(wǎng)站的并發(fā)處理能力和功能擴(kuò)展能力。
大型網(wǎng)站分隔的粒度可能會很小。比如在應(yīng)用層,將不同業(yè)務(wù)進(jìn)行分隔,例如將購物、論壇、搜索、廣告分隔成不同的應(yīng)用,有對立的團(tuán)隊負(fù)責(zé),部署在不同的服務(wù)器上。
使用異步,業(yè)務(wù)之間的消息傳遞不是同步調(diào)用,而是將一個業(yè)務(wù)操作分成多個階段,每個階段之間通過共享數(shù)據(jù)的方法異步執(zhí)行進(jìn)行協(xié)作。
具體實現(xiàn)則在單一服務(wù)器內(nèi)部可用通過多線程共享內(nèi)存的方式處理;在分布式系統(tǒng)中可用通過分布式消息隊列來實現(xiàn)異步。
異步架構(gòu)的典型就是生產(chǎn)者消費(fèi)者方式,兩者不存在直接調(diào)用。
對于大型網(wǎng)站,分層和分隔的一個主要目的是為了切分后的模塊便于分布式部署,即將不同模塊部署在不同的服務(wù)器上,通過遠(yuǎn)程調(diào)用協(xié)同工作。分布式意味著可以使用更多的計算機(jī)完同樣的工作,計算機(jī)越多,CPU、內(nèi)存、存儲資源就越多,能過處理的并發(fā)訪問和數(shù)據(jù)量就越大,進(jìn)而能夠為更多的用戶提供服務(wù)。
在網(wǎng)站應(yīng)用中,常用的分布式方案有一下幾種.
分布式應(yīng)用和服務(wù):將分層和分隔后的應(yīng)用和服務(wù)模塊分布式部署,可以改善網(wǎng)站性能和并發(fā)性、加快開發(fā)和發(fā)布速度、減少數(shù)據(jù)庫連接資源消耗。
分布式靜態(tài)資源:網(wǎng)站的靜態(tài)資源如JS、CSS、Logo圖片等資源對立分布式部署,并采用獨(dú)立的域名,即人們常說的動靜分離。靜態(tài)資源分布式部署可以減輕應(yīng)用服務(wù)器的負(fù)載壓力;通過使用獨(dú)立域名加快瀏覽器并發(fā)加載的速度。
分布式數(shù)據(jù)和存儲:大型網(wǎng)站需要處理以P為單位的海量數(shù)據(jù),單臺計算機(jī)無法提供如此大的存儲空間,這些數(shù)據(jù)庫需要分布式存儲。
分布式計算:目前網(wǎng)站普遍使用Hadoop和MapReduce分布式計算框架進(jìn)行此類批處理計算,其特點(diǎn)是移動計算而不是移動數(shù)據(jù),將計算程序分發(fā)到數(shù)據(jù)所在的位置以加速計算和分布式計算。
網(wǎng)站在安全架構(gòu)方面有許多模式:通過密碼和手機(jī)校驗碼進(jìn)行身份認(rèn)證;登錄、交易需要對網(wǎng)絡(luò)通信進(jìn)行加密;為了防止機(jī)器人程序濫用資源,需要使用驗證碼進(jìn)行識別;對常見的XSS攻擊、SQL注入需要編碼轉(zhuǎn)換;垃圾信息需要過濾等。
具體有自動化發(fā)布過程,自動化代碼管理、自動化測試、自動化安全檢測、自動化部署、自動化監(jiān)控、自動化報警、自動化失效轉(zhuǎn)移、自動化失效恢復(fù)等。
對于用戶訪問集中的模塊需要將獨(dú)立部署的服務(wù)器集群化,即多臺服務(wù)器部署相同的應(yīng)用構(gòu)成一個集群,通過負(fù)載均衡設(shè)備共同對外提供服務(wù)。
服務(wù)器集群能夠為相同的服務(wù)提供更多的并發(fā)支持,因此當(dāng)有更多的用戶訪問時,只需要向集群中加入新的機(jī)器即可;另外可以實現(xiàn)當(dāng)其中的某臺服務(wù)器發(fā)生故障時,可以通過負(fù)載均衡的失效轉(zhuǎn)移機(jī)制將請求轉(zhuǎn)移至集群中其他的服務(wù)器上,因此可以提高系統(tǒng)的可用性。
緩存目的就是減輕服務(wù)器的計算,使數(shù)據(jù)直接返回給用戶。在現(xiàn)在的軟件設(shè)計中,緩存已經(jīng)無處不在。具體實現(xiàn)有CDN、反向代理、本地緩存、分布式緩存等。
使用緩存有兩個條件:訪問數(shù)據(jù)熱點(diǎn)不均衡,即某些頻繁訪問的數(shù)據(jù)需要放在緩存中;數(shù)據(jù)在某個時間段內(nèi)有效,不過很快過期,否在會因為數(shù)據(jù)過期而臟讀,影響數(shù)據(jù)的正確性。