在企業(yè)構(gòu)建容災(zāi)系統(tǒng)時,有兩個至關(guān)重要的指標(biāo),這就是RPO和RTO。這兩個指標(biāo)的高低,決定了企業(yè)需要建立的容災(zāi)系統(tǒng)的級別。從前文的表格中我們不難看出,不同容災(zāi)方案的RTO和RPO是不相同的。
RPO可簡單地描述為企業(yè)能容忍的最大數(shù)據(jù)丟失量,它是反映恢復(fù)數(shù)據(jù)完整性的指標(biāo)。在同步數(shù)據(jù)復(fù)制方式下,RPO等于數(shù)據(jù)傳輸時延的時間;在異步數(shù)據(jù)復(fù)制方式下,RPO基本為異步傳輸數(shù)據(jù)排隊的時間。
在實(shí)際應(yīng)用中,考慮到數(shù)據(jù)傳輸因素,業(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫的一致性(SCN)是不相同的,RPO表示業(yè)務(wù)數(shù)據(jù)庫與容災(zāi)備份數(shù)據(jù)庫的SCN的時間差。發(fā)生災(zāi)難后,啟動容災(zāi)系統(tǒng)完成數(shù)據(jù)恢復(fù),RPO就是新恢復(fù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)損失量。
RTO可簡單地描述為企業(yè)能容忍的恢復(fù)時間,它是反映業(yè)務(wù)恢復(fù)及時性的指標(biāo),表示業(yè)務(wù)從中斷到恢復(fù)正常所需的時間。RTO值越小,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強(qiáng)。各種容災(zāi)解決方案的RTO有較大差別,基于光通道技術(shù)的同步數(shù)據(jù)復(fù)制,配合異地備用的業(yè)務(wù)系統(tǒng)和跨業(yè)務(wù)中心與備份中心的高可用管理,這種容災(zāi)解決方案具有最小的RTO。容災(zāi)系統(tǒng)為獲得最小的RTO,需要投入大量資金。在RTO中,還有一個比較重要的時間段,我們稱之為網(wǎng)絡(luò)恢復(fù)時間(NRO)。
當(dāng)然,在災(zāi)難恢復(fù)的關(guān)鍵指標(biāo)中,RTO和RPO僅僅是兩個較為突出的代表,也不能僅通過它們的數(shù)值來判斷容災(zāi)體系和效果的好壞。RTO和RPO越小,可以說容災(zāi)系統(tǒng)效果越好,但從經(jīng)濟(jì)角度考慮,最佳的容災(zāi)解決方案不一定是最適合的容災(zāi)解決方案。容災(zāi)系統(tǒng)的總體投入(TCO)和投資回報(ROI)對于許多用戶來說是十分重要的設(shè)計指標(biāo)。TCO包括建立系統(tǒng)、維護(hù)系統(tǒng)和擴(kuò)充系統(tǒng)的總投入。由于容災(zāi)系統(tǒng)的啟用概率很低,新技術(shù)的發(fā)展和新產(chǎn)品性價比的提高必定造成容災(zāi)設(shè)備的貶值。另外,IT系統(tǒng)的任何軟硬件變化都會引起容災(zāi)系統(tǒng)相應(yīng)的變化,勢必加大對系統(tǒng)升級的投入。要想把這種變化的影響減到最小,容災(zāi)系統(tǒng)的靈活性和兼容性也應(yīng)該是十分重要的指標(biāo)。
災(zāi)難(Disaster)
由于人為或自然的原因,造成信息系統(tǒng)嚴(yán)重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務(wù)功能停頓或服務(wù)水平不可接受、達(dá)到特定時間的突發(fā)性事件。通常導(dǎo)致信息系統(tǒng)需要切換到災(zāi)難備份中心運(yùn)行。
災(zāi)難恢復(fù)(Disaster Recovery)
為了將信息系統(tǒng)從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運(yùn)行狀態(tài)、并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài),而設(shè)計的活動和流程。
災(zāi)難恢復(fù)規(guī)劃DRP(Disaster Recovery Planning)
為了減少災(zāi)難帶來的損失和保證信息系統(tǒng)所支持的關(guān)鍵業(yè)務(wù)功能在災(zāi)難發(fā)生后能及時恢復(fù)和繼續(xù)運(yùn)作所做的事前計劃和安排。
災(zāi)難備份中心(Backup Center for Disaster Recovery)/備用站點(diǎn)(Alternate Site)
用于災(zāi)難發(fā)生后接替主系統(tǒng)進(jìn)行數(shù)據(jù)處理和支持關(guān)鍵業(yè)務(wù)功能運(yùn)作的場所,可提供災(zāi)難備份系統(tǒng)、備用的基礎(chǔ)設(shè)施和技術(shù)支持及運(yùn)行維護(hù)管理能力,此場所內(nèi)或周邊可提供備用的生活設(shè)施。
同步方式是指主/備中心磁盤陣列同步地進(jìn)行數(shù)據(jù)更新。前端應(yīng)用系統(tǒng)的I/O寫入主磁盤陣列后(寫入Cache中),主磁盤陣列將利用自身的機(jī)制同時將I/O寫入后備磁盤陣列;后備磁盤陣列確認(rèn)后,主中心磁盤陣列才返回應(yīng)用的寫操作完成信息。
異步方式是指應(yīng)用系統(tǒng)的I/O寫入主磁盤陣列后(寫入Cache中),主磁盤陣列立即向前端應(yīng)用系統(tǒng)返回“寫完成”信息,主機(jī)應(yīng)用可以繼續(xù)進(jìn)行I/O操作。同時,主中心磁盤陣列將利用自身的機(jī)制將I/O寫入后備磁盤陣列,實(shí)現(xiàn)數(shù)據(jù)保護(hù)。