近年來,很多企業(yè)都在面臨一大難題,即:如何對他們的基礎(chǔ)設(shè)施、技術(shù)和網(wǎng)絡(luò)進行災(zāi)難備份與恢復(fù),以保證其業(yè)務(wù)連續(xù)性。
一個高性價比的容災(zāi)解決方案可以幫助企業(yè)以一定的IT投入獲得最大的產(chǎn)出,同時很好地保護企業(yè)的業(yè)務(wù)免于災(zāi)難事件的影響。
在多年以前的主機時代,很多企業(yè)選擇建設(shè)第二數(shù)據(jù)中心,以此來平衡生產(chǎn)中心的工作量,并對企業(yè)的備份能力進行測試和改進,從而滿足業(yè)務(wù)運營的要求并提供災(zāi)難恢復(fù)保障。
隨著時代的變遷,數(shù)據(jù)中心的工作量不斷膨脹,對第二數(shù)據(jù)中心的管理和協(xié)調(diào)也越來越困難。為滿足由于業(yè)務(wù)增長而急劇增加的數(shù)據(jù)量對數(shù)據(jù)中心的要求,更大、更復(fù)雜的數(shù)據(jù)中心環(huán)境開始出現(xiàn)。
除此之外,眾多分布式技術(shù)平臺和安裝在各種層面上的系統(tǒng)軟件不斷出現(xiàn),而網(wǎng)絡(luò)技術(shù)的發(fā)展也使得“隨時隨地任意互聯(lián)”成為可能。
很多企業(yè)開始認識到技術(shù)已經(jīng)越來越難以維護和管理,這不僅增加了維持災(zāi)難恢復(fù)能力的復(fù)雜性,也導(dǎo)致了管理一個完全冗余的第二數(shù)據(jù)中心無法實現(xiàn),特別是考慮到對財務(wù)、運營和技術(shù)方面的整體影響。
為了幫助解決這些問題,IT服務(wù)提供商引進了多企業(yè)共享災(zāi)難恢復(fù)設(shè)施的概念——建設(shè)一個配備各種必需技術(shù)的綜合基礎(chǔ)設(shè)施,它可以被虛擬地劃分為任意大小并進行相應(yīng)的配置。這一“熱站”概念為客戶的個性化需求提供了一個資源池,并且全部都由第三方供應(yīng)商在異地管理,因此可以遠離企業(yè)的生產(chǎn)中心。這第一次證明了虛擬化災(zāi)難恢復(fù)策略的可實現(xiàn)性。
了解虛擬化方法
從整體上看,虛擬化方法的主要好處是可以通過整合來實現(xiàn)規(guī)模效應(yīng)。大量的服務(wù)器、存儲和網(wǎng)絡(luò)集中在一個資源池中管理,并可以按需配置。從災(zāi)難恢復(fù)的角度來看,當災(zāi)難發(fā)生時,資源池可以配置更多的容量和網(wǎng)絡(luò)接入來幫助恢復(fù)主要生產(chǎn)環(huán)境。虛擬化方法有其獨特的吸引力,但還需要考慮很多潛在的因素。
在虛擬化技術(shù)下,服務(wù)提供商可以在個性化需求的基礎(chǔ)上為企業(yè)提供約定的資源。為實現(xiàn)對硬件的最大化利用,單一物理設(shè)備將被虛擬化為多個分區(qū),從而實現(xiàn)對多個環(huán)境進行恢復(fù)。同時,這種方式也允許企業(yè)只購買其需要的資源。
隨著時間的推移,對分布式處理恢復(fù)的更大需求越來越明顯和必要。企業(yè)開始認識到利用軟件去裝備虛擬機器的技術(shù),這種技術(shù)可以在恢復(fù)場地的獨立硬件設(shè)備上進行恢復(fù),同時使得明確和描述恢復(fù)過程變得更加容易——只需明確定義備份,以及嚴格遵守硬件的具體要求即可。假設(shè)容量、存儲和界面足夠充分可以為每個個體提供相等或更多吞吐量,就可以實現(xiàn)大量的虛擬機器恢復(fù)到一個物理點上。
虛擬化災(zāi)難恢復(fù)策略的要點
在使用虛擬化災(zāi)難恢復(fù)策略時需要考慮以下要點:
1、恢復(fù)容量
制定虛擬化災(zāi)難恢復(fù)策略的時候很重要的一點是考慮容量。企業(yè)通常會認為恢復(fù)時容量利用率不會超過100%.事實上,由于恢復(fù)的啟動階段會將系統(tǒng)推向極致,所需容量可能會超過生產(chǎn)容量。此外,恢復(fù)過程中有大量的跟進工作,這些工作也需要容量。
2、配套資源
恢復(fù)能力雖然是需要考慮的重點,但其它各種支持生產(chǎn)環(huán)境的要素也要考慮在內(nèi)。這些要素包括處理器資源(存儲、設(shè)備界面等)、磁盤資源(存儲陣列、存儲場地網(wǎng)絡(luò)SANs、磁盤簇等)、外圍設(shè)備(控制單元、終端、刀片等)、基礎(chǔ)設(shè)施(外部交換機)和網(wǎng)絡(luò)連通性(交換機、帶寬等)。
3、資源獨立、網(wǎng)絡(luò)冗余和可測量性
避免災(zāi)難恢復(fù)失敗的一個重點是確保虛擬化資源保持獨立,而不需要依賴主生產(chǎn)環(huán)境。網(wǎng)絡(luò)冗余是指不僅為內(nèi)部用戶,還必須為外部用戶(如客戶、業(yè)務(wù)伙伴、供應(yīng)商等)提供接入。可測量性則是處理災(zāi)難恢復(fù)和生產(chǎn)運營的工作量峰值所必需的。
4、恢復(fù)計劃測試
制定虛擬化災(zāi)難恢復(fù)策略非常重要的一點是考慮對計劃的有效測試。測試應(yīng)在系統(tǒng)層面上全面進行,以有效地了解特定時間段內(nèi)工作量對虛擬化資源的要求,同時驗證業(yè)務(wù)的完整性和基礎(chǔ)設(shè)施的有效性。雖然局部的功能測試更容易安排,但卻無法保證測試結(jié)果的真實性,因此會導(dǎo)致測試的效果大打折扣。
5、重設(shè)工作量計劃
不論是真實情況下還是演練過程中,恢復(fù)時都應(yīng)該制定詳細的計劃來管理整個過程中不斷變化的工作量。該計劃應(yīng)該包括一份高層認可的正式時間表,一份恢復(fù)時資源分配的備選工作計劃,一個對偏移工作量的日常備份流程,以及一份在備用場地復(fù)原這些工作的經(jīng)過測試的恢復(fù)計劃。
6、災(zāi)難恢復(fù)風(fēng)險控制
在制定虛擬化災(zāi)難恢復(fù)策略時應(yīng)考慮到給業(yè)務(wù)帶來的風(fēng)險。由于虛擬化的固有弱點,距離可能會受到限制,但地理的多樣性必須被考慮在內(nèi)?;謴?fù)場所應(yīng)該與企業(yè)已有的風(fēng)險規(guī)避策略所明確的風(fēng)險承受能力相符,而不應(yīng)該是滿足技術(shù)要求的結(jié)果。
7、清晰明確的工作量
在確定構(gòu)成虛擬池的具體資源之前,很重要的一點是要了解災(zāi)難恢復(fù)的工作量。明確業(yè)務(wù)的優(yōu)先次序和臨界點,制定出與處理流程、應(yīng)用的集成和相互依賴性、以及IT支持模塊相關(guān)的詳細計劃,從而保證虛擬化環(huán)境的可恢復(fù)性。
8、保持完整性的規(guī)則
包括問題、變更、事件、配置和資產(chǎn)管理在內(nèi)的嚴格的系統(tǒng)管理規(guī)則是實施任何新的虛擬化災(zāi)難恢復(fù)策略的前提。這對保持恢復(fù)環(huán)境的完整性是至關(guān)重要的,同時對虛擬化資源池的最終操作、監(jiān)控和維護的有效性也是至關(guān)重要的。
9、業(yè)務(wù)和IT報告
對災(zāi)難恢復(fù)項目進程的跟蹤、狀態(tài)的傳遞和結(jié)果的報告是所有災(zāi)難恢復(fù)項目的重要輸出,對于判斷IT功能虛擬化所進行的大量投入的效果是非常重要的。