做存儲雙活是好,但不能白白浪費(fèi)了存儲陣列軟件

責(zé)任編輯:editor006

2015-05-04 16:51:05

摘自:WatchStor

軟件定義存儲,當(dāng)下存儲行業(yè)最火熱的話題,沒有之一。傳統(tǒng)的三種雙活方式,不僅存在架構(gòu)復(fù)雜、陣列軟件不能復(fù)用等問題,且只對物理故障有效。在這樣的架構(gòu)下,主機(jī)端所分配的卷,就像是在兩套存儲系統(tǒng)之間“漂移”,對主機(jī)端來說,主卷永遠(yuǎn)存儲在主存儲上,從未改變。

軟件定義存儲,當(dāng)下存儲行業(yè)最火熱的話題,沒有之一。從最開始的軟件定義數(shù)據(jù)中心,到軟件定義網(wǎng)絡(luò)與網(wǎng)絡(luò)功能虛擬化(SDN和NFV),這場浪潮最終燒到了數(shù)據(jù)中心最核心也是最復(fù)雜的組成部分——存儲。于是,軟件定義存儲的理念隨之而來。

在這一理念下,軟件應(yīng)當(dāng)在企業(yè)存儲系統(tǒng)中發(fā)揮重要的作用,它可以建立、管理、控制和協(xié)調(diào)存儲資源,而不僅僅是存儲系統(tǒng)的附屬品或是邊緣。

與此同時(shí),有一個(gè)經(jīng)久不衰的話題持續(xù)存在,那就是“雙活”。作為保障業(yè)務(wù)連續(xù)性最堅(jiān)實(shí)的基礎(chǔ),越來越多的企業(yè)開始付諸行動(dòng),正如某業(yè)內(nèi)媒體所撰寫的那樣:“2014年,一個(gè)最顯著的變化是,雙活數(shù)據(jù)中心跨越了概念炒作的階段,被很多企業(yè)用戶所接受。”

存儲系統(tǒng)的雙活解決方案長期以來就是數(shù)據(jù)中心雙活架構(gòu)中的重點(diǎn),這其中的原因不僅是因?yàn)榇鎯ο到y(tǒng)中存儲了企業(yè)最核心的生產(chǎn)數(shù)據(jù),是“萬萬馬虎不得”的核心系統(tǒng),更因?yàn)榕c服務(wù)器(主機(jī)端)雙活、應(yīng)用程序雙活(如Oracle RAC)相比,存儲系統(tǒng)的雙活不僅架構(gòu)復(fù)雜、實(shí)施復(fù)雜,而且往往存在這樣或那樣的問題,

在“臨門一腳”的時(shí)候,往往“活不過來”。

但即便是這樣,存儲系統(tǒng)的雙活解決方案仍然在企業(yè)客戶的數(shù)據(jù)中心遍地開花,可是,許多企業(yè)客戶發(fā)現(xiàn),在軟件定義存儲的大思路之下,數(shù)據(jù)中心內(nèi)的存儲雙活方案,卻成了軟件定義存儲的攔路虎、擋路石。

“嗨!我們還能不能好好的在一起玩耍了?”軟件定義存儲對存儲雙活說到。

存儲雙活 阻礙軟件定義存儲的發(fā)展?

軟件定義存儲和存儲雙活,看起來是八竿子打不著的事情,這兩者之間怎么就產(chǎn)生了互相影響?憑什么說“(某些)存儲雙活解決方案,阻礙了軟件定義存儲的發(fā)展”?這事兒還要從業(yè)界主流的幾種存儲雙活架構(gòu)說起。

存儲雙活的架構(gòu)設(shè)計(jì),從不同的供應(yīng)商的產(chǎn)品特點(diǎn)出發(fā),大致可以歸納為幾類:主機(jī)卷鏡像、虛擬化存儲網(wǎng)關(guān)、外置雙活存儲網(wǎng)關(guān)和存儲內(nèi)嵌雙活+CDP等幾種架構(gòu),其中絕大多數(shù)存儲雙活選擇,由于其架構(gòu)設(shè)計(jì),在實(shí)現(xiàn)存儲雙活后,主機(jī)端與存儲(功能)端被人為的分割開來,從而無法利用陣列本身軟件,軟件定義存儲也就無從談起了。

為什么會發(fā)生這樣的事情呢?還要從其中幾種架構(gòu)的設(shè)計(jì)思路說起。

主機(jī)卷鏡像的方式是早期存儲雙活方案選擇較多的方式,企業(yè)客戶通過采購主機(jī)卷鏡像軟件,保證數(shù)據(jù)從主存儲鏡像到備存儲,這一方案不依賴于具體的存儲品牌,支持存儲雙活,但由于卷鏡像軟件只將存儲系統(tǒng)作為一個(gè)“硬盤池”來使用,無法利用存儲陣列本身的軟件。

除此以外,這一方案還存在額外采購鏡像軟件安裝在所有主機(jī)端所造成的成本和消耗主機(jī)資源、存儲系統(tǒng)/主機(jī)操作系統(tǒng)/虛擬化平臺多平臺兼容性等問題。

更進(jìn)一步,業(yè)內(nèi)一些存儲廠商提出了虛擬化網(wǎng)關(guān)的存儲雙活解決方案,這一方案利用兩層SAN交換機(jī)內(nèi)的存儲網(wǎng)關(guān),將后端存儲進(jìn)行虛擬化,變成虛擬化資源池來使用其容量,將主機(jī)端的IO通過SAN交換機(jī)分發(fā)給兩套存儲系統(tǒng),從而達(dá)到存儲“雙活”的目的——在這一架構(gòu)中,存儲系統(tǒng)只是被虛擬化的資源池,同樣無法利用陣列本身的軟件。

但更為關(guān)鍵的是,在付出了額外購買存儲網(wǎng)關(guān)的成本、接受了新增網(wǎng)關(guān)層可能存在的性能瓶頸問題以及網(wǎng)關(guān)往往不能跨代混用等問題之后,虛擬化存儲網(wǎng)關(guān)的存儲雙活卻并不能夠真正支持存儲雙活——以x86服務(wù)器為基礎(chǔ)的虛擬化存儲網(wǎng)關(guān)雙活控制器集群,雙活的只是網(wǎng)關(guān)內(nèi)的控制器,而不是虛擬化存儲網(wǎng)關(guān)。

基于對虛擬化存儲網(wǎng)關(guān)進(jìn)一步優(yōu)化,外置雙活存儲網(wǎng)關(guān)架構(gòu)被設(shè)計(jì)出來,它采用外置雙活存儲網(wǎng)關(guān),在采購至少兩對(四個(gè))網(wǎng)關(guān)的前提下,這一方案確實(shí)可以提供行業(yè)內(nèi)可靠性幾近最佳的存儲雙活支持,但是,由于存儲系統(tǒng)仍然是依靠存儲網(wǎng)關(guān)實(shí)現(xiàn)數(shù)據(jù)的分配和系統(tǒng)的利用,它仍然無法利用陣列本身的軟件。

在這一方案中,決不可忽略的是成本問題。相對于之前談到的兩個(gè)方案,由于架構(gòu)設(shè)計(jì)的問題,每對網(wǎng)關(guān)對應(yīng)一套存儲系統(tǒng),這意味著必須采購兩對也就是四個(gè)外置存儲網(wǎng)關(guān),“四引擎,八個(gè)控制器”的采購成本,幾乎是此前兩個(gè)方案的兩倍之多。

傳統(tǒng)的三種雙活方式,不僅存在架構(gòu)復(fù)雜、陣列軟件不能復(fù)用等問題,且只對物理故障有效。

那么,有沒有什么辦法,既能夠保證存儲雙活,又能夠利用陣列本身軟件,不破壞“軟件定義存儲的良好愿景”呢?

當(dāng)然有了!你把存儲網(wǎng)關(guān)取消掉,讓主機(jī)端直接連接存儲系統(tǒng)不就得了?!

存儲內(nèi)嵌雙活+CDP:這才是軟件定義存儲的思路

讓存儲雙活回到軟件定義存儲的思路上來,其實(shí)并不像想象中的那么難,一方面,存儲雙活與軟件定義存儲不是對立的,即便是剛才談到的幾種解決方案,都是以軟件為核心的,軟件怎么會“為難”軟件呢?另一方面,之前幾種方案之所以無法釋放陣列的軟件能力,核心原因在于其只是將存儲作為容量池使用,而是將復(fù)雜的軟件功能交付給了存儲網(wǎng)關(guān)或是主機(jī)端,從這個(gè)角度來說,“直連”不就得了?

但主機(jī)端直接連接存儲,實(shí)現(xiàn)存儲雙活是有條件的,這個(gè)條件就是:存儲系統(tǒng)必須要內(nèi)嵌雙活,也就是將原本存儲網(wǎng)關(guān)干的事情納入到存儲系統(tǒng)中去,這就是我們在前文中提到的“存儲內(nèi)嵌雙活+CDP”的模式——咦?為什么要CDP?這件事情我們暫時(shí)按下不表,先把話題集中到雙活架構(gòu)上來。

戴爾Live Volume的“存儲內(nèi)嵌雙活+CDP”架構(gòu)

在戴爾Compellent存儲系統(tǒng)中,有一項(xiàng)內(nèi)嵌技術(shù)叫做LV,這不是LOUIS VUITTON,而是Live Volume,以這一技術(shù)為核心的雙活解決方案是“比純粹數(shù)據(jù)復(fù)制更高級的數(shù)據(jù)中心級別的雙活保護(hù)方案”:Live Volume以流動(dòng)、虛擬化的方式,維持戴爾Compellent SC系列存儲系統(tǒng)之間的數(shù)據(jù)關(guān)系,數(shù)據(jù)卷可以在系統(tǒng)之間以非中斷方式在線數(shù)據(jù)遷移,或者說叫“漂移”。

在雙活架構(gòu)中,主存儲的每一次IO操作,都通過FC或iSCSI鏈路以同步(遠(yuǎn)程站點(diǎn)可以選擇異步)復(fù)制的方式,投射到備(從)存儲上,使兩邊的數(shù)據(jù)保持高度的一致性。

當(dāng)主存儲站點(diǎn)或是通向其的路徑發(fā)生故障,主機(jī)端的IO無法到達(dá)主存儲時(shí),戴爾Compellent SC存儲系統(tǒng)會感知到來自主機(jī)端IO的下降甚至是丟失,在滿足一定的條件時(shí),即完成從動(dòng)態(tài)的交換路徑到自動(dòng)進(jìn)行動(dòng)態(tài)角色交換等一系列動(dòng)作,也就是說,原有的主存儲和備(從)存儲之間交換了身份。

Live Volume的站點(diǎn)交換過程,可以完全保證數(shù)據(jù)的同步。

這一“交換身份”的過程,對主機(jī)來說就像是讓卷動(dòng)態(tài)漂移到了新的主存儲(也就是原來的備份(從)存儲)那里,其技術(shù)實(shí)現(xiàn)和應(yīng)用體驗(yàn)就像是VMware上實(shí)時(shí)在線遷移一臺虛擬機(jī)——Live Volume就像是在主存儲/備(從)存儲系統(tǒng)中創(chuàng)造一個(gè)類似VMware的Hypervisor虛擬化層的存儲抽象層——讓卷可以就像是VMotion一樣,自由的在存儲系統(tǒng)之間漂移。

在這樣的架構(gòu)下,主機(jī)端所分配的卷,就像是在兩套存儲系統(tǒng)之間“漂移”,對主機(jī)端來說,主卷永遠(yuǎn)存儲在主存儲上,從未改變。哪怕主存儲和備(從)存儲之間的角色在1分鐘前剛剛發(fā)生了改變,這正是作為“存儲Hypervisor”的Live Volume的核心技術(shù)優(yōu)勢之一。

虛擬化環(huán)境中,戴爾Compellent SC系列存儲系統(tǒng)基于其應(yīng)用和數(shù)據(jù)流量感知技術(shù),可以感知虛擬機(jī)的在線遷移,在虛擬機(jī)遷移之后,主機(jī)端IO出現(xiàn)變化時(shí),“以最靠近的一套存儲自動(dòng)進(jìn)行動(dòng)態(tài)角色交換”,讓虛擬機(jī)永遠(yuǎn)連接的都是“主存儲系統(tǒng)”。

更進(jìn)一步:兩地三中心和邏輯故障的雙活

說到數(shù)據(jù)中心的故障,IDC有一個(gè)大致的統(tǒng)計(jì)數(shù)字,邏輯故障占53%,硬件故障占47%,這也就意味著,大多數(shù)情況下存儲雙活面對的問題,不是系統(tǒng)宕機(jī)或是站點(diǎn)損毀,而是數(shù)據(jù)壓根兒就是錯(cuò)的——這往往是邏輯故障所造成的。

對于高端存儲應(yīng)用來說,傳統(tǒng)的備份技術(shù)已經(jīng)不能滿足實(shí)時(shí)恢復(fù)邏輯故障的需求,因此,CDP技術(shù)應(yīng)運(yùn)而生,成為企業(yè)客戶避免存儲系統(tǒng)邏輯故障的重要解決方案:CDP技術(shù)通過對數(shù)據(jù)進(jìn)行大量的、高頻率的“拍照”,讓管理員可以選擇將數(shù)據(jù)恢復(fù)到任意時(shí)間點(diǎn)(往往是分鐘級)。

這就是戴爾Compellent SC存儲的“LV”之所以被稱為“存儲內(nèi)嵌雙活+CDP”存儲雙活技術(shù)的原因,通過在Live Volume中內(nèi)嵌CDP技術(shù),一旦發(fā)生存儲雙活系統(tǒng)的邏輯故障,管理員可以從內(nèi)嵌的CDP“設(shè)備(空間)”將數(shù)據(jù)恢復(fù)到主存儲并快速同步到備(從)存儲——與外置CDP不同,這是在存儲系統(tǒng)內(nèi)部進(jìn)行復(fù)制,傳輸速度、延遲和可恢復(fù)性的水平更高。

基于戴爾Live Volume的兩地三中心解決方案示意圖。

兩地三中心解決方案是存儲雙活解決方案的擴(kuò)展,通過在遠(yuǎn)程站點(diǎn)增加一套存儲系統(tǒng),極大的提高了地域接近(大部分情況下就是在同一個(gè)數(shù)據(jù)中心)的雙活存儲在應(yīng)對災(zāi)難災(zāi)害時(shí)的應(yīng)對能力,Live Volume的兩地三中心方案,可以簡單的通過級聯(lián)(近線DR站點(diǎn)異步復(fù)制連接遠(yuǎn)程DR站點(diǎn))和混合(主站點(diǎn)與近線DR站點(diǎn)同步復(fù)制,與遠(yuǎn)程DR站點(diǎn)異步復(fù)制)兩種模式建立,完全不需要調(diào)整原有的雙活架構(gòu),只需要為主存儲增加一個(gè)遠(yuǎn)程連接的外部站點(diǎn)即可。

這就是以Live Volume為基礎(chǔ)的戴爾Compellent SC系列存儲所構(gòu)建的支持硬件故障和邏輯故障的高可用性存儲雙活和兩地三中心災(zāi)難恢復(fù)功能的組合,作為一款可以感知主機(jī)端IO和虛擬機(jī)位置變化的解決方案,它可以支持動(dòng)態(tài)性能調(diào)整、零停機(jī)存儲維護(hù)、跨數(shù)據(jù)中心數(shù)據(jù)遷移以及虛擬機(jī)(微軟、VMware或是其他Hypervisor)動(dòng)態(tài)遷移等多種對存儲系統(tǒng)頗有點(diǎn)考驗(yàn)的需求。

原生存儲雙活:架構(gòu)簡單 功能強(qiáng)大

戴爾Live Volume為企業(yè)客戶實(shí)現(xiàn)存儲雙活及兩地三中心高可用性,提供了一整套完整的解決方案,滿足了企業(yè)客戶在邏輯故障和物理故障兩個(gè)層面對存儲系統(tǒng)高可用性的需求,但在企業(yè)級IT市場,最終實(shí)現(xiàn)的結(jié)果只占企業(yè)客戶實(shí)際意義的百分之五十,另有百分之五十在意的,是實(shí)現(xiàn)的過程——是否簡單?是否風(fēng)險(xiǎn)小?是否具有良好的延續(xù)性?

這正是戴爾Live Volume技術(shù)廣泛受到戴爾Compellent系列存儲用戶歡迎的原因,在全球主流存儲廠商中第一個(gè)將存儲雙活高可用性技術(shù)加入到存儲系統(tǒng)的軟件平臺中,戴爾必然是經(jīng)過深思熟慮的(被戴爾公司收購以前,Live Volume就是Compellent流動(dòng)數(shù)據(jù)跨越多套存儲構(gòu)建存儲云的核心技術(shù))。

一方面,在前面我們就提到過,作為“存儲內(nèi)嵌雙活+CDP”,戴爾Live Volume既不需要從外部設(shè)備恢復(fù)數(shù)據(jù),也不需要經(jīng)由復(fù)雜的路徑進(jìn)行數(shù)據(jù)復(fù)制和恢復(fù),這意味著更好的效率,更快的傳輸速度和更低的恢復(fù)風(fēng)險(xiǎn)。

另一方面,在一個(gè)經(jīng)典的計(jì)算、存儲、網(wǎng)絡(luò)三層模型中,戴爾Live Volume “原生雙活”的實(shí)現(xiàn)架構(gòu)中避免了增加外置虛擬化網(wǎng)關(guān)或其他IT設(shè)備,避免了對數(shù)據(jù)中心存儲架構(gòu)的后天改造,更降低了方案的復(fù)雜性——既然存儲系統(tǒng)自帶“原生雙活”,為什么還要去選擇復(fù)雜的非原生方案?

第三,戴爾Live Volume的雙活解決方案具有極高的靈活性和經(jīng)濟(jì)性,在鏈路選擇方面,企業(yè)客戶可以選擇FC或是IP路徑連接,復(fù)用裸光纖iSCSI遠(yuǎn)程復(fù)制這樣的架構(gòu)“容忍度”,可以幫助企業(yè)客戶節(jié)省昂貴的FC直連費(fèi)用;另一方面,無論是本地站點(diǎn)還是遠(yuǎn)程站點(diǎn),戴爾的方案都支持同步或異步兩種方式,且支持動(dòng)態(tài)調(diào)整,在鏈路狀況不穩(wěn)定(這種事情在中國非常常見)的情況下,企業(yè)客戶可以選擇不同的復(fù)制方式。

第四,也是最重要的,Live Volume不是以“屏蔽”存儲陣列自身的軟件為條件的雙活甚至多活方案,豐富的存儲軟件功能是戴爾存儲在市場上的核心競爭力之一,如果為了增加一項(xiàng)功能而放棄整個(gè)“森林”,不僅企業(yè)客戶不會答應(yīng),對于將數(shù)據(jù)中心業(yè)務(wù)重點(diǎn)放在存儲上的戴爾公司來說,也是一個(gè)絕對不能夠承受的損失。

試想,如果未來真的實(shí)現(xiàn)了“控制平面與數(shù)據(jù)平面分離”的軟件定義存儲,控制平面具有極強(qiáng)的存儲軟件甚至是多融合平臺軟件能力(這從當(dāng)前新的企業(yè)級高端存儲特性就能看出),難道就要如此白白放棄這部分昂貴的價(jià)值么?

做云時(shí)代的存儲雙活

在本文最后的這一部分,我們終于涉及到討論存儲雙活話題時(shí)經(jīng)常會提到的一個(gè)概念:“(第三站點(diǎn))仲裁”,在部分供應(yīng)商的解決方案中,“(第三站點(diǎn))仲裁”作為一個(gè)判定雙活切換的“裁判”角色,得到了非常重要的位置。

但是,這樣一個(gè)“裁判”真的必不可少,或者是,必須要以一個(gè)站點(diǎn)的形式存在么?

一方面,以中國企業(yè)客戶的實(shí)際情況來看,獨(dú)立的第三方仲裁(站點(diǎn))幾乎不可能,在一個(gè)雙活數(shù)據(jù)中心(構(gòu)建存儲雙活)之外,建立獨(dú)立的數(shù)據(jù)中心站點(diǎn)容納仲裁端,絕大多數(shù)企業(yè)都是承受不起的,而如果將“裁判”置于任何一方(站點(diǎn)),在發(fā)生數(shù)據(jù)中心鏈路或其他物理故障時(shí),不過是徒勞無用。

另一方面,隨著云計(jì)算技術(shù)的普及,存儲雙活站點(diǎn)判定正常狀態(tài)的“Pulse(心跳)”,完全可以脫離開實(shí)際的物理站點(diǎn),進(jìn)入到一個(gè)可靠、可信、具備高速鏈路的云平臺上——位于云的仲裁站點(diǎn)通過判斷來自不同存儲系統(tǒng)的“Pulse”信號——以更具有經(jīng)濟(jì)性和可靠性的方式,保障存儲雙活站點(diǎn)的高可用性。

軟件定義的甚至是云定義的“(第三方站點(diǎn))仲裁”才是企業(yè)客戶最需要的,傳統(tǒng)的基于物理設(shè)備的存儲雙活判斷方式,是無法滿足企業(yè)客戶的需要的,它不僅昂貴,而且受限于物理空間的限制,而以存儲系統(tǒng)軟件功能形態(tài)存在的戴爾Live Volume則完全不存在于任何的限制——讓數(shù)據(jù)最終流動(dòng)到云端,正是戴爾存儲業(yè)已成型的流動(dòng)數(shù)據(jù)架構(gòu)的價(jià)值。

另外,除了支持不同型號Compellent存儲系統(tǒng)的雙活解決方案,還有支持跨越不同的網(wǎng)絡(luò)接口協(xié)議來實(shí)現(xiàn)的雙活切換,小編先埋個(gè)伏筆,很快就會有后續(xù)文章詳細(xì)介紹哦!

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號