每當(dāng)提到云數(shù)據(jù)存儲(chǔ)算法,IT專家們總是先聯(lián)想到云存儲(chǔ)中的數(shù)據(jù)災(zāi)害修復(fù),數(shù)據(jù)歸檔和數(shù)據(jù)備份,而不會(huì)考慮到云主存儲(chǔ)器或非直接存儲(chǔ)器。那么問(wèn)題是:為什么出現(xiàn)這種現(xiàn)象呢?
為解開(kāi)上述疑慮,IT行業(yè)記者特別邀請(qǐng)了業(yè)內(nèi)大師Arun Taneja,他是Taneja集團(tuán)的創(chuàng)立者兼咨詢分析師。記者與Taneja面對(duì)面談?wù)摿藴笮詥?wèn)題,滯后性也是原始數(shù)據(jù)未能在云環(huán)境中實(shí)現(xiàn)的主要瓶頸。Taneja解釋了日新月異的新興技術(shù)如直接插入數(shù)據(jù)的數(shù)據(jù)復(fù)制和數(shù)據(jù)壓縮如何推動(dòng)云存儲(chǔ)基礎(chǔ)數(shù)據(jù)設(shè)想的行成,描繪了云存儲(chǔ)方法的先天優(yōu)勢(shì),同時(shí)闡明了為何云存儲(chǔ)方法會(huì)成為影響云基礎(chǔ)數(shù)據(jù)存儲(chǔ)主要因素。
記者:多數(shù)存儲(chǔ)專家認(rèn)為云存儲(chǔ)主要就設(shè)計(jì)數(shù)據(jù)災(zāi)難恢復(fù)和數(shù)據(jù)備份,而不是主存儲(chǔ),為什么呢?
Taneja:首先讓我們看一下什么是主存儲(chǔ)器以及如何界定主存儲(chǔ)。主存儲(chǔ)器是與各種運(yùn)用程序直接連接的存儲(chǔ)。也就是說(shuō)無(wú)論是SharePoint還是Exchange還是企業(yè)應(yīng)用程序都會(huì)直接影響數(shù)據(jù)。應(yīng)用程序與數(shù)據(jù)是動(dòng)態(tài)變化的,創(chuàng)建新數(shù)據(jù),修改數(shù)據(jù),輸出數(shù)據(jù),所有操作都是直接關(guān)聯(lián)的。大多數(shù)用戶在這點(diǎn)上對(duì)云沒(méi)有足夠的信心,認(rèn)為云沒(méi)有足夠能力及時(shí)處理這些這數(shù)據(jù),這是第一點(diǎn)原因。
第二點(diǎn)原因同樣重要,就是除非數(shù)據(jù)中心恰巧在你周邊,否則存儲(chǔ)數(shù)據(jù)時(shí)都存在滯后性問(wèn)題。指令從一個(gè)數(shù)據(jù)存儲(chǔ)中心到達(dá)另一個(gè)存儲(chǔ)中心再返回都需要一定時(shí)間。而這段時(shí)間對(duì)主存儲(chǔ)器應(yīng)用程序來(lái)說(shuō)是過(guò)長(zhǎng)以至于不可接受的。這也是為什么通過(guò)云傳輸?shù)膽?yīng)用程序都是二級(jí)應(yīng)用程序或者次級(jí)數(shù)據(jù),比如說(shuō)數(shù)據(jù)備份和歸檔。
記者:當(dāng)然,云存儲(chǔ)是正在蓬勃興起的新興科技。那么為了非直接存儲(chǔ)數(shù)據(jù)在云環(huán)境中生存,人類都做了哪些技術(shù)改進(jìn)呢?
Taneja:我斷定某些技術(shù)在存儲(chǔ)方面已有所改善,存儲(chǔ)與云作為整體聯(lián)系加強(qiáng),從云角度考量這種技術(shù)也有所改善。先來(lái)看一例存儲(chǔ)方面的提高。
一些新興技術(shù)如內(nèi)聯(lián)數(shù)據(jù)復(fù)制,內(nèi)聯(lián)數(shù)據(jù)壓縮,快閃,以及WAN優(yōu)化設(shè)計(jì):這些都是存儲(chǔ)方面相關(guān)的技術(shù)提高。
云方面也具備了一系列新技術(shù)。如生成一些云案例,雖然在地理位置上天南地北,但是對(duì)于應(yīng)用程序而言宛如一個(gè)云。
只要把我提出的所有新技術(shù)聯(lián)系在一起,我們就有可能將云作為主存儲(chǔ)器了。
播客第二部分:Arun Taneja探討了云環(huán)境文件傳輸?shù)倪\(yùn)用,為什么在云算法下如此重要,他也鋪陳了聽(tīng)眾們將來(lái)可以享用的非直接數(shù)據(jù)存儲(chǔ)的服務(wù)等級(jí)。
記者:云環(huán)境中實(shí)現(xiàn)主存儲(chǔ)功能,云網(wǎng)關(guān)又扮演了什么角色呢?與傳統(tǒng)的主數(shù)據(jù)存儲(chǔ)又有什么區(qū)別呢?
Taneja:想要將云作為主存儲(chǔ)器,云存儲(chǔ)網(wǎng)關(guān)是必須的。很多年前,很多投資商想要拋開(kāi)網(wǎng)關(guān)實(shí)現(xiàn)云主存儲(chǔ)功能。應(yīng)用程序可以通過(guò)WAN直接撥打NFS直接連接到云,并將云作為主要NFS存儲(chǔ)。然而過(guò)程中產(chǎn)生的滯后性使運(yùn)用程序直接無(wú)響應(yīng)。無(wú)論投資商如何千方百計(jì)尋找門路回避網(wǎng)關(guān)都無(wú)法成功。沒(méi)有網(wǎng)關(guān)的云主存儲(chǔ)就像沒(méi)有CPU的計(jì)算機(jī),永遠(yuǎn)不可能達(dá)到其功能。
那又有問(wèn)題了:云網(wǎng)關(guān)怎么做才能使云主存儲(chǔ)像正常主存儲(chǔ)器那樣影響應(yīng)用程序呢?
目前為止行業(yè)內(nèi)做得最好的是StorSimple。StorSimple有配套數(shù)據(jù)中心設(shè)置的網(wǎng)關(guān),對(duì)于應(yīng)用,這個(gè)網(wǎng)關(guān)像iSCSI 標(biāo)的;對(duì)于云,他可以使用網(wǎng)絡(luò)類型的語(yǔ)言,也就是云能讀懂的語(yǔ)言進(jìn)行數(shù)據(jù)傳達(dá)。這里的云可以是Amazon, Nirvanix, Rackspace或者市場(chǎng)上任何公共云。網(wǎng)關(guān)可以實(shí)現(xiàn)內(nèi)聯(lián)數(shù)據(jù)復(fù)制,數(shù)據(jù)壓縮,快速照相然后上傳到云環(huán)境中。網(wǎng)關(guān)也具備緩沖能力,網(wǎng)關(guān)內(nèi)配置了固態(tài)硬盤和硬盤驅(qū)動(dòng)。每個(gè)用戶都擁有1到2個(gè)網(wǎng)關(guān)從云中有效提取數(shù)據(jù),并及時(shí)傳輸?shù)綉?yīng)用程序中,在緩存區(qū)中保存最新數(shù)據(jù)。這種網(wǎng)關(guān)的方式非常實(shí)用,解決了一旦沒(méi)有很好處理就會(huì)產(chǎn)生滯后性的云主數(shù)據(jù)存儲(chǔ)問(wèn)題。
最終,云存儲(chǔ)網(wǎng)關(guān)將消除滯后性的影響,使云存儲(chǔ)真正實(shí)現(xiàn)異地本地操作同步,數(shù)個(gè)操作同步。那是網(wǎng)關(guān)的魔力體現(xiàn),也是實(shí)現(xiàn)云主存儲(chǔ)的先決條件。