在廣播、媒體、零售、地理信息系統(tǒng)等一些面臨最嚴(yán)峻的數(shù)據(jù)存儲挑戰(zhàn)的行業(yè)里,很多企業(yè)不再將他們的數(shù)據(jù)稱為“數(shù)據(jù)”,而是稱其為“內(nèi)容”、“資產(chǎn)”或“信息”。
在廣播、媒體、零售、地理信息系統(tǒng)等一些面臨最嚴(yán)峻的數(shù)據(jù)存儲挑戰(zhàn)的行業(yè)里,很多企業(yè)不再將他們的數(shù)據(jù)稱為“數(shù)據(jù)”,而是稱其為“內(nèi)容”、“資產(chǎn)”或“信息”。這些企業(yè)認(rèn)識到,他們的員工或客戶可以利用這些數(shù)據(jù)信息來為企業(yè)創(chuàng)造價值,進(jìn)而深入地去了解如何幫助企業(yè)增加收入、促進(jìn)產(chǎn)品上市、贏得競爭優(yōu)勢、并且提高利潤率。它表明存儲不僅僅是支出,更能夠賦能企業(yè)。
目前業(yè)界對這一認(rèn)識的支持率有不斷增高的趨勢。 昆騰的許多用戶都屬于此類思想領(lǐng)先的公司,以下是從他們的經(jīng)驗中吸取的一些重要經(jīng)驗:
經(jīng)驗之一:選擇適合數(shù)據(jù)或信息“工作流”的存儲系統(tǒng):這是顯而易見的道理,因為任何行業(yè)對數(shù)據(jù)的處理過程都是一個工作流的過程,例如數(shù)據(jù)的產(chǎn)生(采集)、編輯加工、再加工、分發(fā)結(jié)果等。在工作流中,數(shù)據(jù)不能丟失,還要能夠在全球范圍內(nèi)將其分享,同時根據(jù)不同業(yè)務(wù)的需求還要能夠幫助快速訪問數(shù)據(jù)。 因此,工作流對存儲有著特殊的需求。然而,許多公司卻試圖用通用型的存儲去滿足本來無法滿足的特殊需求。例如,對于某大型零售公司,存放廣告的視頻和圖像的存儲竟然和存放大數(shù)據(jù)庫和郵件用的是一樣的存儲。其實,我們應(yīng)該為工作流選擇適合它們特點的存儲,根據(jù)工作流和用戶的需求、針對每個數(shù)據(jù)類型來考慮并設(shè)計存儲系統(tǒng)。
經(jīng)驗之二:將更多的數(shù)據(jù)存儲更長的時間,使用戶能夠從數(shù)據(jù)中獲得更多價值:例如,基因組測序的研究數(shù)據(jù)就是一個很好的案例,當(dāng)前的研究完成后,有時候不能立刻知曉結(jié)果的價值如何。然而,幾年后的研究可能會產(chǎn)生出更加重要的發(fā)現(xiàn)。這正是前期的數(shù)據(jù)是“具有不可預(yù)測價值的數(shù)據(jù)”的有力證據(jù)。 地理空間信息系統(tǒng)也是如此,當(dāng)前捕獲的衛(wèi)星圖像可能對10年后的任務(wù)或行動提供支持。由此可見,長期保留數(shù)據(jù)的價值是不可預(yù)測的。 分層存儲系統(tǒng)是目前將更多的數(shù)據(jù)存儲更長的時間的最優(yōu)方法,也是最節(jié)約資金的一種方法。大多數(shù)數(shù)字內(nèi)容都是“非結(jié)構(gòu)化”的,是無法縮減或壓縮的大文件,而且大多數(shù)此類內(nèi)容需要保持可用性和可訪問性。不過,它們可能在一段時間內(nèi),數(shù)天甚至數(shù)年都不會被訪問。通常的正確做法是分層存儲系統(tǒng),即用加工時使用閃存存儲-速度最快,而加工完畢長期保存時使用磁帶這種成本低、功耗低的存儲-速度夠用、但成本最低。其他類型的存儲如NAS、塊存儲、對象存儲和云存儲等也可以在大多數(shù)工作流中發(fā)揮作用。事實上,我們期望云計算在未來能夠成為大多數(shù)分層存儲工作流的一部分。
經(jīng)驗之三:用戶首先要先能訪問數(shù)據(jù),然而才能從數(shù)據(jù)中發(fā)掘出價值