云存儲聽上去是如此簡單。你只需為你所使用的支付費用,并且在任何時候,都很容易判斷你使用的存儲量。然而,經驗豐富的IT專業(yè)人員都清楚,實施一項新技術或方法很少會如此簡單。
當你部署云存儲資源時,你需要制定優(yōu)化存儲使用的政策和程序。例如,對存儲對象進行元數據標簽,是很重要的,因為這將有助于實施細粒度的管理,和版本控制政策,以及降低存儲成本。同時,考慮訪問控制和其他安全措施對云中存儲數據的影響。你應該建立管理方案,充分利用云供應商提供的工具,以及來自第三方的資源管理器,如CloudCheckr和Cloudyn。
元數據抑制浪費
云存儲使一個企業(yè)能夠保存越來越大量的數據,而不會產生過多的成本。然而,這可能會導致關注邊際成本的思維模式,然后使用更多的存儲空間。當添加存儲的成本只有每十億字節(jié)幾美分時,很容易忽略存儲最優(yōu)化。當應對相對較小的數據集時,這很可能是一個可行的戰(zhàn)略,但是對于大規(guī)模的存儲需求,卻不是。
一個更有效的計劃是相對于已經存儲的數據,哪些新數據應該被存儲。問問自己:一個包含客戶數據的分析單位,真的需要保留副本嗎?這可能取決于分析單位的類型。從存儲管理的角度來看,這是一種低效并且昂貴的方法。
分析師的情況則不同,他們需要了解所使用數據集的屬性。他們需要事實,比如數據集的創(chuàng)建日期、最初的數據源和相關轉換,和屬性的描述,包括創(chuàng)建派生值的公式。與其期望由其他分析團體創(chuàng)建的數據恰好是他們所需要的,分析師更傾向于創(chuàng)建并保存自己的數據集。
元數據——與存儲數據區(qū)塊相關聯的標簽,可以在減少數據存儲過剩中起到作用。 基本屬性,比如數據創(chuàng)建日期,數據的所有者和使用數據的申請,都是潛在的元數據標簽。屬性公式的描述,轉換描述可以在單獨的文檔內記載;使用標簽將其鏈接到更具體的文檔。
你可以在存儲戰(zhàn)略中包含元數據管理,促進數據重用。這有助于降低整體存儲成本,或許更重要的是,它促進了共享數據的使用。這也降低了在常用方案中,使用多個版本的公式和源數據的風險。
訪問控制和安全問題
精心設計的元數據可以促進數據重用,但有時這不合適。例如,機密和隱私數據,很顯然,需要一個限制訪問的政策。關系數據庫提供了控制數據訪問的大量工具, 包括細粒度,行級訪問控制??刂圃L問的方法部分取決于數據存儲在云的方式。
當數據存儲在云的關系數據庫中,你和本地擁有相同的訪問控制選項。當你切換到一個不同模式的存儲時,比如基于云的服務,類似AWS DynamoDB或SimpleDB,你需要使用這些系統(tǒng)內的可用訪問控制機制。
當使用區(qū)塊存儲時,你可能需要適應粗粒度訪問控制,如在文件層允許或拒絕訪問。這些控制可能需要用特定方式復制或整理數據,使只有合法需求的人才能訪問機密和隱私數據。
幫助管理云存儲的工具
在你制定云存儲戰(zhàn)略時,評估可以協助整體管理的工具。云供應商通常提供幫助監(jiān)測云存儲的工具,其中一些可以在超越存儲值時,向你發(fā)送警報。在其他情況下,第三方工具,比如Cloudyn或CloudCheckr,可以用來收集和分析存儲數據,幫助你更好地預測存儲趨勢和未來需求。
將存儲遷移到云,不會自動節(jié)省存儲成本。主動的管理和明確的政策和程序,才能幫助你最大化在任何云存儲部署上的投資回報。