大數(shù)據(jù)的出現(xiàn)使業(yè)務智能真正地走入了21世紀。但事實上“大數(shù)據(jù)”詞代表的并不是解決方案,而是一類問題。在這些PB數(shù)量級的數(shù)據(jù)中,隱藏著怎樣的價值?我們從中能得什么,并且使之指導業(yè)務部署的方方面面。但這一巨大量數(shù)據(jù)實際上有用的沒有多少。所以為了利用其隱藏的價值,企業(yè)需要收集、過濾,并通過情感分析應用、定位工具以及其它的技術來分析它,從中產(chǎn)生有用的信息,從而為今后的業(yè)務發(fā)展服務。
云可作為大數(shù)據(jù)分析的使能器
Forrester定義大數(shù)據(jù)為“在大規(guī)模的經(jīng)濟性下,獲取數(shù)據(jù)的技術和技能。”這里最關鍵的一個詞是經(jīng)濟。如果提取、處理和利用數(shù)據(jù)的成本超過了數(shù)據(jù)價值本身,那么這項工作就是沒意義的。幸運的是隨著數(shù)據(jù)量的不斷增長,技術也在不斷地進化,可幫助大部分企業(yè)利用這些數(shù)據(jù)。云技術,無論是公有云、私有云還是混合云,在讓企業(yè)從大數(shù)據(jù)分析中提取潛在的ROI方面,都是不可或缺的一部分。
收集并過慮
前面已經(jīng)提到巨大量的數(shù)據(jù)中可用的部分很少,但還是有大量的數(shù)據(jù)需要過慮,以后關聯(lián)并存儲其有用性。對大量存儲著臨時信息的基礎設施投資的利益幾乎沒有,因為這一臨時數(shù)據(jù)大部分都會被丟棄。另外從公司防火墻外部移到內部的網(wǎng)絡的數(shù)據(jù)也不會獲得什么有價值的信息,而且處理它也是使用IT經(jīng)理頭疼的一件事。
這一階段的大數(shù)據(jù)過濾是一個完美的公有云平臺應用,它可以提供按需擴展的計算和存儲資源。
分析
一旦數(shù)據(jù)轉化為可用的形式,那么就進入到分析產(chǎn)生信息的階段。從長遠來看,提供給分析應用的原始數(shù)據(jù)沒有必要一下保留,需要有效存儲是分析處理的結果。公有云和混合云技術可用在分析階段,在數(shù)據(jù)集處理階段可引入Hadoop或類似替代方案。在公有云用戶的情況下,原始分析階段可以在公有云基礎設施上執(zhí)行,然后使用私有云組件把處理過的、可用的信息拿到公司內部。
虛擬化、集成和協(xié)作
在這一階段,我們實際上已經(jīng)擁有了可用的信息,可以用來指導決策。這還沒有結束,還要使這些信息可為用戶使用,轉化并住處到現(xiàn)有的系統(tǒng)中,如企業(yè)資源規(guī)劃和客戶資源管理應用。軟件即服務應用運行在云中,利用稍早階段開發(fā)的數(shù)據(jù),來強化集成,讓用戶相互協(xié)作。
有了云計算技術,大數(shù)據(jù)的價值才能得到更好的轉化。不得不說,對于在使數(shù)據(jù)轉化為商用方面,云是一個相當完美的平臺。