關(guān)于大數(shù)據(jù)的討論往往聚焦在將大量數(shù)據(jù)進行存儲,然后再進行回顧式的分析。而存儲又帶來了新的問題,諸如數(shù)據(jù)如何存儲、數(shù)據(jù)如何組織、怎樣清洗數(shù)據(jù)以及怎樣的時間劃分是合適的。
盡管這些基于存儲的問題解決了,分析師還要決定哪些數(shù)據(jù)是已經(jīng)過期了的。它們可能已經(jīng)過時了,不能夠用來反映當前環(huán)境了,有些歷史數(shù)據(jù)是不能給我們一個關(guān)于未來的視角的。
實時數(shù)據(jù)分析
換一個思路,我們可以選擇進行實時大數(shù)據(jù)分析。這樣的話,我們就不用考慮大規(guī)模存儲相關(guān)的問題了,而改為關(guān)心商業(yè)數(shù)據(jù)流量帶寬了。Jeff Bertolucci在Information Week上面寫道,電信公司最早開始使用實時大數(shù)據(jù)分析來了解當前的網(wǎng)絡(luò)狀況。“先存儲,后分析”的方法,在要求實時性的領(lǐng)域中作用可能就不大了。
盡管中小企業(yè)可能沒有像電信公司那么大量的數(shù)據(jù)流,但是他們也應(yīng)當在投資數(shù)據(jù)存儲之前,先知道它們需要哪些商業(yè)數(shù)據(jù)。Mary Shacklett在Tech Republic上面的一篇文章中提到,清理歷史數(shù)據(jù),然后得出有用的結(jié)果的花費很可能已經(jīng)超出中小企業(yè)的預(yù)算承受范圍了。從過去中反思學(xué)習的確是好的,但是對于中小企業(yè)而言,這樣的投資得到的數(shù)據(jù)分析質(zhì)量的確還是存疑的。
實時分析的好處
IT專家應(yīng)當推薦企業(yè)走向?qū)崟r之路,而不要陷入無盡的數(shù)據(jù)清理之中。實時分析之中往往見效很快,中小企業(yè)短時間內(nèi)就能看到數(shù)據(jù)分析的好處;而用傳統(tǒng)方式大規(guī)模存儲,企業(yè)要投入很多資金。實時分析方法還有一個好處,就是讓中小企業(yè)能夠了解到哪些商業(yè)數(shù)據(jù)是需要的,因為畢竟不是所有的數(shù)據(jù)流都要用到商業(yè)分析之中。
通過對數(shù)據(jù)流的檢驗,中小企業(yè)能夠看出哪些是有必要進行存儲并回顧的。數(shù)據(jù)可以在源頭就得到了優(yōu)化。
要知道,洞察力來自于對數(shù)據(jù)的了解,而不在于你存儲了多少數(shù)據(jù)。