大數(shù)據(jù)的來臨是勢(shì)不可擋的。而我們今天所要重點(diǎn)探討的是,我們是否就已經(jīng)到了應(yīng)該全面進(jìn)攻大數(shù)據(jù)的時(shí)代了?
大數(shù)據(jù)挑戰(zhàn):我們是否需要新技術(shù)?
如果光從字面上去理解“大數(shù)據(jù)”,我們通常會(huì)認(rèn)為大數(shù)據(jù)就是數(shù)據(jù)的大爆發(fā),側(cè)重于強(qiáng)調(diào)數(shù)據(jù)的量。但是如果你去總結(jié)IBM、ORACLE、EMC對(duì)于大數(shù)據(jù)的定義話,它的外延還包括了數(shù)據(jù)的多樣性已經(jīng)分析的實(shí)時(shí)性。
大數(shù)據(jù)的其中兩個(gè)特性是數(shù)據(jù)量大跟實(shí)時(shí)性,這是企業(yè)目前處理大數(shù)據(jù)所面臨的最主要的兩個(gè)挑戰(zhàn)。我們可以看到數(shù)據(jù)的這兩個(gè)屬性,是傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)也一直在處理的問題。如果說傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)目前尚不能夠滿足企業(yè)的業(yè)務(wù)需求,那么技術(shù)的研究方向也應(yīng)該是按照關(guān)系型數(shù)據(jù)庫(kù)這種技術(shù)架構(gòu)進(jìn)行進(jìn)行下去。要知道,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)跟目前針對(duì)大數(shù)據(jù)的非結(jié)構(gòu)化數(shù)據(jù)庫(kù)的架構(gòu)類型是完全不一樣的。關(guān)系型數(shù)據(jù)庫(kù)已經(jīng)存在了40多年,對(duì)于數(shù)據(jù)處理也已經(jīng)顯得非常成熟,如果企業(yè)要用新興的非結(jié)構(gòu)化數(shù)據(jù)去取代它,那么會(huì)不會(huì)面臨“撿了芝麻,丟了西瓜”的結(jié)局我們也不得而知。
那再讓我們來看大數(shù)據(jù)的第三個(gè)特性:“數(shù)據(jù)的多樣性”。這里的“多樣性”意味著非結(jié)構(gòu)化數(shù)據(jù)變得越來越多。
事實(shí)上,全球產(chǎn)生的數(shù)據(jù)中85%以上的確是非結(jié)構(gòu)化的數(shù)據(jù)。但企業(yè)主要處理的還是結(jié)構(gòu)化的數(shù)據(jù)。大多數(shù)廠商的非結(jié)構(gòu)化數(shù)據(jù)分析工具也是轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)之后再進(jìn)行處理。那么大數(shù)據(jù)的真正之“大”在于如何將非結(jié)構(gòu)化數(shù)據(jù)處于成結(jié)構(gòu)化數(shù)據(jù),以及之后的對(duì)于大量結(jié)構(gòu)化數(shù)據(jù)的并行處理能力。這跟許多廠商的強(qiáng)調(diào)的“非結(jié)構(gòu)化”數(shù)據(jù)本身并無太大關(guān)聯(lián)。
退一步來論證,如果數(shù)據(jù)這些非結(jié)構(gòu)化的數(shù)據(jù)確實(shí)需要新的技術(shù)架構(gòu)來實(shí)現(xiàn),那么大數(shù)據(jù)是否就是我們馬上需要去攻克的方向?
一些非常資深的數(shù)據(jù)庫(kù)專家認(rèn)為:能把最簡(jiǎn)單的業(yè)務(wù),簡(jiǎn)單的數(shù)據(jù)形態(tài)挖掘深入才能體現(xiàn)功底,電商這類復(fù)雜業(yè)務(wù)挖掘出一點(diǎn)成果容易,深入難,許多企業(yè)不去強(qiáng)調(diào)對(duì)于數(shù)據(jù)的挖掘,而在強(qiáng)調(diào)工具和技術(shù)。這些專家也在提醒,結(jié)構(gòu)化數(shù)據(jù)相對(duì)小,但是富礦,非結(jié)構(gòu)化數(shù)據(jù)大,但是貧礦,如果富礦還沒開始采就轉(zhuǎn)攻大貧礦,后果可想而知。
關(guān)于大數(shù)據(jù)的成本風(fēng)險(xiǎn)
只要不是錢多得燒不完的企業(yè),其IT部門始終要面臨這樣一個(gè)問題:用盡可能少的錢去創(chuàng)造盡可能多的價(jià)值。
數(shù)據(jù)庫(kù)建設(shè)無疑是企業(yè)IT預(yù)算的大頭。一個(gè)項(xiàng)目建設(shè)花費(fèi)掉上千萬在中國(guó)許多企業(yè)是非常正常的事情。然而我們看得到的是大數(shù)據(jù)的建設(shè)其花費(fèi)肯定將不會(huì)低于原來傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的花費(fèi)。
現(xiàn)在很多廠商正在給與我們這樣的案例,許多企業(yè)依靠大數(shù)據(jù)的能夠,發(fā)現(xiàn)了以前根本無法發(fā)現(xiàn)的機(jī)遇,拓展了自己的市場(chǎng)。那我們就必須要討論一下大數(shù)據(jù) 的有效性,到底企業(yè)利用大數(shù)據(jù)給企業(yè)帶來了多少額外增加的價(jià)值?這種增加的價(jià)值是否能夠企業(yè)的投入有一個(gè)非常好的比例。而且更為重要的一點(diǎn)是,是否只要使 用大數(shù)據(jù)就一定能夠給企業(yè)帶來以前不可能實(shí)現(xiàn)的價(jià)值?
當(dāng)然,任何一種新技術(shù)的出現(xiàn)都要面臨許許多多的挑戰(zhàn),大數(shù)據(jù)也是一樣。只有那種能夠給企業(yè)帶來實(shí)際價(jià)值的技術(shù)才有真正的生命力。任何企業(yè)絕對(duì)不會(huì)為了采用新技術(shù)而應(yīng)用新技術(shù),技術(shù)最終的落腳點(diǎn)一定是實(shí)現(xiàn)業(yè)務(wù)價(jià)值。
大數(shù)據(jù)還處于成長(zhǎng)當(dāng)中,許多IT廠商也認(rèn)為目前大數(shù)據(jù)需要和傳統(tǒng)關(guān)系型數(shù)據(jù)倉(cāng)庫(kù)共存。如果企業(yè)的確希望利用新興技術(shù)實(shí)現(xiàn)業(yè)務(wù)的突破,那么也應(yīng)該必須 慎重。作為企業(yè)IT的決策者,一定要考慮清楚:這種創(chuàng)新技術(shù)是否能夠?qū)崿F(xiàn)期許所期望的價(jià)值,實(shí)現(xiàn)的周期是多久,企業(yè)是否能夠承受這種IT可能會(huì)出現(xiàn)的問題 甚至于失敗。