大數(shù)據(jù)服務(wù),至少有四點(diǎn)還值得存疑

責(zé)任編輯:editor004

作者:賈凱強(qiáng)

2017-01-12 11:48:16

摘自:中關(guān)村在線

大數(shù)據(jù)時(shí)代的到來并不是很突然,但是卻讓人措手不及。在互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)庫中往往能夠得到結(jié)構(gòu)化數(shù)據(jù),這部分?jǐn)?shù)據(jù)占用空間較小,分析容易,價(jià)值較高,因此也得到了用戶的青睞。

大數(shù)據(jù)時(shí)代的到來并不是很突然,但是卻讓人措手不及。不少企業(yè)完全沒有做好準(zhǔn)備,就已經(jīng)進(jìn)入了一個(gè)所謂的“數(shù)據(jù)操控一切”的時(shí)期。他們有過恐慌、畏懼,甚至在一些企業(yè)的宣傳中認(rèn)為沒有跟上大數(shù)據(jù)的腳步,結(jié)果就只有淘汰??墒聦?shí)真的如此嗎?筆者認(rèn)為,大數(shù)據(jù)服務(wù),至少有四點(diǎn)還值得存疑。

大數(shù)據(jù)服務(wù),至少有四點(diǎn)還值得存疑

  數(shù)據(jù)采集

所謂大數(shù)據(jù)時(shí)代,數(shù)據(jù)采集是第一步,也是最關(guān)鍵的一步。大數(shù)據(jù)的采集是利用了多個(gè)數(shù)據(jù)庫來接受來自客戶端、App、Web以及傳感器的數(shù)據(jù)而獲得的。可是這些數(shù)據(jù)真的可靠嗎?

誠然,在互聯(lián)網(wǎng)企業(yè)中,客戶終端和網(wǎng)頁的數(shù)據(jù)十分重要。這些數(shù)據(jù)在確實(shí)可以通過數(shù)據(jù)庫來準(zhǔn)確獲得,但是大數(shù)據(jù)的特點(diǎn)就是大。一旦遇到客戶峰值,如雙十一或者春運(yùn)等,數(shù)據(jù)采集并發(fā)數(shù)極高,用戶操作和訪問同時(shí)進(jìn)行,這就需要大量的數(shù)據(jù)庫才有可能支撐,那么這些資源從何而來?數(shù)據(jù)庫之間的負(fù)載均衡如何實(shí)現(xiàn)?

其次,數(shù)據(jù)采集的難題在其他行業(yè)中會(huì)變的更難。物聯(lián)網(wǎng)落地至今尚未獲得大規(guī)模成功,所謂的工業(yè)4.0目前依然只是我們想象出來的烏托邦,數(shù)據(jù)如何采集?采集到的數(shù)據(jù)如何確保正確性?

再者,涉及到人的服務(wù)行業(yè)中,數(shù)據(jù)往往與隱私并存。用戶的數(shù)據(jù)是在變動(dòng)的,大數(shù)據(jù)分析所需的數(shù)據(jù)卻是越多越準(zhǔn)的。要確認(rèn)用戶的數(shù)據(jù)正確性,提高數(shù)據(jù)分析正確性,則很容易事實(shí)上形成對(duì)人隱私的侵犯,大數(shù)據(jù)會(huì)不會(huì)成為作惡的表現(xiàn)?

數(shù)據(jù)保值

數(shù)據(jù)采集的困境和難題可以突破,也確實(shí)有一部分公司成功突破。但是,數(shù)據(jù)采集后的保值問題卻成為了更大的難關(guān)。

大數(shù)據(jù)公司偏愛這樣宣傳“數(shù)據(jù)是企業(yè)最大的財(cái)富”,可是企業(yè)卻很少有能成功使用的。所以現(xiàn)在的企業(yè)普遍多了一個(gè)愛好——囤數(shù)據(jù)。那么,數(shù)據(jù)存儲(chǔ)的成本從何而來?隨著360個(gè)人云盤的倒下,數(shù)據(jù)存儲(chǔ)的成本之高已經(jīng)超出了很多人的想象,這筆投資真的物有所值?

更可怕的是,由于社會(huì)和環(huán)境的改變,普遍來講數(shù)據(jù)的保質(zhì)期只有3個(gè)月。當(dāng)數(shù)據(jù)超過3個(gè)月后,其有價(jià)值的部分將只剩下10%。也就是說,費(fèi)勁千辛萬苦所采集到的數(shù)據(jù)將有90%會(huì)被淘汰,那么這部分?jǐn)?shù)據(jù)要如何甄別?過期的數(shù)據(jù)真實(shí)性要如何判斷?數(shù)據(jù)本身出了問題,分析又如何談?wù)_性?

數(shù)據(jù)處理

大數(shù)據(jù)的大,在于非結(jié)構(gòu)化數(shù)據(jù)占用空間較多??墒牵墙Y(jié)構(gòu)數(shù)據(jù)主導(dǎo)時(shí)代是無可爭(zhēng)議的事實(shí)。非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值能為企業(yè)所用的有多少呢?企業(yè)又能用的了多少呢?

在互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)庫中往往能夠得到結(jié)構(gòu)化數(shù)據(jù),這部分?jǐn)?shù)據(jù)占用空間較小,分析容易,價(jià)值較高,因此也得到了用戶的青睞。但是,結(jié)構(gòu)化數(shù)據(jù)存在著其最大的弱點(diǎn),不易轉(zhuǎn)化。結(jié)構(gòu)化數(shù)據(jù)的這一特點(diǎn)反而成了一種限制,在未來的發(fā)展中很可能會(huì)不如非結(jié)構(gòu)化數(shù)據(jù)。

非結(jié)構(gòu)化數(shù)據(jù)在大多數(shù)行業(yè)中都是主流存在,但是其處理難度要比結(jié)構(gòu)化數(shù)據(jù)高太多。非結(jié)構(gòu)化數(shù)據(jù)在處理的過程中,分類、檢索、處理等方法多種多樣,而且,包含信息量巨大,不同方式處理的結(jié)果很可能存在較大差異,因此價(jià)值雖高,但正確性都可能存疑,那么其產(chǎn)生的價(jià)值究竟能有多大呢?

數(shù)據(jù)應(yīng)用

大數(shù)據(jù)經(jīng)過多層包裝處理最終可以得出很多結(jié)果,但是數(shù)據(jù)結(jié)果的應(yīng)用卻是個(gè)值得商榷的存在。

一般來講,大數(shù)據(jù)分析的結(jié)果經(jīng)過可視化等處理之后可以有一個(gè)比較直觀的呈現(xiàn)??墒?,數(shù)據(jù)的使用卻往往是企業(yè)高層決策者的專利。而占據(jù)了公司絕對(duì)主體的企業(yè)員工卻很少能夠直接獲取大數(shù)據(jù)創(chuàng)造的價(jià)值。而如果開放數(shù)據(jù)給全體企業(yè)員工,那么數(shù)據(jù)安全該如何保障呢?

而從成本角度來看,企業(yè)百尺竿頭更進(jìn)一步誠然可貴,可是如果大數(shù)據(jù)分析結(jié)果只是一種企業(yè)決策者的靈光一現(xiàn),那么這筆投資真的能比高層培訓(xùn)更有價(jià)值嗎?對(duì)于中小型企業(yè)來講,大數(shù)據(jù)投資的意義又在哪里呢?所謂的知己知彼又是否真的能讓企業(yè)百戰(zhàn)百勝呢?

結(jié)束語

中國在大數(shù)據(jù)方面的發(fā)展形勢(shì)十分樂觀,但是對(duì)于企業(yè)來講,每一筆投資都應(yīng)當(dāng)讓他有所價(jià)值。數(shù)據(jù)的價(jià)值呈現(xiàn)可以有很多種,那么大數(shù)據(jù)是否真的像部分廠商所宣傳的那樣“數(shù)據(jù)操控一切”呢?

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)