何謂大數(shù)據(jù)?
什么是大數(shù)據(jù)?在大多數(shù)人理解中,是企業(yè)用數(shù)據(jù)來優(yōu)化自己的流程、產(chǎn)品以及決策,讓運(yùn)營(yíng)變得更有效。但我認(rèn)為,這還不能涵蓋大數(shù)據(jù)的完整范疇。
事實(shí)上,大數(shù)據(jù)是一個(gè)包含了技術(shù)和商業(yè)兩個(gè)層面的綜合性概念。一方面是技術(shù)層面的。在技術(shù)層面,其實(shí)從計(jì)算機(jī)誕生的那一刻起就伴隨著數(shù)據(jù)的產(chǎn)生。但要進(jìn)行海量的數(shù)據(jù)存儲(chǔ)、高效的數(shù)據(jù)計(jì)算,需要有非常強(qiáng)大的硬件系統(tǒng)來支撐,而動(dòng)輒百萬(wàn)美元的硬件成本和每月數(shù)萬(wàn)美元的維護(hù)成本并不是每一個(gè)企業(yè)都能夠承擔(dān)的。在高昂的成本面前,數(shù)據(jù)的分析使用成為了企業(yè)的一種“可望而不可及”的財(cái)富資產(chǎn)。
但最近幾年,技術(shù)在不斷地發(fā)展,類似于 Hadoop這樣的分布式存儲(chǔ)和計(jì)算系統(tǒng)的出現(xiàn),大大提高了數(shù)據(jù)存儲(chǔ)和計(jì)算的效率,使海量數(shù)據(jù)應(yīng)用于商業(yè)變成了可能。同時(shí),隨著互聯(lián)網(wǎng)產(chǎn)業(yè)的飛速發(fā)展,大數(shù)據(jù)的概念也開始被越來越多的人關(guān)注。
另一方面是商業(yè)層面的。對(duì)于商業(yè)行為而言,最重要的意義是能夠讓企業(yè)通過數(shù)據(jù)的使用獲得更多的收益。傳統(tǒng)意義上的數(shù)據(jù)是面向業(yè)務(wù)的,對(duì)于每一條業(yè)務(wù)線來說都會(huì)有數(shù)據(jù)的采集和積累,相信很多企業(yè)已經(jīng)在這方面做得很好了,可以說私量級(jí)已經(jīng)足夠了。如果連私量級(jí)這方面都沒有做好,那我覺得有必要先去建立數(shù)據(jù)建構(gòu),畢竟有數(shù)據(jù),才能進(jìn)行接下來的相關(guān)內(nèi)容。而能夠讓商業(yè)產(chǎn)生更大價(jià)值甚至顛覆性創(chuàng)新的則是具有多樣性多元化的數(shù)據(jù)。這個(gè)多樣性是指能夠?qū)⒍喾N數(shù)據(jù)相互印證,通過彼此之間的關(guān)聯(lián)和互動(dòng)讓數(shù)據(jù)產(chǎn)生有可能的具有可靠性的商業(yè)價(jià)值。
對(duì)于企業(yè)來說,科學(xué)有效的數(shù)據(jù)指標(biāo)體系可以增加企業(yè)決策的選擇范圍以及可預(yù)見范圍。通常情況下,數(shù)據(jù)可以通過是否具有正向作用、是否可預(yù)見兩個(gè)維度歸納成四個(gè)類別。
那些具有正向作用且可預(yù)見的數(shù)據(jù)通常作為運(yùn)營(yíng)指標(biāo)進(jìn)行關(guān)注,而那些具有反向作用且可預(yù)見的數(shù)據(jù)通常作為風(fēng)險(xiǎn)來規(guī)避,而具體如何劃分?jǐn)?shù)據(jù)指標(biāo),就根據(jù)具體的企業(yè)狀況決定了。但是除了可預(yù)見的數(shù)據(jù)之外,還有大量的不可預(yù)見的數(shù)據(jù)。例如雙十一,淘寶的目標(biāo)是單天銷售100億,結(jié)果卻實(shí)現(xiàn)了191億,那么91億便是不可預(yù)見的意外驚喜。對(duì)于我們來說,我們需要把不可預(yù)見的變成可預(yù)見的,也就是把意外驚喜變成可預(yù)見的固定收益,讓它發(fā)揮更大的價(jià)值,把意外悲劇變成可預(yù)見的,最大可能地規(guī)避掉。
將所有意外可能性變成可預(yù)見的,穩(wěn)定收益規(guī)避風(fēng)險(xiǎn)
如果說上述都是對(duì)大數(shù)據(jù)定義的解釋,那么下面就來說說企業(yè)與數(shù)據(jù)的關(guān)系。
一方面是企業(yè)內(nèi)部數(shù)據(jù),包括財(cái)務(wù)數(shù)據(jù)、運(yùn)營(yíng)數(shù)據(jù)、市場(chǎng)數(shù)據(jù)這類公司的結(jié)構(gòu)型數(shù)據(jù)以及網(wǎng)站的分析數(shù)據(jù)和移動(dòng)應(yīng)用數(shù)據(jù); 另一方面是企業(yè)外部數(shù)據(jù),包括百度、360這樣的社會(huì)外部數(shù)據(jù)以及TalkingData這類的第三方數(shù)據(jù),用以補(bǔ)全自己的業(yè)務(wù)數(shù)據(jù)維度。
例如,一個(gè)用戶看了某項(xiàng)服務(wù)或者產(chǎn)品但沒有產(chǎn)生消費(fèi),所以這組數(shù)據(jù)不可能出現(xiàn)在企業(yè)的經(jīng)營(yíng)數(shù)據(jù)中,絕對(duì)僅僅出現(xiàn)在網(wǎng)站分析數(shù)據(jù)中。換而言之,如果想要知道企業(yè)未來的機(jī)會(huì),起碼要把那些看了卻不選用的用戶轉(zhuǎn)變成客戶才可能吧?如果能轉(zhuǎn)化20%,你的市場(chǎng)會(huì)增加多少?
再比如,如果你無(wú)法解釋市場(chǎng)份額增加的原因,那么這個(gè)就屬于“意外驚喜”;但當(dāng)你看懂?dāng)?shù)據(jù),當(dāng)了解“意外驚喜”的產(chǎn)生原因,并做出相應(yīng)的調(diào)整,將不可預(yù)見的可能性慢慢變少,使之成為正向的穩(wěn)定的,公司也會(huì)越來越聰明(Data Smart)。
相較于對(duì)不可預(yù)見的“意外驚喜”的探索,對(duì)未知意外風(fēng)險(xiǎn)的警惕顯得更為重要。
在如今競(jìng)爭(zhēng)數(shù)據(jù)化,新聞自媒體化的現(xiàn)在,不再僅僅是去看對(duì)手做了什么事,而更多的是從那些“微小聲音”中感受危機(jī)。例如,以前A公司的用戶,有10%是先去B公司看看后再來A公司的,現(xiàn)在這個(gè)比例變成了40%,說明B公司的影響力比以前大,對(duì)于A公司便是危險(xiǎn)。
所以,不僅僅是內(nèi)部數(shù)據(jù)的分析使用,我們也需要用一些非結(jié)構(gòu)化的外部數(shù)據(jù)不斷補(bǔ)充自身的數(shù)據(jù)分析維度,比如微博指數(shù)、百度指數(shù)這類的社會(huì)數(shù)據(jù)就是很大一塊非結(jié)構(gòu)化的數(shù)據(jù)。這些社會(huì)數(shù)據(jù)不單只是用來評(píng)價(jià)公司口碑的好壞,同樣能幫助公司進(jìn)行一些決策。如果單純停留在自身數(shù)據(jù)中,往往容易出現(xiàn)盲人摸象的尷尬,用片面的數(shù)據(jù)錯(cuò)誤地描繪用戶的全貌。就像當(dāng)淘寶的賣家離開淘寶數(shù)據(jù)的支撐,只能稱之為有數(shù)據(jù)分析,決不可稱為大數(shù)據(jù)分析。
所謂的大數(shù)據(jù),是需要跨視角、跨媒介、跨行業(yè)的海量數(shù)據(jù),也可以理解為數(shù)據(jù)的收集方法相較于過去的傳統(tǒng)收集方法的巨大革新。當(dāng)數(shù)據(jù)的規(guī)模和豐富程度達(dá)到一定程度,大家才開始提出大數(shù)據(jù)的概念。
那么如今,企業(yè)運(yùn)營(yíng)的大數(shù)據(jù)之路又行至何方?請(qǐng)聽下回分解