筆者每一天都會(huì)聽(tīng)到這樣的問(wèn)題:「我到底需要大數(shù)據(jù)嗎?」實(shí)際上,站在管理的角度上,數(shù)據(jù)越小越好。從這個(gè)方向出發(fā),你或許并不需要大數(shù)據(jù)。但不論如何,在特定情況下大數(shù)據(jù)其實(shí)非常有用。
大數(shù)據(jù)到底有多大?
在 2001 年,道格 · 萊尼(Doug Laney)寫(xiě)下了一篇具有開(kāi)創(chuàng)性意義的文章。在這篇文章中,萊尼描繪了一直困擾著他的客戶(hù)的一個(gè)數(shù)據(jù)問(wèn)題。萊尼的客戶(hù)受困于體量(Volume)過(guò)于龐大的數(shù)據(jù),這些數(shù)據(jù)正在以爆發(fā)式的速度(Velocity)增長(zhǎng),同時(shí)數(shù)據(jù)所呈現(xiàn)的形式也非常多樣化(Variety)。萊尼的體量、速度和多樣化理論得到了廣泛認(rèn)可,并被稱(chēng)為「大數(shù)據(jù)的三重奏」。
遺憾的是,許多人并沒(méi)有抓住萊尼的重點(diǎn)。他在文章中所描述的是大數(shù)據(jù)所蘊(yùn)含的問(wèn)題,而不是優(yōu)勢(shì)。
想要收集大數(shù)據(jù)其實(shí)并不容易,而且收集和使用的成本往往非常高昂。與此同時(shí),在一般情況下大數(shù)據(jù)和具體商業(yè)問(wèn)題的關(guān)聯(lián)度其實(shí)并不明顯,遑論大數(shù)據(jù)往往不能滿(mǎn)足品質(zhì)標(biāo)準(zhǔn)的要求。況且在面對(duì)大數(shù)據(jù)時(shí),管理數(shù)據(jù)所投入的資源并不能在分析、二次研究以及執(zhí)行等環(huán)節(jié)中使用。由此看來(lái),大數(shù)據(jù)對(duì)于許多人而言其實(shí)并不是一個(gè)祝福。相反,大數(shù)據(jù)有可能會(huì)嚴(yán)重?cái)偙∑髽I(yè)在數(shù)據(jù)分析環(huán)節(jié)所需要的資源。
大數(shù)據(jù)思維
和其他問(wèn)題相比,某些問(wèn)題往往會(huì)顯得更加重要,而某些問(wèn)題則往往會(huì)顯得更為復(fù)雜。但即便是在解決那些非常重要或復(fù)雜問(wèn)題的時(shí)候,我們也不一定需要體量龐大的數(shù)據(jù)。
我最喜歡的例子之一是載人航天計(jì)劃,你只需要考慮想要活著將人送到太空所需要的所有信息和計(jì)算,就不難理解這是一個(gè)多么復(fù)雜的問(wèn)題。載人航天任務(wù)所涉及的數(shù)據(jù)包括:
宇航員的身體狀況和醫(yī)學(xué)信息
地理測(cè)量學(xué)(航天器的位置)和重力場(chǎng)
氣象學(xué),云層量和輻射平衡
大氣物理學(xué)
磁場(chǎng)強(qiáng)度
宇宙射線和輻射捕獲量
電磁輻射(紫外線、X 射線和伽瑪射線
這份清單只是所需清單中的一小部分,但它所包含的信息量已經(jīng)非常龐大。甚至連筆者本人也不清楚這些信息到底意味著什么,他只是從一份老舊的 NASA 文件中找到這份清單。(有誰(shuí)知道行星際介質(zhì)的測(cè)量方法嗎?)
載人航天計(jì)劃所需要的數(shù)據(jù)到底有多少?與之匹配的計(jì)算能力又該有多少?這兩個(gè)問(wèn)題的答案你能猜出來(lái)嗎?
筆者曾有幸和「水星計(jì)劃」(Mercury Project,美國(guó)第一個(gè)載人航天計(jì)劃)的編程人員露西 · 西蒙 · 拉科夫(Lucy Simon Rakov)進(jìn)行會(huì)談,她向我描述了項(xiàng)目所使用的電腦。據(jù)拉科夫描述,盡管項(xiàng)目中的電腦性能非常強(qiáng)大,但內(nèi)存卻只有 300 千字節(jié)。你沒(méi)有看錯(cuò),不是「艾字節(jié)」,不是「拍字節(jié)」,也不是「兆字節(jié)」,而是「千字節(jié)」!
換而言之,只要你足夠聰明,你就可以憑借內(nèi)存極小的設(shè)備將航空器送上太空,要知道 300 千字節(jié)的內(nèi)存甚至連存儲(chǔ)一張大一點(diǎn)的圖片也不夠。由此看來(lái),小小的空間其實(shí)也大有所為!
盡管如此,大數(shù)據(jù)有時(shí)會(huì)變得相當(dāng)寶貴,與其價(jià)值相比,處理中的煩惱和成本甚至也變得不值一提。
大數(shù)據(jù)有什么好處?
大數(shù)據(jù)可以針對(duì)用戶(hù)提供定制化的細(xì)節(jié)數(shù)據(jù),有了這些數(shù)據(jù),你可以作出更加明智的決策。實(shí)際上,有了大數(shù)據(jù)的幫助,你在頃刻間即可完成上千項(xiàng)決策。
如果說(shuō)你可以一個(gè)接著一個(gè)地觀察用戶(hù),你會(huì)更了解他們的習(xí)慣、喜好和需求。你會(huì)更了解如何和他們相處。只要數(shù)據(jù)的準(zhǔn)確度和質(zhì)量得當(dāng),大數(shù)據(jù)可以讓你以定制化的方式與用戶(hù)保持親近,就像對(duì)待朋友一樣。
你可以通過(guò)分析數(shù)據(jù)中的細(xì)節(jié)為用戶(hù)提供個(gè)性化服務(wù),客戶(hù)可以從你身上獲得類(lèi)似于亞馬遜(Amazon)或者 Netflix 的針對(duì)性服務(wù)。更加顯著的例子是在線婚戀網(wǎng)站的配對(duì)服務(wù)。
我需要大數(shù)據(jù)嗎?
除非你已經(jīng)可以在工作中善用日常更小級(jí)別的數(shù)據(jù),否則大數(shù)據(jù)對(duì)你而言還言之過(guò)早。更重要的是,不論面對(duì)的是大數(shù)據(jù)還是小數(shù)據(jù),最重要的是你可以善用數(shù)據(jù),并將其轉(zhuǎn)化成自己的強(qiáng)力武器。