誰(shuí)說(shuō)大數(shù)據(jù)不實(shí)用?來(lái)看看數(shù)據(jù)化帶來(lái)的驚喜

責(zé)任編輯:editor006

作者:景辰

2016-10-13 21:52:18

摘自:虎嗅網(wǎng)

近年來(lái),被「大數(shù)據(jù)」這一新詞所包圍,但是說(shuō)來(lái)說(shuō)去,由冷到熱又趨冷,耳朵都聽(tīng)出繭子來(lái)了,除了沃爾瑪超市「啤酒與尿布」的老例子

近年來(lái),被「大數(shù)據(jù)」這一新詞所包圍,但是說(shuō)來(lái)說(shuō)去,由冷到熱又趨冷,耳朵都聽(tīng)出繭子來(lái)了,除了沃爾瑪超市「啤酒與尿布」的老例子,似乎并沒(méi)有什么新的應(yīng)用讓人切身感受到大數(shù)據(jù)帶來(lái)的驚喜,這是因?yàn)椤复髷?shù)據(jù)」被過(guò)度神化甚至妖魔化、故意把概念攪渾、搞的云山霧罩所造成的。

其實(shí),大數(shù)據(jù)帶來(lái)的便捷早已深入我們的生活,下面,我將從數(shù)據(jù)化的角度給大家展示一下大數(shù)據(jù)的實(shí)用及數(shù)據(jù)化給我們帶來(lái)的驚喜。

大數(shù)據(jù)的最早數(shù)據(jù)化實(shí)踐

這里我要講到的是十九世紀(jì)的一位美國(guó)人,他叫做馬修·方丹·莫里(Matthew Fontaine Maury,1806~1873),這哥們?cè)?jīng)是一位前途無(wú)量的海軍軍官,但是一次意外事故讓他變成了一位跛足軍官,不再能勝任海上工作,于是他就被調(diào)任到后方,負(fù)責(zé)圖表和儀器廠。

 

 

十九世紀(jì)時(shí)候,海上行船毫無(wú)章法,基本全靠船長(zhǎng)的經(jīng)驗(yàn),這就導(dǎo)致很多航線(xiàn)明明可以直線(xiàn)到達(dá)的卻要繞很大的彎兒。費(fèi)時(shí)費(fèi)力,作為一位年輕的航海家,莫里對(duì)此曾請(qǐng)教過(guò)很多有經(jīng)驗(yàn)的船長(zhǎng),而船長(zhǎng)們給出的答案是:走熟悉的遠(yuǎn)路比冒險(xiǎn)走不熟悉的近路要保險(xiǎn)的多。他們認(rèn)為海洋是一個(gè)不可預(yù)知的世界,人隨時(shí)都可能被意想不到的風(fēng)浪困死在汪洋大海中。

但是同樣有著豐富航行經(jīng)驗(yàn)的莫里并不完全認(rèn)同這一說(shuō)法,因?yàn)榧词故窃谕黄S颍煌臅r(shí)間段也會(huì)有殘酷的風(fēng)暴和平靜的微風(fēng),如果能夠根據(jù)潮汐、季風(fēng)和洋流的知識(shí),把沿用百年的陳舊圖表做下更新,一定能找出很多更短更安全的航線(xiàn)。

這一想法在他腦中盤(pán)算良久,但苦于沒(méi)有足以支撐他想法的數(shù)據(jù)。這一難題卻被莫里意外解決了,在他清點(diǎn)庫(kù)房的時(shí)候,發(fā)現(xiàn)了一些裝滿(mǎn)航海日志的發(fā)霉木箱,里面裝的都是以前海軍上尉寫(xiě)的航海日志,當(dāng)莫里將這些海水浸泡過(guò)的書(shū)籍上的灰塵擦凈,凝視著里面的內(nèi)容的時(shí)候,這些被擱置已久的「垃圾」在莫里手中熠熠閃光。

這里有他所需要的所有的信息:特定日期、特定地點(diǎn)、特定季風(fēng)、特定水域、特定天氣下的航海狀況,這些正是莫里夢(mèng)寐以求的,但同時(shí)莫里也面臨著巨大的困難,這些日志雜亂無(wú)章,頁(yè)面邊上還盡是奇怪的打油詩(shī)和亂七八糟的吐槽涂鴉,莫里為了提取其中的有用信息,和他的20位助手一起將這些破損的航海日志記錄的信息進(jìn)行了數(shù)據(jù)整理及處理,并記錄在一張表格中。

根據(jù)整理的數(shù)據(jù),莫里將整個(gè)大西洋按經(jīng)緯度劃分為五個(gè)板塊,并且按照月份標(biāo)出海洋的溫度、風(fēng)向、風(fēng)速等信息,根據(jù)時(shí)間的不同,這些數(shù)據(jù)都會(huì)發(fā)生相應(yīng)的有規(guī)律的變化,據(jù)此,莫里整理出一份全新的基于眾多船長(zhǎng)航海日志的粗略航海路線(xiàn)圖,這張圖帶來(lái)的最大的好處是給出了一些確定時(shí)間段內(nèi)安全的航線(xiàn),極大的減少了船隊(duì)海上航行的冤枉路,能夠幫助商人們節(jié)省很大一筆費(fèi)用。

 

 

為了獲取更多的數(shù)據(jù),莫里制作了標(biāo)準(zhǔn)的航海日志表格,發(fā)放給美國(guó)海軍,要求他們?cè)诤I嫌涗?,并在返航后交回表格,這些數(shù)據(jù)采集還包括數(shù)量眾多的商船,莫里讓他們用自己的航海日志來(lái)交換新的航海路線(xiàn)圖,參加莫里行動(dòng)的船只還會(huì)懸掛特殊的旗幟,恐怕這就是病毒營(yíng)銷(xiāo)的原型了。

在數(shù)據(jù)不斷更新完善之下,莫里的新航海路線(xiàn)圖不再需要年輕的海員們?nèi)ッ?、總結(jié)經(jīng)驗(yàn),能夠在圖表上輕松獲得來(lái)自成千上萬(wàn)經(jīng)驗(yàn)豐富的航海家的指導(dǎo),平均讓船隊(duì)的航行路程減少了三分之一左右。

這就是大數(shù)據(jù)很早的一次嘗試,沒(méi)有提「4個(gè)V」,也沒(méi)有提「Hadoop」,只是簡(jiǎn)單的數(shù)據(jù)化,將現(xiàn)象描述轉(zhuǎn)化為可制表分析的量化形式,然后數(shù)據(jù)就給我們帶來(lái)了明顯的實(shí)用價(jià)值和無(wú)限的驚喜。

大數(shù)據(jù)數(shù)據(jù)化的威力無(wú)窮

 

 

其實(shí),這是一個(gè)經(jīng)驗(yàn)數(shù)據(jù)化、經(jīng)驗(yàn)可視化的過(guò)程,就像我們的中醫(yī),傳承千年,只是知道這種草藥能治療這種病癥;那種草藥適用那種病癥,這就是經(jīng)驗(yàn),但是這種經(jīng)驗(yàn)沒(méi)有數(shù)據(jù)化,沒(méi)有進(jìn)一步發(fā)展,我們需要的是經(jīng)驗(yàn)可視化的過(guò)程,就像屠呦呦從傳統(tǒng)古籍中得知青蒿對(duì)治療瘧疾有一定的效果,并在此基礎(chǔ)上不斷探索,讓經(jīng)驗(yàn)數(shù)據(jù)化、可視化,提煉出能夠治療瘧疾的青蒿素,挽救了數(shù)百萬(wàn)人的生命。從經(jīng)驗(yàn)的傳承中找到精華,并不斷發(fā)揚(yáng),這才是傳統(tǒng)古籍通過(guò)經(jīng)驗(yàn)數(shù)據(jù)化、可視化帶給人們的大數(shù)據(jù)的實(shí)用及驚喜!

再進(jìn)一步,經(jīng)驗(yàn)數(shù)據(jù)化在現(xiàn)代醫(yī)學(xué)中還有什么更加驚喜的應(yīng)用嗎?有的。

比如說(shuō)現(xiàn)在我們知道一些已經(jīng)確定的疾病和基因的關(guān)系,如果突發(fā)一種疾病,我們并不清楚這種疾病是什么引起的,但是我們可以通過(guò)病癥的臨床表現(xiàn),比如發(fā)燒、腹瀉等癥狀來(lái)確定一些可能的基因,圈定了一些可能相關(guān)的基因,然后再通過(guò)富集分析、查找拓?fù)淠K,確定疾病致病蛋白,然后再針對(duì)致病蛋白查找現(xiàn)有的能夠靶向治療的藥物。

比如某一疾病爆發(fā),臨床表現(xiàn)就是發(fā)燒、腹瀉,那么就針對(duì)引起發(fā)燒和腹瀉的致病蛋白尋找靶向治療藥物,找到了能夠治療發(fā)燒和腹瀉致病蛋白的靶向藥物,然后將藥物進(jìn)行技術(shù)性重混,進(jìn)行臨床實(shí)驗(yàn),看是否對(duì)該疾病有效。如果有效,則作為實(shí)驗(yàn)性藥物再進(jìn)一步研究,通過(guò)不斷的嘗試藥物配比或者增改新藥物來(lái)到達(dá)治療未知疾病的目的。

這豈不就和莫里通過(guò)以往的航海日志數(shù)據(jù)化,來(lái)形成新的航海圖幫助改進(jìn)航線(xiàn)有異曲同工之妙嗎?

大數(shù)據(jù)的數(shù)據(jù)化能讓算命公司上市

 

 

如果我們腦洞再開(kāi)大一點(diǎn),想想我們生活中的算命先生,每當(dāng)有客戶(hù)找到他們請(qǐng)求算命的時(shí)候,算命先生都是仰頭掐指、念念有詞,那么他們是不是也會(huì)把某種經(jīng)驗(yàn)數(shù)據(jù)化呢?

很有可能,比如一個(gè)人出身貧寒、努力奮斗、機(jī)遇好,可能成為達(dá)官顯貴、富甲一方;比如一個(gè)人出身高貴、努力奮斗,能夠守家業(yè)并且可能還會(huì)開(kāi)辟新天地;比如一個(gè)人出身貧寒、好吃懶做、怨天尤人,可能就潦倒一生……

這些都是有規(guī)律的,把所有這些不同的人的性格和最終歸宿進(jìn)行匯總,是不是就能夠得到一個(gè)從古至今所有人的性格和最終成就的表格?如果再進(jìn)一步進(jìn)行聚類(lèi)、協(xié)同過(guò)濾等算法處理,再來(lái)一個(gè)人算命,你針對(duì)他的性格特征在數(shù)據(jù)表格中搜索類(lèi)似的人,是不是就可以對(duì)他的人生有一個(gè)預(yù)測(cè)?

恍然大悟啊,原來(lái)算命還有這么大的學(xué)問(wèn)!

千萬(wàn)不要小看算命,算命公司是可以上市的,新加坡有一家叫做「新天地集團(tuán)」的公司于2012年6月在倫敦證券交易所AIM板塊掛牌上市,公司主營(yíng)列赫然寫(xiě)著:算命、算卦、看相、看風(fēng)水……

再想想你們公司,又是科技,又是互聯(lián)網(wǎng)+,又是共享經(jīng)濟(jì)的……什么都是最牛的,但是到頭來(lái)融資都苦難,更別說(shuō)上市了。

人家一家搞算命的公司都能上市,是不是感覺(jué)很心塞?

算命怎么能算是大數(shù)據(jù)實(shí)踐?

讀到這里,你是不是有一個(gè)疑惑:如果算命真的是靠從古至今積累的大數(shù)據(jù)檢索來(lái)做預(yù)測(cè)的話(huà),算命先生是怎么做到檢索速度這么快的呢?

其實(shí),這里面還有一個(gè)技術(shù)要點(diǎn),算命先生在算命時(shí)候一般輪換著掐手指、45度角仰望天空。

你以為他們那是在干嘛?

掐手指那是使用感應(yīng)鍵盤(pán)輸入指令!至于看天空,自然是在請(qǐng)求云計(jì)算資源嘛!既有大數(shù)據(jù),又有云計(jì)算,算命公司上市,好像也是理所當(dāng)然的了……(開(kāi)玩笑哈)

計(jì)量和記錄一起促成了數(shù)據(jù)的誕生,他們是數(shù)據(jù)化最早的根基,所以我們目前的要點(diǎn)不僅是要做將文字轉(zhuǎn)化為數(shù)據(jù)、將方位轉(zhuǎn)化為數(shù)據(jù)、將聊天轉(zhuǎn)化為數(shù)據(jù)、等等世間萬(wàn)物的數(shù)字化,我們更應(yīng)該重視數(shù)據(jù)化。

畢竟我們存一堆數(shù)是沒(méi)有意義的,就像你收藏書(shū)是沒(méi)有意義的,只有讀了才能發(fā)揮作用,正如現(xiàn)在面臨困局的滴滴公司,搜集了一堆的用戶(hù)數(shù)據(jù),從家到公司的、從娛樂(lè)到休閑場(chǎng)所的、從學(xué)校到實(shí)習(xí)公司的……這么多數(shù)據(jù)如果單純的存著是沒(méi)有價(jià)值的,將這些數(shù)據(jù)化,才造就了現(xiàn)在的滴滴線(xiàn)路智能推薦系統(tǒng),幫助我們挑選最合適的道路,如果現(xiàn)在滴滴公司能夠?qū)⑦@些數(shù)據(jù)與政府共享,協(xié)助政府緩解城市擁堵問(wèn)題、為解決城市擁堵提出有效建議,估計(jì)還能緩和下局面。

有了數(shù)據(jù)化大數(shù)據(jù)的幫助,我們不會(huì)再將世界看作是一連串我們認(rèn)為或是自然或是社會(huì)現(xiàn)象,我們會(huì)意識(shí)到本質(zhì)上世界是由信息構(gòu)成的,我們更看重的數(shù)據(jù)所產(chǎn)生的價(jià)值,而不是存儲(chǔ)一堆數(shù)據(jù)抱殘守缺得給大家畫(huà)餅,告訴我這大堆的數(shù)據(jù)將會(huì)產(chǎn)生什么價(jià)值。

現(xiàn)在很多公司包括一些政府都買(mǎi)了一大堆的硬盤(pán),存了一大堆不知所謂的數(shù)據(jù),給投資人、民眾鼓吹大數(shù)據(jù)的價(jià)值,你又不是演員,別設(shè)計(jì)那些情節(jié),簡(jiǎn)單點(diǎn),做事的方式簡(jiǎn)單點(diǎn),有個(gè)做事的樣子,不管手里有多少數(shù)據(jù),首先發(fā)揮出價(jià)值來(lái),不要讓數(shù)據(jù)僅僅是到數(shù)字化的階段,比誰(shuí)家硬盤(pán)存的數(shù)多有什么意思?

多想想數(shù)據(jù)化的事,這才是正事!

大數(shù)據(jù)的落地為何僅僅流于表面?

現(xiàn)在包括企業(yè)、政府,很多都僅僅是在炒大數(shù)據(jù)的概念,這并不是他們不想做好,而是受到了制約,主要是兩個(gè)方面的制約,一個(gè)是數(shù)據(jù)量小且難以利用,另一個(gè)是轉(zhuǎn)化經(jīng)驗(yàn)少實(shí)施困難。

數(shù)據(jù)量小這個(gè)事情可能不好理解,我們那么多數(shù)據(jù)怎么能說(shuō)數(shù)據(jù)量小呢?

我在吉林和山東親自操刀參與了兩個(gè)政府主導(dǎo)的大數(shù)據(jù)項(xiàng)目,無(wú)一例外的最后死在數(shù)據(jù)量小和難以利用上。

為什么我說(shuō)政府的數(shù)據(jù)量小,政府?dāng)?shù)據(jù)總量并不小,這里說(shuō)的政府?dāng)?shù)據(jù)量小是說(shuō)政府可利用數(shù)據(jù)量小。

首先是數(shù)據(jù)化程度很低。只是近幾年政府才開(kāi)始在使用電子信息化辦公平臺(tái)的時(shí)候才積累了點(diǎn)數(shù)據(jù),早年大量的數(shù)據(jù)基本都是以文件及紙質(zhì)的形式存儲(chǔ)在政府辦公樓倉(cāng)庫(kù)里,和莫里發(fā)現(xiàn)的倉(cāng)庫(kù)里長(zhǎng)了毛的航海日志差不多,而紙質(zhì)的數(shù)據(jù)我們是無(wú)法使用的。想要將這些紙質(zhì)數(shù)據(jù)化是一個(gè)非常龐大的工程,需要耗費(fèi)巨大的人力物力,而這關(guān)鍵性的一步恰是一個(gè)吃力不討好的活,所以一般承接政府大數(shù)據(jù)的公司也都很少去觸碰。

那除了這些不能利用的,就沒(méi)有其他可利用的了嗎,有,但是量很少,基本都是一個(gè)EXCEl就能解決的問(wèn)題,根本談不上大數(shù)據(jù)。

另外就是數(shù)據(jù)割裂,各個(gè)部門(mén)的數(shù)據(jù)都和寶貝似地保護(hù)著,生怕其他部門(mén)搶走,這就導(dǎo)致了數(shù)據(jù)的割裂,無(wú)法整合。比如咱們要進(jìn)行一個(gè)智慧城市的建設(shè),至少需要交通數(shù)據(jù)、氣象數(shù)據(jù)、人社數(shù)據(jù)等等部門(mén)的數(shù)據(jù)進(jìn)行綜合考量,但是每個(gè)部門(mén)都把自己手里那點(diǎn)數(shù)據(jù)看的和寶貝疙瘩似得,碰都不讓人碰,又何談數(shù)據(jù)整合呢?

所以很多政府大數(shù)據(jù)工程到最后就流于表面,最后把手頭少的可憐的數(shù)據(jù)做做數(shù)據(jù)可視化,弄一些大屏幕,展示出來(lái)給領(lǐng)導(dǎo)匯報(bào)一下就結(jié)項(xiàng)了。

第二個(gè)就是轉(zhuǎn)化經(jīng)驗(yàn)少。

比如農(nóng)業(yè)大數(shù)據(jù),政府是有不少的農(nóng)業(yè)數(shù)據(jù)和氣象數(shù)據(jù),甚至還有糧食收購(gòu)數(shù)據(jù)、農(nóng)產(chǎn)品價(jià)格數(shù)據(jù)等等,但是即使這些數(shù)據(jù)全部都開(kāi)放給施工方,如何使用還是一個(gè)大的問(wèn)題,如何利用現(xiàn)有的數(shù)據(jù)通過(guò)數(shù)據(jù)挖掘、數(shù)據(jù)分析讓這些數(shù)據(jù)產(chǎn)生價(jià)值轉(zhuǎn)化、形成生產(chǎn)力,這又是面臨的新的問(wèn)題。這方面美國(guó)有較好的實(shí)踐,美國(guó)的農(nóng)業(yè)生產(chǎn)模式正在從機(jī)械化向信息化轉(zhuǎn)變,以精準(zhǔn)為特征的農(nóng)業(yè),正在讓種植變得更加容易。

美國(guó)是對(duì)農(nóng)業(yè)數(shù)據(jù)收集比較齊全的國(guó)家,也是較早進(jìn)行農(nóng)業(yè)數(shù)據(jù)開(kāi)放的國(guó)家。目前,有關(guān)農(nóng)業(yè)數(shù)據(jù)的采集、共享和利用正幫助美國(guó)農(nóng)業(yè)政策制定者對(duì)農(nóng)業(yè)部門(mén)的發(fā)展制定各種政策。不僅如此,美國(guó)各大農(nóng)場(chǎng)主協(xié)會(huì)以及涉農(nóng)企業(yè)也不惜投入大量的時(shí)間、金錢(qián)以及花費(fèi)巨大的精力去搜集被人們稱(chēng)為“大數(shù)據(jù)”的涉農(nóng)數(shù)據(jù)。

大數(shù)據(jù)對(duì)于農(nóng)業(yè)的作用隨著全球人口的增加,天氣的波動(dòng)更加不穩(wěn)定,以及依賴(lài)石油的農(nóng)業(yè)對(duì)于石化燃料的價(jià)格越來(lái)越敏感,必然激勵(lì)更多地運(yùn)用新技術(shù)來(lái)提高作物產(chǎn)量,并管理風(fēng)險(xiǎn)。圍繞著基因組學(xué)、生物信息學(xué)以及計(jì)算生物學(xué)的研究活動(dòng)都已經(jīng)取得了重大的進(jìn)展,使得科學(xué)家和組織能夠更好地養(yǎng)活全世界,并提高食品和農(nóng)作物的質(zhì)量。

但是中國(guó)現(xiàn)在并不具備這種條件,還是家庭為單位的小作坊式的田塊化種植,無(wú)法集約化管理,這就導(dǎo)致了農(nóng)民種什么、什么時(shí)候種都有自主權(quán),那么現(xiàn)狀是什么呢?以現(xiàn)在最大的渤海糧倉(cāng)為例,在山東幾個(gè)縣市為試點(diǎn)的渤海糧倉(cāng)項(xiàng)目,最后落地后的成果是什么呢?所謂物聯(lián)網(wǎng)+大數(shù)據(jù)的實(shí)踐到最后就是找?guī)讐K試驗(yàn)田,插上桿子,裝上幾個(gè)傳感器和攝像頭,然后做一下數(shù)據(jù)展示,甚至很多地方的傳感器和攝像頭都被農(nóng)民卸走了,如何指導(dǎo)生產(chǎn),如何將農(nóng)業(yè)機(jī)械制造產(chǎn)業(yè)鏈打通,目前我并沒(méi)有看到有什么實(shí)踐。

結(jié)語(yǔ)

不要一味的好大喜功,也不要政府提出物聯(lián)網(wǎng)就撲向物聯(lián)網(wǎng),政府提出大數(shù)據(jù)就涌向大數(shù)據(jù),政府提出萬(wàn)眾創(chuàng)業(yè)就又去一窩蜂的弄眾創(chuàng)空間,適合自己的才是最好的。

貴州大數(shù)據(jù)的口號(hào)喊了好多年了,大數(shù)據(jù)交易所也吸引了總理的目光,但是究竟有多少筆交易,實(shí)際又產(chǎn)生了多大的價(jià)值?好像除了活在官方一次次的政治宣傳之外,并沒(méi)有看到什么實(shí)質(zhì)性的進(jìn)展。

要搞大數(shù)據(jù),不一定就一味的去堆砌機(jī)器,上級(jí)領(lǐng)導(dǎo)來(lái)檢查就帶著領(lǐng)導(dǎo)逛機(jī)房。還是要真抓實(shí)干,從源頭出發(fā),分析自己的優(yōu)勢(shì),比如山東泰安,結(jié)合山東傳統(tǒng)農(nóng)業(yè)大省的優(yōu)勢(shì),結(jié)合山東農(nóng)業(yè)大學(xué)的科研優(yōu)勢(shì),現(xiàn)在依靠自己在農(nóng)業(yè)方面的優(yōu)勢(shì),一點(diǎn)一點(diǎn)來(lái),先從土地復(fù)墾、測(cè)土施肥開(kāi)始,慢慢的將苗木交易電子化、渠道化,指導(dǎo)苗木種植戶(hù)生產(chǎn)種植,給出建議的通知有保價(jià)收購(gòu),讓種植戶(hù)心理有底,按照政府的數(shù)據(jù)指導(dǎo)來(lái)做真正的能賺到錢(qián)!

不一定有多大的數(shù)據(jù),即使是依靠著現(xiàn)有的幾百萬(wàn)條數(shù)據(jù),通過(guò)場(chǎng)景化的應(yīng)用分析,給出老百姓建議,讓老百姓切實(shí)的得到實(shí)惠,讓老百姓切實(shí)看到大數(shù)據(jù)帶來(lái)的好處,這才應(yīng)該是政府大數(shù)據(jù)的必由之路。

 

 

別再只顧著建機(jī)房了,試試將交通數(shù)據(jù)收集一下,整理一下,數(shù)據(jù)化,搞一個(gè)路路通的惠民小事情,在紅綠燈旁給司機(jī)提出前方是否擁堵的實(shí)時(shí)通知,給出如何繞道才能更省時(shí)間的建議,甚至在此基礎(chǔ)上,給城市下一步道路規(guī)劃提出如何才能更加友好的解決擁堵問(wèn)題的建議是不是更有益,如果早這么做了,也就不至于出現(xiàn)北京西直門(mén)立交橋空中拍攝像蝴蝶很漂亮,實(shí)際出行繞暈人找不到路的怨聲載道的尷尬局面了。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)