按照阿里巴巴副總裁、數(shù)據(jù)委員會(huì)會(huì)長(zhǎng)車品覺的話說,這是社交數(shù)據(jù)的常態(tài),它決定著時(shí)代大潮下數(shù)據(jù)分析的特征——冷艷高貴接地氣,奔放洋氣有深度。
要知道,Windows95時(shí)代的數(shù)據(jù)分析,MB量級(jí);Google搜索時(shí)代的數(shù)據(jù)分析,GB級(jí);而到了社交時(shí)代,數(shù)據(jù)分析就是TB級(jí),每每千倍數(shù)量級(jí)的增長(zhǎng),到如今,自然變成了“大”數(shù)據(jù)的分析,大在數(shù)據(jù)的數(shù)量級(jí),也大在數(shù)據(jù)的多樣維度,此外,更講求Veracity(真實(shí)性)、Velocity(及時(shí)的速度),進(jìn)而,大數(shù)據(jù)分析才能真的“可實(shí)施”、“可解釋”與“數(shù)據(jù)準(zhǔn)確、穩(wěn)定”。
概念多多吧?很抽象!不好意思,小郝子只能告訴郝友們,這些概念是大數(shù)據(jù)思維的基礎(chǔ),沒有它們,談什么大數(shù)據(jù)都是無本之木,無源之水。這是小郝子第二次聽品覺老師布道,在上海“福布斯”的論壇上。與去年末采訪不同,這次多了一些業(yè)內(nèi)資深者的探討,思想的碰撞,展現(xiàn)出大數(shù)據(jù)思維在實(shí)踐中的火花。
一、問題既是答案,你懂么?
問題就是答案?是的,大數(shù)據(jù)思維就是要會(huì)“問”。
品覺說了個(gè)案例——之前,南方電網(wǎng)有人請(qǐng)教,他們收集每戶各時(shí)段用電的數(shù)據(jù)有用么?品覺考慮了一下,問對(duì)方,能否用不同的時(shí)段的用電量數(shù)據(jù),來估算大件家用電器是否出現(xiàn)故障,電網(wǎng)的人回答說可以,那么這樣就可以衍生出針對(duì)的服務(wù),提醒屋主“電器可能出現(xiàn)故障”,早些維修,避免出現(xiàn)短路、火災(zāi)等隱患。而更進(jìn)一步,若能了解其家用電器的品牌、型號(hào),更可以告訴商家,相關(guān)產(chǎn)品的地理分布,實(shí)際故障率等等數(shù)據(jù),這些對(duì)它們生產(chǎn)、銷售又具有極大的意義……這不就是大數(shù)據(jù)思維了么?
點(diǎn)融網(wǎng)創(chuàng)始人郭宇航則分享了第一個(gè)案例,他曾到著名的P2P網(wǎng)貸同行Lending Club去學(xué)習(xí),早年,Lending Club一直在收集一些看似無用的數(shù)據(jù):比如,用戶上網(wǎng)的時(shí)點(diǎn),填寫借貸申請(qǐng)表花費(fèi)的時(shí)間,但后來,時(shí)間久了,Lending Club發(fā)現(xiàn)這些統(tǒng)計(jì)都與借款者的違約率密切相關(guān)——總是在大半夜上網(wǎng)尋求貸款的人,他們很可能沒有十分穩(wěn)定的工作;而很快填寫完借貸申請(qǐng)表的人,很可能借貸的態(tài)度不是那么謹(jǐn)慎,其動(dòng)機(jī)就值得深究……看似沒用的數(shù)據(jù)最后卻可以展現(xiàn)極大的能量。
所以說,看到數(shù)據(jù)不是重要的,關(guān)鍵是怎么將它們應(yīng)用于展現(xiàn)其價(jià)值的地方,讓老板更了解商業(yè)運(yùn)營(yíng)的各個(gè)切面,讓風(fēng)控更多控制風(fēng)險(xiǎn)的角度,讓跑步的人更懂得自己身體各部位的狀態(tài)……那么,大數(shù)據(jù)就是為你而生。
二、假設(shè)與答案之間
又是段子兩則:
如若京東創(chuàng)始人劉強(qiáng)東向你要“周報(bào)”,你要做一份什么樣的周報(bào)?告訴他:“以西紅柿為代表的生鮮做得很好”,或者是:“奶茶事業(yè)大有可為”?都不對(duì),你應(yīng)該以周為單位,回顧之前劉布置的任務(wù)要點(diǎn),哪里做得好,為什么好,哪里有問題,為什么出現(xiàn)這樣的問題,有哪些解決方案,最好的解決方案是什么,為什么;當(dāng)下的電商環(huán)境出現(xiàn)了哪些重要的變化,京東需要做怎樣的適應(yīng)性變化……沒有準(zhǔn)確假設(shè)的大數(shù)據(jù)分析,即便拿出結(jié)果,也不能說服劉強(qiáng)東這樣的大佬,因?yàn)橐婚_始方向就錯(cuò)了,假設(shè)差之毫厘,結(jié)果謬以千里。用大數(shù)據(jù)來討好領(lǐng)導(dǎo)?當(dāng)心馬屁拍到馬蹄上。
另有一位互聯(lián)網(wǎng)企業(yè)高管說,阿里投資優(yōu)酷,第二天股票一定跌,“這就是我的大數(shù)據(jù)。”沒錯(cuò),第二天優(yōu)酷的股票跌了,但這就大數(shù)據(jù)了?真心扯淡,不漲就跌,也就是50%的概率必定猜對(duì)。大數(shù)據(jù)分析可不是一次猜中就行,要次次“猜中”才是真的大數(shù)據(jù)分析,更核心的,要“猜到”——漲,漲多少個(gè)基點(diǎn);跌,跌多少個(gè)基點(diǎn)。不然,比巫蠱卜算還不靠譜,怎么能是大數(shù)據(jù)?小郝子個(gè)人覺得,不懂裝懂,正是這群人污穢了大數(shù)據(jù)的美好愿景,就是“劣幣驅(qū)逐良幣”的變種,SB兮兮。(請(qǐng)?jiān)徯『伦佑至R人了)
可見,不懂假設(shè)就找不到答案,蒙對(duì)了答案也不能證明大數(shù)據(jù)思維,在一套嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)體系下,大膽假設(shè),小心驗(yàn)證,調(diào)整,對(duì)標(biāo),才是尋求大數(shù)據(jù)正解的良途,雖然它注定不會(huì)平坦。