大數(shù)據(jù)掘金新手:拿到數(shù)據(jù)越多死得越慘

責(zé)任編輯:editor005

2014-09-07 21:29:22

摘自:個(gè)人圖書(shū)館

前段時(shí)間,我們?nèi)グ不帐徍觥昂碗娚虒?dǎo)師一起午餐”,“三只松鼠”章燎原分析電商成功之道時(shí)提到了數(shù)據(jù)分析的重要性,他提到,數(shù)據(jù)分析只是大數(shù)據(jù)時(shí)代的一個(gè)微小縮影

掘金電商大數(shù)據(jù):可視化你的切片

前段時(shí)間,我們?nèi)グ不帐徍?ldquo;和電商導(dǎo)師一起午餐”,“三只松鼠”章燎原分析電商成功之道時(shí)提到了數(shù)據(jù)分析的重要性,他提到,數(shù)據(jù)分析只是大數(shù)據(jù)時(shí)代的一個(gè)微小縮影,現(xiàn)在大數(shù)據(jù)正在深刻的改變企業(yè)的運(yùn)營(yíng)模式。

比如,基于數(shù)據(jù)積累了解到顧客購(gòu)買(mǎi)的客單價(jià)、二次購(gòu)買(mǎi)頻率、購(gòu)買(mǎi)產(chǎn)品、購(gòu)買(mǎi)打折商品的比例、是幾次購(gòu)買(mǎi)等等。如果是老客戶,發(fā)貨時(shí)就可以不用封袋夾,因?yàn)?,客戶那邊已?jīng)積累了太多封袋夾了,改送其他的禮品,這樣顧客每次購(gòu)買(mǎi)“三只松鼠”產(chǎn)品所收到的包裹都會(huì)不一樣。

從搜索引擎、社交網(wǎng)絡(luò)到智能移動(dòng),全球互聯(lián)網(wǎng)上的信息總量正以每年30~50% 的增速不斷爆漲,每天淘寶上數(shù)十億條店鋪、商品瀏覽紀(jì)錄及上億的成交、收藏紀(jì)錄及3000多萬(wàn)條傳感器咨詢等等。市場(chǎng)研究機(jī)構(gòu)IDC的研究結(jié)果顯示,2011 年全球所產(chǎn)生的數(shù)據(jù)總量就已達(dá)1.8ZB,如果把這些數(shù)據(jù)刻錄到 CD 碟片中,這些碟片可環(huán)繞地球30圈。預(yù)計(jì)到2020年,這一數(shù)字將會(huì)呈現(xiàn)13倍的增長(zhǎng)。

但光擁有數(shù)據(jù)是什么問(wèn)題都解決不了的,必須要有一種對(duì)數(shù)據(jù)應(yīng)用的視角才能創(chuàng)造出對(duì)數(shù)據(jù)的使用。對(duì)于一些數(shù)據(jù)挖掘的新手來(lái)說(shuō),拿到數(shù)據(jù)越多,他就死得越慘。因?yàn)樗麤](méi)有在行業(yè)里待過(guò)幾年,不知道該從什么角度去挖掘。

在傳統(tǒng)零售業(yè)有一個(gè)著名的例子,超市可以根據(jù)消費(fèi)者的消費(fèi)習(xí)慣分析出一個(gè)結(jié)論,啤酒應(yīng)該和尿布擺在一起。但就單個(gè)POS機(jī)產(chǎn)生的數(shù)據(jù)來(lái)說(shuō),如果沒(méi)有進(jìn)行正確的歸類(lèi),看到的數(shù)據(jù)將涉及到啤酒和尿布的各種品牌。那么是就啤酒和尿布這兩個(gè)品類(lèi)進(jìn)行分析,還是根據(jù)百威和幫寶適亦或是其它品牌進(jìn)行分析呢?沒(méi)有經(jīng)驗(yàn)的分析師恐怕就要暈頭轉(zhuǎn)向了。

做大數(shù)據(jù)需要擁有良好視角、多年行業(yè)浸淫得到的經(jīng)驗(yàn)和創(chuàng)新能力的結(jié)合。第一件事就是建立你的切片維度,如:瀏覽行為、交易行為、支付行為、溝通行為、社交行為、反饋行為以及必要的各類(lèi)技術(shù)指標(biāo),一個(gè)應(yīng)用系統(tǒng)往往可能在多個(gè)尺度同時(shí)反應(yīng)數(shù)據(jù)。

我們?cè)谧龃髷?shù)據(jù)應(yīng)用時(shí)有三個(gè)基本的維度,第一數(shù)據(jù)的采集與存儲(chǔ),第二數(shù)據(jù)的組織與管理,第三數(shù)據(jù)的分析與呈現(xiàn)。當(dāng)你對(duì)這個(gè)沒(méi)有清晰的定義,或者定義缺失的話,積累的數(shù)據(jù)往往不可用,那么數(shù)據(jù)挖掘就將非常困難,包括原始數(shù)字定義、最小顆粒度等等,如果做得不好,數(shù)據(jù)也很難得到應(yīng)用。

值得注意的是,數(shù)據(jù)的供應(yīng)方和使用方關(guān)注的焦點(diǎn)往往不一致,企業(yè)會(huì)表現(xiàn)出不同的數(shù)據(jù)需求,比如為了提高硬件使用率,需要分析日志數(shù)據(jù);為了提高人員系統(tǒng)效率,需要分析工作流數(shù)據(jù);為了提升客戶滿意度,需要CDR數(shù)據(jù);為了讓產(chǎn)品達(dá)到更好的市場(chǎng)表現(xiàn),需要消費(fèi)者數(shù)據(jù)……

而今天我們所理解的數(shù)據(jù)已經(jīng)完全不是從企業(yè)內(nèi)部的經(jīng)營(yíng)行為或積淀,而是整個(gè)社會(huì)的環(huán)境當(dāng)中進(jìn)行數(shù)據(jù)的積存,數(shù)據(jù)來(lái)源多方面是大數(shù)據(jù)系統(tǒng)集成,傳統(tǒng)數(shù)據(jù)如企業(yè)內(nèi)部的財(cái)務(wù)數(shù)據(jù)、供應(yīng)鏈流通數(shù)據(jù)、CRM客戶聯(lián)系數(shù)據(jù)、整個(gè)客戶的行為數(shù)據(jù),包括客戶在非銷(xiāo)售環(huán)境中的社會(huì)型數(shù)據(jù),這些信息系統(tǒng)的結(jié)合是大數(shù)據(jù)將來(lái)會(huì)發(fā)生的變化,它不是在一個(gè)靜態(tài)的、封閉的環(huán)境下運(yùn)營(yíng)。

對(duì)于內(nèi)部數(shù)據(jù),企業(yè)需要智能分析及直觀呈現(xiàn);對(duì)于外部數(shù)據(jù),企業(yè)需要精確獲取并有效利用。如果數(shù)據(jù)精準(zhǔn)的話,直連的響應(yīng)回饋就會(huì)比較有效,反過(guò)來(lái)也會(huì)存在比較大的問(wèn)題。

例如:在電子商務(wù)行業(yè)中,有一項(xiàng)很不起眼,但是業(yè)內(nèi)人士非常關(guān)注的數(shù)據(jù),就是配送地址。物流系統(tǒng)需要識(shí)別一項(xiàng)因素,包裹的配送地址到哪一個(gè)配送站是最近的。如果這個(gè)地址恰好是在一個(gè)合適的配送站覆蓋范圍之內(nèi),因?yàn)槌鞘械缆方煌ǖ囊恍┳兓?,有可能看上去半徑距離是離A配送站最近,但是實(shí)際從送貨的效率來(lái)講反而是B配送站更方便到達(dá)。當(dāng)系統(tǒng)能夠把包裹地址跟配送站效率運(yùn)轉(zhuǎn)之間進(jìn)行匹配的時(shí)候,這樣的數(shù)據(jù)挖掘?qū)?guó)民經(jīng)濟(jì)的價(jià)值是巨大的。業(yè)內(nèi)開(kāi)玩笑講,如果可以實(shí)現(xiàn),整個(gè)物流體系的效率是現(xiàn)在的4倍。

也就是說(shuō)物流配送本來(lái)是能更便宜的,單個(gè)運(yùn)輸車(chē)多走了10分鐘可能沒(méi)什么,但是如果有5%的車(chē)都多走了10分鐘,經(jīng)濟(jì)消耗就是巨大的。這就需要有一個(gè)非常龐大的數(shù)據(jù)庫(kù),能夠把包裹目標(biāo)地很好的網(wǎng)絡(luò)化,如果能做好,那么它的價(jià)值非常大。

現(xiàn)在眾多電子商務(wù)平臺(tái)、點(diǎn)評(píng)網(wǎng)站及社交網(wǎng)絡(luò)等消費(fèi)者集中地,紛紛開(kāi)放數(shù)據(jù)接口,全網(wǎng)數(shù)據(jù)分析及應(yīng)用也成為可能。社交網(wǎng)絡(luò)的開(kāi)放更是為電商大數(shù)據(jù)應(yīng)用提供了重要支撐。通過(guò)社交網(wǎng)絡(luò)數(shù)據(jù),能夠最直接準(zhǔn)確的了解消費(fèi)者購(gòu)物傾向與消費(fèi)喜好,從而為精準(zhǔn)的推薦及營(yíng)銷(xiāo)提供非常有力的數(shù)據(jù)支撐。

但是在進(jìn)行消費(fèi)者交易匹配時(shí),要考慮外界廣泛的供應(yīng)體系,通常一款商品在市場(chǎng)上的供應(yīng)商家,比如說(shuō)一個(gè)手機(jī)產(chǎn)品你很容易找到上千個(gè)供應(yīng)商,同類(lèi)比的供應(yīng)品質(zhì)也能找到3-5家,在這樣的環(huán)境中怎樣保障你的交易轉(zhuǎn)化率,這要通過(guò)時(shí)時(shí)監(jiān)控來(lái)完成。

目前電子商務(wù)企業(yè)客戶已越來(lái)越傾向于精細(xì)化運(yùn)營(yíng),通過(guò)數(shù)據(jù)指導(dǎo)行動(dòng),我認(rèn)為未來(lái)企業(yè)的運(yùn)營(yíng),對(duì)數(shù)據(jù)的獲得乃至對(duì)整個(gè)企業(yè)運(yùn)營(yíng)的全方位的可視化需求,會(huì)是比較強(qiáng)烈的方向??蛻艨赡軙?huì)交流訂單的獲取、二次銷(xiāo)售、頁(yè)面回訪、簽單成本等轉(zhuǎn)化比例,這通常是一些運(yùn)營(yíng)指標(biāo),它們的可視化可以幫助企業(yè)提升業(yè)務(wù)能力。

我們的客戶現(xiàn)在已經(jīng)可以做到競(jìng)爭(zhēng)品牌、商品價(jià)格、描述、銷(xiāo)量以及庫(kù)存波動(dòng)的時(shí)時(shí)監(jiān)控,數(shù)據(jù)是相對(duì)精確的。雙十一小家電領(lǐng)域的促銷(xiāo)更多的依賴于廣泛的銷(xiāo)售渠道而非直營(yíng)渠道,而作為化妝品盡管銷(xiāo)售網(wǎng)絡(luò)非常廣泛,但是整個(gè)銷(xiāo)量表現(xiàn)還不占主流,把這樣的匹配數(shù)據(jù)行為和用戶行為的反彈結(jié)合時(shí),會(huì)發(fā)現(xiàn)有一些東西是決定性的因素。

三只松鼠采用了精細(xì)化的數(shù)據(jù)分析,把握客戶心理,僅用半年時(shí)間,就讓自己的單月業(yè)績(jī)從0到2000萬(wàn),在2012年天貓“雙十一”單日便完成了800萬(wàn)的銷(xiāo)售業(yè)績(jī),成為天貓堅(jiān)果類(lèi)目第一。而商派的其他客戶,如三槍、優(yōu)鯊在大數(shù)據(jù)和精細(xì)化運(yùn)營(yíng)方面也做得不錯(cuò),篇幅關(guān)系,我們以后再和大家分享。數(shù)據(jù)的應(yīng)用給企業(yè)帶來(lái)的好處顯而易見(jiàn),如果是在一個(gè)可視化的數(shù)字環(huán)境中做出決策和判斷呢?正確的幾率應(yīng)該會(huì)提升很多。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)