對(duì)于不懂天文的人而言,星漢燦爛的夜空,因?yàn)殡s亂、無(wú)序,很難從中解讀出有價(jià)值的信息;而面對(duì)同樣一片星空,天文學(xué)家卻能游目騁懷,梳理星座、推測(cè)方位、觀察氣象,所謂“天地之變,盡在其中”。
當(dāng)下,數(shù)據(jù)和信息的膨脹呈現(xiàn)出裂變式增速,其體量之龐大、其關(guān)系之紛繁、其解析之艱難,皆前所未有。就像面對(duì)漫天星斗,我們是在眼花繚亂中停步、困惑;還是在不斷試探和不斷實(shí)踐中,努力發(fā)現(xiàn)其背后的關(guān)聯(lián)和秩序?
在大數(shù)據(jù)時(shí)代,這既是壓力和包袱,也是機(jī)遇和財(cái)富。
此次調(diào)查,本報(bào)記者走訪了浙江、福建、江蘇、陜西、安徽和廣西六個(gè)省區(qū)。圍繞數(shù)據(jù)采集、分析和應(yīng)用三個(gè)層面,調(diào)查報(bào)告旨在呈現(xiàn)行業(yè)商業(yè)企業(yè)在大數(shù)據(jù)時(shí)代中的經(jīng)驗(yàn)、教訓(xùn)、局限、困惑,還有想象……
抽樣,還是全樣本?
采集環(huán)節(jié),我們面對(duì)的基本問(wèn)題是“采什么”、“如何采”、“采多少”。而采集實(shí)現(xiàn)的方式,從規(guī)模和范圍的層面上講,可以分為“窺豹一斑”的抽樣統(tǒng)計(jì)方式和“一覽無(wú)余”的“大數(shù)據(jù)”方式。
抽樣統(tǒng)計(jì),首先要解決樣本“代表性強(qiáng)”的問(wèn)題;“大數(shù)據(jù)”方式,首先要解決“覆蓋面廣”的問(wèn)題。
大數(shù)據(jù)的一個(gè)基本特征是“全樣本”,其理想狀態(tài)是“有多少、采多少;有什么、采什么”。但因?yàn)檎麄€(gè)終端銷售電算化的社會(huì)基礎(chǔ)還很薄弱,目前行業(yè)數(shù)據(jù)采集工作還不可能實(shí)現(xiàn)“全樣本”。
因此,一方面,行業(yè)商業(yè)企業(yè)保持著傳統(tǒng)工作方式,通過(guò)抽樣,以統(tǒng)計(jì)學(xué)的方式,“還原”或推測(cè)市場(chǎng)整體狀態(tài);另一方面,行業(yè)商業(yè)企業(yè)又必須要擴(kuò)大樣本和采集范圍,不斷靠近大數(shù)據(jù)的“全樣本”標(biāo)準(zhǔn)。
問(wèn)題的關(guān)鍵就在于,其一,在傳統(tǒng)方式下,樣本如何選點(diǎn)布局,是確保統(tǒng)計(jì)準(zhǔn)確的基礎(chǔ);其二,“全樣本”的概念如何探索、做哪些探索,事關(guān)未來(lái)行業(yè)卷煙營(yíng)銷的全局。
關(guān)于如何選點(diǎn)布局,就調(diào)查所涉及的省份情況看,基本參照了國(guó)家煙草專賣局《卷煙零售市場(chǎng)信息采集和分析應(yīng)用基本規(guī)范》相關(guān)要求,選點(diǎn)按照地理位置、經(jīng)營(yíng)規(guī)模、經(jīng)營(yíng)業(yè)態(tài)三個(gè)維度進(jìn)行:
在區(qū)域上,市區(qū)、縣城、鄉(xiāng)鎮(zhèn)農(nóng)村比例基本為5:3:2;在規(guī)模上,大、中、小不同規(guī)模的參考比例為2:6:2;在業(yè)態(tài)上,以食雜店和便利店為主,樣本比例大約占70%,煙酒店的比例約為20%,商場(chǎng)、超市和娛樂(lè)場(chǎng)所的比例在10%。
也就是說(shuō),數(shù)據(jù)采集的選點(diǎn)布局,從地理位置的維度,以市區(qū)為主;從經(jīng)營(yíng)規(guī)模的維度,以中型規(guī)模為主;從經(jīng)營(yíng)業(yè)態(tài)的維度,則以食雜店和便利店為主。
當(dāng)然,各地實(shí)際不同,需要在這一標(biāo)準(zhǔn)的基礎(chǔ)上適當(dāng)調(diào)整。
以廣西柳州為例,當(dāng)?shù)刂行∈畴s店、便利店較多,所以選擇采集點(diǎn)占比較高,在行業(yè)基礎(chǔ)標(biāo)準(zhǔn)上,柳州市煙草專賣局(公司)又?jǐn)U量10%。而同樣是縣城,該市柳江縣經(jīng)濟(jì)發(fā)達(dá),食雜店一周可銷售卷煙100條左右,三江縣則經(jīng)濟(jì)發(fā)展水平相對(duì)較低,食雜店周均訂購(gòu)卷煙在二三十條。如果忽略縣與縣之間經(jīng)濟(jì)發(fā)展水平的差異去布局,必然會(huì)影響采集質(zhì)量。
為了最大程度確保選點(diǎn)布局貼近終端銷售的層次與結(jié)構(gòu),各地都明確了相應(yīng)的工作方法和工作機(jī)制。
福建省煙草商業(yè)系統(tǒng),建立了自己的“樣本管理系統(tǒng)”。根據(jù)客戶經(jīng)理轄區(qū)內(nèi)的零售客戶地理位置、業(yè)態(tài)和規(guī)模等維度,由樣本管理系統(tǒng)自動(dòng)篩選出“方差”排在前列的零售客戶作為可選樣本;信息采集員根據(jù)客戶配合度,從中選取10戶作為備選樣本,最終由樣本管理系統(tǒng)在平均分配的前提下自動(dòng)選擇產(chǎn)生信息采集點(diǎn)客戶。這樣,樣本點(diǎn)的分布與全市零售客戶的分布情況可以保持基本一致。
不僅如此,福建煙草還通過(guò)實(shí)時(shí)監(jiān)控,確保樣本點(diǎn)的代表性。當(dāng)樣本中有存在非正常狀態(tài)(停業(yè)、歇業(yè)、被查處等)時(shí),樣本管理系統(tǒng)將自動(dòng)提供異常提醒,通知信息采集員進(jìn)行備選樣本的變更;當(dāng)全區(qū)零售客戶每增加100戶,系統(tǒng)會(huì)自動(dòng)增加一個(gè)采集樣本點(diǎn),遵循公平、公正原則,優(yōu)先分配給樣本數(shù)較低的信息采集員。
與福建不同,江蘇煙草商業(yè)系統(tǒng)全面構(gòu)建了多模式市場(chǎng)信息綜合收集分析運(yùn)用系統(tǒng)。他們將樣本點(diǎn)分流至人工采集和自動(dòng)采集兩種模式下,這兩種模式能分別進(jìn)行獨(dú)立運(yùn)算,又能相互校驗(yàn)比對(duì),這樣,采集統(tǒng)計(jì)的質(zhì)量就有了“參照系”。
抽樣統(tǒng)計(jì),實(shí)際是以“小樣本”反映大市場(chǎng);“大數(shù)據(jù)”方式,是用“全樣本”反映大市場(chǎng)。樣本的準(zhǔn)確性,對(duì)于兩種方式的影響和意義,不可同日而語(yǔ)——就像一瓶墨水,倒在水缸里會(huì)污染整缸水,但倒在大海里,卻不會(huì)對(duì)大海的水質(zhì)產(chǎn)生多大的影響。
而要減少“墨水”污染,也就是不準(zhǔn)確樣本對(duì)于選樣統(tǒng)計(jì)整體工作的消極影響,一是要解決零售客戶掃碼自主性和自覺(jué)性的問(wèn)題,二是要努力擴(kuò)大樣本規(guī)模。
目前,行業(yè)商業(yè)企業(yè)采集數(shù)據(jù)的主要方式有三種:手工采集、終端POS機(jī)掃碼、信息間的系統(tǒng)對(duì)接。其中,終端POS機(jī)掃碼占主導(dǎo)。
但POS機(jī)掃碼的人為障礙,在各地不同程度存在,具體原因有這么幾類:
其一是管理意識(shí)落后。有的零售客戶認(rèn)為,賣煙不必這么復(fù)雜,終端管理只需按期盤點(diǎn)就夠了,掃碼純粹是一個(gè)“附加動(dòng)作”。這種情況集中發(fā)生在店面小、贏利能力弱的食雜店和便利店。
其二是擔(dān)心增加稅收負(fù)擔(dān)。贏利水平高的零售客戶不愿意掃碼,主要是顧慮較多,擔(dān)心營(yíng)收數(shù)據(jù)收集上去后,店鋪實(shí)際經(jīng)營(yíng)情況可能透明化、公開(kāi)化,從而增加稅收負(fù)擔(dān)。
其三是成本和投入問(wèn)題。對(duì)于一些偏遠(yuǎn)地區(qū)的小零售客戶而言,買電腦、交網(wǎng)費(fèi),是一筆不小的投入。
從根本上講,數(shù)據(jù)采集的困難,是先進(jìn)的卷煙營(yíng)銷手段同零售客戶營(yíng)銷能力不匹配之間的矛盾。而要解決這一矛盾,除了加強(qiáng)零售客戶群體的培訓(xùn),還要抓住當(dāng)前價(jià)值與利益的問(wèn)題——這就是說(shuō),要解決好行業(yè)商業(yè)企業(yè)與零售客戶之間的“價(jià)值鏈接”問(wèn)題,讓數(shù)據(jù)采集不僅僅對(duì)行業(yè)商業(yè)企業(yè)有用,對(duì)零售客戶也有用。行業(yè)商業(yè)企業(yè)的一個(gè)通行做法是將信息采集系統(tǒng)的功能進(jìn)一步豐富,使之成為一個(gè)“基于信息采集與分析”的零售終端管理軟件。
安徽煙草商業(yè)系統(tǒng)的“徽映e家”是這方面的代表。以“輕松掃碼、科學(xué)理財(cái)、現(xiàn)代經(jīng)營(yíng)”為技術(shù)訴求,“徽映e家”作為一款終端管理軟件,著重解決零售終端收支不清楚、贏利不清楚、庫(kù)存不清楚、商品結(jié)構(gòu)不清楚等經(jīng)營(yíng)問(wèn)題,實(shí)現(xiàn)臺(tái)賬管理、庫(kù)存管理、銷售管理、贏利分析的電子化,最終,實(shí)現(xiàn)中小零售終端由傳統(tǒng)經(jīng)營(yíng)模式向現(xiàn)代經(jīng)營(yíng)模式的轉(zhuǎn)變。
歸納浙江、福建、江蘇、陜西、安徽和廣西六省區(qū)的零售終端管理軟件開(kāi)發(fā),其主要的終端功能包含了進(jìn)銷存管理、財(cái)務(wù)管理、商品檔案管理、煙草會(huì)員管理、經(jīng)營(yíng)分析和系統(tǒng)管理六大功能。這些功能的應(yīng)用,帶給零售終端的直接益處就是贏利能力的提升——由于商品結(jié)構(gòu)清晰、庫(kù)存管理便捷,零售終端的資金周轉(zhuǎn)速度自然加快,資金利用效率提升。其中,尤以中小型零售終端表現(xiàn)最為明顯。
“價(jià)值鏈接”解決了信息采集的動(dòng)力問(wèn)題,將信息采集從“要我做”變成了“我要做”。零售客戶應(yīng)用系統(tǒng)自主性和自覺(jué)性的提高,必然使得系統(tǒng)所采集的信息和數(shù)據(jù)更豐富、更精確、更具生命力。
行業(yè)商業(yè)企業(yè)所需卷煙營(yíng)銷信息要通過(guò)零售終端采集實(shí)現(xiàn),所以信息采集先要體現(xiàn)客戶價(jià)值,然后才可能實(shí)現(xiàn)行業(yè)價(jià)值——這樣的一種管理哲學(xué),是以客戶價(jià)值為基本原則,在實(shí)現(xiàn)客戶價(jià)值的過(guò)程中實(shí)現(xiàn)自我價(jià)值,最終實(shí)現(xiàn)在業(yè)務(wù)鏈條層面的共贏。
對(duì)于行業(yè)商業(yè)企業(yè)而言,僅在提升終端管理的現(xiàn)代化水平上做文章也許還不夠,未來(lái)行業(yè)商業(yè)企業(yè)還有可能以數(shù)據(jù)采集為切入點(diǎn),進(jìn)一步實(shí)現(xiàn)從管理價(jià)值向經(jīng)營(yíng)模式的價(jià)值轉(zhuǎn)變和過(guò)渡,進(jìn)一步豐富“價(jià)值鏈接”這一概念的實(shí)踐意義。我們認(rèn)為,只有這樣,才能確保“小樣本”條件下樣本數(shù)據(jù)的準(zhǔn)確性、正確性、純潔度和嚴(yán)格度。
價(jià)值密度高,還是低?
數(shù)據(jù)價(jià)值密度低,是大數(shù)據(jù)的表現(xiàn)特征之一。但需要補(bǔ)充的一點(diǎn)是,價(jià)值密度低,不等于價(jià)值低——對(duì)這一點(diǎn),調(diào)查報(bào)告后文還會(huì)展開(kāi)相關(guān)論證。
數(shù)據(jù)價(jià)值的密度與數(shù)據(jù)本身的體量有關(guān)。從此次本報(bào)調(diào)查范圍來(lái)看,行業(yè)商業(yè)企業(yè)抽樣統(tǒng)計(jì)方式的樣本比率目前大多數(shù)在5%~10%之間。正是因?yàn)闃颖倔w量相對(duì)較小,所以,要更準(zhǔn)確地預(yù)測(cè)和還原整體市場(chǎng)的狀況,樣本本身必須要具有“高密度的價(jià)值”。
所謂“高密度的價(jià)值”,在調(diào)查之后,我們主要將其內(nèi)涵提煉為三項(xiàng)基本內(nèi)容:
其一,所選樣本要具有充分的代表性,這是樣本的布局選點(diǎn)問(wèn)題;其二,每個(gè)樣本點(diǎn)反饋回來(lái)的信息要盡可能準(zhǔn)確,這是數(shù)據(jù)采集的準(zhǔn)確率問(wèn)題;其三,是要盡可能地挖掘數(shù)據(jù)本身價(jià)值,這主要是分析建模的問(wèn)題。
關(guān)于布局選點(diǎn)和準(zhǔn)確率的問(wèn)題,調(diào)查第一部分已有涉及。這一部分主要從挖掘數(shù)據(jù)本身價(jià)值的層面展開(kāi)。
必須在此補(bǔ)充的一點(diǎn)是,為更充分地挖掘數(shù)據(jù)價(jià)值,行業(yè)商業(yè)企業(yè)在抽樣統(tǒng)計(jì)模式下,已經(jīng)在逐步導(dǎo)入“大數(shù)據(jù)的思維”,其具體體現(xiàn)為——樣本規(guī)模的逐步擴(kuò)大已是趨勢(shì);數(shù)據(jù)采集范圍的延伸已有探索(這也是大數(shù)據(jù)本質(zhì)特征之一,調(diào)查第三部分將重點(diǎn)呈現(xiàn)這一內(nèi)容);越來(lái)越重視“信息粒度”,已有意識(shí)地朝著“有什么、采什么”的方向去努力。
“信息粒度”,反映的是信息詳細(xì)程度。“信息粒度”的大小,直接決定了信息可供分析和挖掘的潛力與空間。
舉例來(lái)說(shuō),單純講“某零售店賣出一條卷煙”,這一信息的“粒度”就較粗,數(shù)據(jù)可供分析的價(jià)值有限。而如果數(shù)據(jù)本身描述了“這一條卷煙是怎樣賣出去的”,是一次性賣給了一個(gè)人,還是被若干人分若干次買走,其信息含義就可以進(jìn)一步挖掘——前者可能說(shuō)明消費(fèi)者的購(gòu)買能力或消費(fèi)嘗試,而后者則可以表明品牌的受眾面和消費(fèi)者的忠誠(chéng)度。
從六省區(qū)調(diào)查情況看,“信息粒度”呈現(xiàn)出兩級(jí)表現(xiàn):
一方面,“信息粒度”較好的是與卷煙銷售直接相關(guān)的數(shù)據(jù),比如零售價(jià)格、銷售量、銷售時(shí)間、庫(kù)存等,這得益于行業(yè)商業(yè)企業(yè)多年來(lái)抽樣統(tǒng)計(jì)的經(jīng)驗(yàn)積累,并且通過(guò)軟件系統(tǒng)的技術(shù)設(shè)計(jì)可以實(shí)現(xiàn)。另一方面,由銷售層向消費(fèi)層延伸的數(shù)據(jù)采集,不同程度地存在困難和障礙。這些困難和障礙長(zhǎng)期存在,由此,消費(fèi)者檔案的建立和消費(fèi)者行為的研究,結(jié)果并不理想。
后者結(jié)果不理想的原因,概括起來(lái)主要有以下四點(diǎn):
一是信息采集耗時(shí),質(zhì)量難以保證。消費(fèi)者信息采集的方式,很多是以客戶經(jīng)理定期駐店采集或依靠作為樣本點(diǎn)的零售客戶采集。該方法具有實(shí)地調(diào)研的優(yōu)勢(shì),但耗時(shí)長(zhǎng),客戶經(jīng)理常常疲于應(yīng)付,信息質(zhì)量的高低主要依賴于樣本點(diǎn)零售客戶和消費(fèi)者的配合度,難以達(dá)到全面性和代表性的要求;
二是信息量龐大復(fù)雜,跟蹤消費(fèi)者信息不易。消費(fèi)者信息的來(lái)源是多方面的,數(shù)據(jù)零散,信息孤立,消費(fèi)者購(gòu)煙場(chǎng)所、時(shí)間、頻率等不固定,導(dǎo)致消費(fèi)行為跟蹤難以持續(xù)和到位;
三是信息分析簡(jiǎn)單,數(shù)據(jù)挖掘不充分。由于信息采集的對(duì)象是消費(fèi)者,采集內(nèi)容為消費(fèi)者基本屬性和行為特征,而現(xiàn)有分析指標(biāo)設(shè)計(jì)單一,只能簡(jiǎn)單比較,分析結(jié)果難以反映消費(fèi)者需求變化,無(wú)法為營(yíng)銷工作提供有價(jià)值的決策參考;
四是信息運(yùn)用范圍狹窄,客戶益處感知點(diǎn)少。由于信息采集質(zhì)量難以保證,信息分析較為簡(jiǎn)單,消費(fèi)者需求容易受到多種變動(dòng)因素的影響,相關(guān)信息無(wú)法直接應(yīng)用于品牌培育工作。
在“信息粒度”的另一極上,卷煙營(yíng)銷系統(tǒng)內(nèi)的數(shù)據(jù)已經(jīng)分出自己的“時(shí)、空、域”——采集匯總的數(shù)據(jù)信息,按月、周、日,分不同的區(qū)域,計(jì)算總量、品類和單品相關(guān)分析指標(biāo)。以陜西省為例,其涉及總量和品類的主要指標(biāo)有5項(xiàng),分別是價(jià)格指數(shù)、存銷比、訂單滿足率、消化率、動(dòng)銷率;涉及單品的主要指標(biāo)有9項(xiàng),分別是價(jià)格指數(shù)、存銷比、訂單滿足率、動(dòng)銷率、覆蓋率、鋪市率、脫銷面、上柜率、再購(gòu)率。
總體而言,各地對(duì)卷煙營(yíng)銷系統(tǒng)內(nèi)的數(shù)據(jù)挖掘,主要集中在三個(gè)維度上:
針對(duì)市場(chǎng)維度,預(yù)測(cè)品牌市場(chǎng)狀態(tài)。這一層面的數(shù)據(jù)分析,是評(píng)價(jià)卷煙零售市場(chǎng)秩序是否穩(wěn)定、消費(fèi)者和零售客戶權(quán)益是否得到保障的重要途徑。調(diào)研所涉省份,主要是通過(guò)零售價(jià)格指數(shù)、社會(huì)存銷比和訂單滿足率等指標(biāo)的綜合判定,將市場(chǎng)分為熱銷、暢銷、平銷、緩銷、滯銷五個(gè)狀態(tài),為回答卷煙應(yīng)該“賣多少”提供支持,為基于品牌市場(chǎng)狀態(tài)的需求預(yù)測(cè)與計(jì)劃安排提供基礎(chǔ)。
針對(duì)品牌維度,測(cè)評(píng)品牌所處的發(fā)展階段。分析品牌的健康狀態(tài)和發(fā)展階段,是輔助選擇培育對(duì)象的重要依據(jù)。其中,品牌發(fā)展階段根據(jù)上柜率和銷售增長(zhǎng)率,分為導(dǎo)入階段、成長(zhǎng)階段、穩(wěn)定階段和衰退階段。品牌健康狀態(tài)通過(guò)其健康指數(shù)得分,分為好、中、差。兩者的綜合分析,為回答卷煙應(yīng)該“賣什么”,以及基于品牌發(fā)展階段與健康指數(shù)的策略制定提供基礎(chǔ)。
針對(duì)客戶維度,評(píng)估零售客戶整體的卷煙營(yíng)銷水平。通過(guò)對(duì)終端經(jīng)營(yíng)指標(biāo)的分析,評(píng)價(jià)零售客戶的銷售能力、品牌培育能力和管理能力,分出不同的級(jí)別。一方面通過(guò)評(píng)價(jià)了解客戶的總體經(jīng)營(yíng)狀況,指導(dǎo)客戶經(jīng)營(yíng);另一方面,通過(guò)對(duì)客戶經(jīng)營(yíng)狀態(tài)指標(biāo)的組合查詢,針對(duì)不同產(chǎn)品選擇合適的渠道終端,確定合理的投放數(shù)量,以支撐產(chǎn)品的銷售和品牌的培育。
當(dāng)然,行業(yè)商業(yè)企業(yè)對(duì)卷煙營(yíng)銷系統(tǒng)的數(shù)據(jù)挖掘過(guò)程也有深層次的問(wèn)題存在:數(shù)據(jù)分析揭示了問(wèn)題在哪里,也為怎么應(yīng)對(duì)問(wèn)題指出了參考路徑,但實(shí)際操作中卻很難克服數(shù)據(jù)價(jià)值與營(yíng)銷實(shí)踐“兩張皮”現(xiàn)象。究其原因,主要有兩大矛盾:
一是較大的信息采集量與狹窄的運(yùn)用范圍之間的矛盾。總體而言,目前數(shù)據(jù)分析的結(jié)果多運(yùn)用于客戶服務(wù)、品牌培育等,但在貨源組織和投放方面還無(wú)法充分運(yùn)用。受銷售政策、計(jì)劃導(dǎo)向的制約,商業(yè)企業(yè)還難以完全做到“客戶不要什么就不給什么”、“客戶要什么給什么,要多少給多少”的市場(chǎng)化取向改革要求。
二是相對(duì)固定的信息采集內(nèi)容與復(fù)雜多變的卷煙經(jīng)營(yíng)之間的矛盾。隨著市場(chǎng)化取向改革要求的不斷提升,相對(duì)固定的信息采集內(nèi)容無(wú)法滿足靈活多變的經(jīng)營(yíng)需要,如何定期對(duì)采集內(nèi)容進(jìn)行評(píng)審,使其與卷煙經(jīng)營(yíng)實(shí)際需求相吻合成為當(dāng)前亟需解決的問(wèn)題。
邏輯性,還是相關(guān)性?
面對(duì)大量數(shù)據(jù),采樣分析是一種社會(huì)習(xí)慣。但在數(shù)據(jù)處理技術(shù)已經(jīng)相對(duì)成熟的今天,這樣的習(xí)慣同時(shí)也是一種人為限制。與局限在小數(shù)據(jù)范圍內(nèi)相比,使用一切數(shù)據(jù)為判斷帶來(lái)更高的精確性,讓我們發(fā)現(xiàn)了采樣分析無(wú)法解釋的信息。
比如,科學(xué)家梅瑟利收集了23個(gè)國(guó)家人均巧克力的消費(fèi)數(shù)據(jù),同時(shí)計(jì)算出這些國(guó)家諾貝爾文學(xué)獎(jiǎng)的獲獎(jiǎng)比例,發(fā)現(xiàn)二者“正相關(guān)”。任職美聯(lián)儲(chǔ)主席期間,格林斯潘發(fā)現(xiàn),男性內(nèi)褲銷量平穩(wěn)上升,就預(yù)示經(jīng)濟(jì)形勢(shì)良好,反之,則經(jīng)濟(jì)形勢(shì)下行。據(jù)此,他提出了著名的“內(nèi)褲理論”,并成功預(yù)測(cè)了美國(guó)經(jīng)濟(jì)走勢(shì)。
大數(shù)據(jù)方式與采樣分析的本質(zhì)區(qū)別之一,就是后者更重視邏輯性,前者更重視相關(guān)性。而相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的關(guān)系,這種關(guān)系放在大數(shù)據(jù)的背景下,往往突破了單個(gè)體系或系統(tǒng)的限制。
在調(diào)查所涉六省區(qū)當(dāng)中,浙江省格外重視數(shù)據(jù)相關(guān)性研究,而且形成了一定的研究成果。
以2004~2012年為時(shí)間跨度,浙江省煙草專賣局(公司)分別對(duì)本省卷煙銷量、銷售額、單箱銷售額與相關(guān)經(jīng)濟(jì)、社會(huì)因素等16個(gè)變量做了相關(guān)分析,通過(guò)定量分析得出相關(guān)系數(shù)。如下表:
由相關(guān)系數(shù)表可以看出,卷煙銷量與常住人口、出口金額、發(fā)電量之間的相關(guān)度最高,銷量與這些高相關(guān)因素之間的時(shí)間序列趨勢(shì)圖如下:
銷售額、單箱銷售額與這些因素的相關(guān)系數(shù)雖然在數(shù)值上有差異,但是在相關(guān)度高低上具有相似性,二者與GDP、第二產(chǎn)業(yè)增加值、居民消費(fèi)水平、城鎮(zhèn)居民可支配收入、財(cái)政收入相關(guān)度最高。單箱銷售額與這些高相關(guān)因素之間的時(shí)間序列趨勢(shì)圖如下:
梳理歷史數(shù)據(jù),浙江省局(公司)發(fā)現(xiàn),卷煙銷量、卷煙結(jié)構(gòu)的變化與高相關(guān)因素的變化之間存在一種呼應(yīng)關(guān)系:
常住人口每增減10萬(wàn)人,卷煙銷量將增減0.886706萬(wàn)箱;出口額每增減10億美元,卷煙銷量將增減0.409914萬(wàn)箱;發(fā)電量每增減10億度,卷煙銷量將增減0.413668萬(wàn)箱。
地方GDP每增減100億元,卷煙單箱銷售額將增減68.8413百元;第二產(chǎn)業(yè)增加值每增減100億元,卷煙單箱銷售額將增減141.9958百元;居民消費(fèi)水平每增減100元,卷煙單箱銷售額將增減101.2407元;城鎮(zhèn)居民可支配收入每增減100元,卷煙單箱銷售額將增減83.3418元;地方財(cái)政收入每增減10億元,卷煙單箱銷售額將增減34.1136元。
而當(dāng)前,浙江全省又處于產(chǎn)業(yè)經(jīng)濟(jì)的深度調(diào)整期。之前,該省以勞動(dòng)密集型產(chǎn)業(yè)和外向型經(jīng)濟(jì)為主導(dǎo);后來(lái),宏觀經(jīng)濟(jì)下行、人力成本提高,浙江經(jīng)濟(jì)不得不走上產(chǎn)業(yè)轉(zhuǎn)型之路。而從勞動(dòng)密集型向知識(shí)密集型的產(chǎn)業(yè)轉(zhuǎn)型,將伴隨著“機(jī)器換人”、“騰籠換鳥(niǎo)”、“電商換市”的一系列動(dòng)作。
這意味著,外來(lái)務(wù)工人口逐漸減少,加之人口老齡化速度加快,浙江卷煙銷量空間必然逐步壓縮。但產(chǎn)業(yè)經(jīng)濟(jì)轉(zhuǎn)型同時(shí)也意味著地方經(jīng)濟(jì)的持續(xù)健康發(fā)展,GDP、第二產(chǎn)業(yè)增加值、居民可支配收入等都會(huì)穩(wěn)定增長(zhǎng),浙江卷煙結(jié)構(gòu)提升尚有一定空間。具體圖示如下:
這一部分,我們將浙江省局(公司)在數(shù)據(jù)分析和預(yù)測(cè)上的一些做法單列,是因?yàn)樗^為典型和充分地體現(xiàn)出大數(shù)據(jù)研究的幾個(gè)本質(zhì)性特點(diǎn):
時(shí)間跨度足夠大,大數(shù)據(jù)必須放在一個(gè)較長(zhǎng)時(shí)間段里去看,才能發(fā)現(xiàn)變化的趨勢(shì);實(shí)現(xiàn)了數(shù)據(jù)的“跨系統(tǒng)”,大數(shù)據(jù)往往需要“跳出系統(tǒng)看系統(tǒng)”,它從社會(huì)和經(jīng)濟(jì)等16個(gè)指標(biāo),在卷煙營(yíng)銷的系統(tǒng)數(shù)據(jù)之外為卷煙營(yíng)銷建立了“參照系”;重視“相關(guān)關(guān)系”研究,找到了預(yù)測(cè)卷煙營(yíng)銷的良好“現(xiàn)象關(guān)聯(lián)物”,通過(guò)這些關(guān)聯(lián)物,可以比以前更容易、更快捷、更清楚地分析事物。
結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代,離我們?nèi)绱酥?,又如此之遠(yuǎn)。
近,是說(shuō)似乎未及召喚,這樣的一個(gè)時(shí)代已經(jīng)跌跌撞撞、撲面而來(lái),在一個(gè)嶄新的趨勢(shì)和潮流中,很難有行業(yè)和領(lǐng)域可以抗拒它的裹挾;
遠(yuǎn),是說(shuō)信息社會(huì),技術(shù)迭代、思維創(chuàng)新、觀念更替,讓身處其中的人應(yīng)接不暇,而社會(huì)電算化基礎(chǔ)薄弱、整體認(rèn)知尚未成型、數(shù)據(jù)開(kāi)放渠道并未建立,這一切說(shuō)明,融入大數(shù)據(jù)時(shí)代我們還要做更多的準(zhǔn)備工作。
大數(shù)據(jù)之大,不僅僅是數(shù)據(jù)本身的體量龐大,還是時(shí)間跨度上的久遠(yuǎn)、涉及面的寬闊。所以,“跨系統(tǒng)”和“相關(guān)性”會(huì)成為大數(shù)據(jù)研究不可分割的兩個(gè)本質(zhì)特征——其背后主導(dǎo)的是信息處理技術(shù)的革命,更是一種理解世界、分析事物的新角度、新思維和新觀念。
從整個(gè)調(diào)查情況看,行業(yè)商業(yè)企業(yè)目前對(duì)數(shù)據(jù)價(jià)值的挖掘,還主要集中在卷煙營(yíng)銷系統(tǒng)內(nèi),這是不可更改的歷史基礎(chǔ)使然。行業(yè)商業(yè)企業(yè)整體的數(shù)據(jù)分析工作,還處在從抽樣統(tǒng)計(jì)向大數(shù)據(jù)轉(zhuǎn)型的過(guò)程中。其間,我們不能放棄傳統(tǒng),更不能無(wú)視新時(shí)代的呼喚。