你還在相信微信第三方監(jiān)測(cè)平臺(tái)的大數(shù)據(jù)鬼話嗎?

責(zé)任編輯:jackye

作者:吳偉

2016-04-05 08:55:42

摘自:界面

曾幾何時(shí),大數(shù)據(jù)這個(gè)詞闖入了互聯(lián)網(wǎng)人群的眼中,并迅速成為了高逼格人群交談必備詞匯。而微指數(shù)對(duì)于賬號(hào)質(zhì)量的監(jiān)控指標(biāo)是:7天平均閱讀、7天平均點(diǎn)贊、每天發(fā)布條數(shù)、有效累計(jì)粉絲、有效日活粉絲。

曾幾何時(shí),大數(shù)據(jù)這個(gè)詞闖入了互聯(lián)網(wǎng)人群的眼中,并迅速成為了高逼格人群交談必備詞匯。但慢慢大多數(shù)人認(rèn)識(shí)到大數(shù)據(jù)的真實(shí)反饋之后,就不再對(duì)其神秘保持新鮮和艷羨,甚至接地氣務(wù)實(shí)的從業(yè)者從來(lái)不拽詞裝高端。

本人今天要說(shuō)到的是微信大數(shù)據(jù)分析,隨著微信公眾平臺(tái)的崛起和在網(wǎng)紅以及草根營(yíng)銷者當(dāng)中炙手可熱的發(fā)展,伴隨著微信公眾平臺(tái)衍生出的第三方數(shù)據(jù)監(jiān)測(cè)平臺(tái)也應(yīng)運(yùn)而生。由于微信向來(lái)是比較封閉的,重視圈子的概念,不像微博的媒體廣泛傳播屬性那么強(qiáng),所以一開(kāi)始接觸微信的人大多不了解其中的門(mén)道,這也就促成了第三方數(shù)據(jù)監(jiān)測(cè)平臺(tái)的可依賴性。

因?yàn)榇蠹叶疾欢铮愕臄?shù)據(jù)只要大部分還算合理,不合理的地方有合理的解釋,那么大家都會(huì)買賬,口耳相傳。

在此列舉三個(gè)比較早期,在行業(yè)內(nèi)排名靠前的數(shù)據(jù)監(jiān)測(cè)平臺(tái):新媒體排行榜、新媒體指數(shù)、微指數(shù)。最早出現(xiàn)的是新媒體排行榜(以下簡(jiǎn)稱新榜),也是最早在公眾號(hào)榜單和文章榜單上確定地位的,那個(gè)時(shí)候還沒(méi)有搜狗的微信搜索,而誕生的公眾號(hào)數(shù)量也還比較少,那是一個(gè)你想要關(guān)注一個(gè)高質(zhì)量賬號(hào)卻不知道如何去尋找的年代,不像現(xiàn)在,關(guān)注過(guò)度飽和,內(nèi)容過(guò)度充斥。

新榜監(jiān)測(cè)的公眾號(hào)數(shù)據(jù)僅僅十幾萬(wàn)(現(xiàn)在樣本數(shù)已超過(guò)20萬(wàn)),但是公眾號(hào)的數(shù)量現(xiàn)在已在兩千萬(wàn)左右(具體多少我也不清楚,請(qǐng)勿抬杠),樣本數(shù)量其實(shí)是蠻低的,但由于新榜出現(xiàn)較早,且自身監(jiān)測(cè)算法也已更新數(shù)次,數(shù)據(jù)慢慢趨向于真實(shí)準(zhǔn)確數(shù)值。

數(shù)據(jù)分析自然需要數(shù)字來(lái)衡量和比較,為此新榜發(fā)布了一個(gè)自家的指數(shù)——新榜指數(shù)(New Rank Index,NRI),該指數(shù)是由新媒體排行榜(newrank.cn)基于海量數(shù)據(jù)、用戶深度反饋及專家建議而推出,用于衡量中國(guó)移動(dòng)互聯(lián)網(wǎng)渠道新媒體(主要指兩微一端)的傳播能力,此指數(shù)反映該新媒體主體的熱度和發(fā)展趨勢(shì)。

新榜指數(shù)是由原始數(shù)據(jù)參照基數(shù)通過(guò)計(jì)算公式推導(dǎo)出來(lái)的標(biāo)量數(shù)值,用以衡量原始數(shù)據(jù)在其所屬維度的相對(duì)表現(xiàn)。在此需要指出,新榜指數(shù)是為所有賬號(hào)提供了一個(gè)參照系,如果想要不同賬號(hào)之間進(jìn)行比較,那就需要一個(gè)嚴(yán)格的前提——參照系穩(wěn)定。

只有參照系穩(wěn)定,比較才是有意義的。而這個(gè)參照系的穩(wěn)定來(lái)源于長(zhǎng)期的對(duì)于參照系內(nèi)所有賬號(hào)進(jìn)行觀察和考量,但是樣本數(shù)量20萬(wàn)的參照系是否具有參照性呢?答案并不是肯定的,那么如何解決這一問(wèn)題?參考微信官方的數(shù)據(jù)參照系,微信官方的數(shù)據(jù)統(tǒng)計(jì)是基于平臺(tái)所有賬號(hào)(無(wú)效賬號(hào)除外)的數(shù)據(jù)分析,這個(gè)數(shù)據(jù)自然是最具有參照標(biāo)準(zhǔn)的,比如公眾號(hào)的閱讀轉(zhuǎn)化率平均在8%-10%,劣質(zhì)賬號(hào)低于此區(qū)間,超優(yōu)質(zhì)賬號(hào)高于此區(qū)間。

這個(gè)區(qū)間值比較重要,后面說(shuō)到的相關(guān)內(nèi)容還會(huì)用到。

不管你們能不能看得懂,在此先展示一下新榜指數(shù)NRI3.0版本吧,以下數(shù)據(jù)算法解釋來(lái)自于新榜:

1、選定指標(biāo)

在微信的計(jì)算中,為兼顧其數(shù)量與質(zhì)量,我們使用總閱讀數(shù)、最高閱讀數(shù)、平均閱讀數(shù)、頭條閱讀數(shù)、總點(diǎn)贊數(shù)五個(gè)指標(biāo)來(lái)對(duì)賬號(hào)進(jìn)行評(píng)估,其中:

整體指標(biāo)(總閱讀數(shù),R):指統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的閱讀數(shù)總和;

優(yōu)異指標(biāo)(最高閱讀,Rm):是指統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容中的單篇最高閱讀數(shù);

質(zhì)量指標(biāo)(平均閱讀數(shù),Ra ):統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的閱讀數(shù)平均值;

主動(dòng)預(yù)判指標(biāo)(頭條閱讀,Rh ):統(tǒng)計(jì)周期內(nèi)位置為頭條的內(nèi)容的閱讀總數(shù);

互動(dòng)指標(biāo)(總點(diǎn)贊數(shù),Z):統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的點(diǎn)贊數(shù)總和。

2、指標(biāo)標(biāo)準(zhǔn)化

基于不同維度指標(biāo)的差異性,我們首先將所得數(shù)據(jù)標(biāo)準(zhǔn)化,即通過(guò)對(duì)各維度原始數(shù)據(jù)與該維度常數(shù)的比值計(jì)算,得到該樣本各項(xiàng)指標(biāo)的千分化數(shù)值。

在新榜指數(shù)中,以天為最小計(jì)算周期,將常規(guī)(1天推送一次,每次最多8篇)的公眾號(hào)為對(duì)象在這一時(shí)間段內(nèi)總閱讀數(shù)、最高閱讀數(shù)、平均閱讀數(shù)、頭條閱讀數(shù)和點(diǎn)贊數(shù)共五個(gè)指標(biāo)的常數(shù)分別記為:

在不同的時(shí)間周期,即日、周、月、年(n=1,7,30,365)下,以上常數(shù)具體數(shù)值為:

  在此基礎(chǔ)上,各指標(biāo)按以下公式進(jìn)行標(biāo)準(zhǔn)化:

  注:此處“ 1”是為了避免出現(xiàn)類似“ 0 閱讀”時(shí)而產(chǎn)生無(wú)效值。

指標(biāo)加權(quán)

由于此五項(xiàng)數(shù)據(jù)影響微信傳播能力的程度不同,我們賦予不同的權(quán)重,分別記為 ωR , ωRm , ωRa , ωRh , ωZ 。

最終,新榜指數(shù)的計(jì)算公式表述為:

目前,新榜使用的系數(shù)為 ωR =0.75, ωRm =0.05, ωRa =0.1, ωRh =0.05, ωZ =0.05。

而另外一家,新媒體指數(shù)也出臺(tái)了一套自己的指數(shù)標(biāo)準(zhǔn),叫WCI,中文名字:微信傳播指數(shù);英文:wechat communication index。給出的解釋是由微信原始數(shù)據(jù)通過(guò)一系列復(fù)雜嚴(yán)謹(jǐn)計(jì)算公式推導(dǎo)出來(lái)的標(biāo)量數(shù)值,至于新媒體指數(shù)的樣本數(shù)量嘛,本人沒(méi)有深入考究,這都不重要,重要的在后面。

那么這個(gè)WCI又有什么用呢?WCI指數(shù)可以全面反映出微信公眾號(hào)推送文章的傳播度、覆蓋度及公號(hào)的成熟度和影響力,從而反映出微信整體熱度和公眾號(hào)的發(fā)展走勢(shì)。

而WCI指數(shù)又是怎么算出來(lái)的呢?WCI用最高閱讀數(shù)、日均閱讀數(shù)、篇均閱讀數(shù)、日均點(diǎn)贊數(shù)、篇均點(diǎn)贊數(shù)和最高點(diǎn)贊數(shù)六個(gè)指標(biāo)對(duì)微信賬號(hào)進(jìn)行評(píng)估。

同樣的,考慮到各指標(biāo)在反映傳播能力方面存在差異,新媒體指數(shù)也賦予了6個(gè)指標(biāo)不同的權(quán)重,最終的計(jì)算公式如下:

相對(duì)具有行業(yè)代表性的,第三家公司微指數(shù),算是起步比較晚的,但是號(hào)稱可同時(shí)監(jiān)控1000萬(wàn)公眾號(hào),請(qǐng)注意這里的說(shuō)法是可以同時(shí)監(jiān)控,并沒(méi)有說(shuō)每天會(huì)去更新1000萬(wàn)公眾號(hào)的數(shù)據(jù),稍微懂點(diǎn)技術(shù)的人都知道,一個(gè)創(chuàng)業(yè)公司如果運(yùn)行這么大數(shù)據(jù)的話服務(wù)器成本得有多高,樣本數(shù)量請(qǐng)自行猜測(cè),這里不便透露。

而微指數(shù)對(duì)于賬號(hào)質(zhì)量的監(jiān)控指標(biāo)是:7天平均閱讀、7天平均點(diǎn)贊、每天發(fā)布條數(shù)、有效累計(jì)粉絲、有效日活粉絲。除了最后兩個(gè)因素,其他都是毫無(wú)技術(shù)含量即可獲取到的數(shù)據(jù)指標(biāo),跟前面介紹的兩家其實(shí)并無(wú)不同,只不過(guò)新榜和新媒體指數(shù)在這些人人肉眼能夠看到的數(shù)字上加入了人為干預(yù)系數(shù),使之更加趨向于真實(shí)數(shù)值。

微指數(shù)呢,則是提出有效累計(jì)粉絲的概念來(lái)有理有據(jù)的告訴消費(fèi)者我說(shuō)的是對(duì)的,你不需要懷疑。為什么呢?因?yàn)槲疫@個(gè)概念不是說(shuō)賬號(hào)真實(shí)的粉絲數(shù)啊,而是有效累計(jì)粉絲。

這個(gè)概念值是怎么來(lái)的呢?是這樣的,前面我提到過(guò)一個(gè)公眾號(hào)的閱讀轉(zhuǎn)化率平均在8%-10%區(qū)間,那好,閱讀數(shù)不是都能看得到嗎,而且我還可以做出平均值來(lái),甚至我可以說(shuō)我去除了刷量帶來(lái)的虛假閱讀,有效累計(jì)粉絲的值就是根據(jù)閱讀數(shù)倒推來(lái)的。

你不信嗎?如果你真實(shí)的粉絲比我展示的數(shù)字高,那么我可以告訴你高出來(lái)的那些是僵尸粉,你無(wú)法反駁,而我根據(jù)微信官方平均轉(zhuǎn)化區(qū)間倒推出來(lái)的數(shù)字絕對(duì)不會(huì)有錯(cuò),當(dāng)然其中也加了一些權(quán)重,跟新榜、新媒體指數(shù)的權(quán)重添加類似。

同樣概念,新榜也在去年末的時(shí)候推出,但是面臨的同樣的問(wèn)題是預(yù)估粉絲跟賬號(hào)真實(shí)粉絲差距太大,差距的縮小只好拿加權(quán)重來(lái)平衡和消除。

看到這里,不管你對(duì)前面列舉的公式懂沒(méi)懂,相信對(duì)于所謂的微信大數(shù)據(jù)概念有了些許的認(rèn)知了吧,微信公眾號(hào)遠(yuǎn)沒(méi)有你們想象的那么封閉和神秘,很多數(shù)據(jù)都是可以通過(guò)第三方手段進(jìn)行抓取,并且整合分析,進(jìn)而得出相應(yīng)的合乎常理的解釋或者榜單數(shù)據(jù)來(lái)。

自從閱讀數(shù)出現(xiàn)之后,微信的很多數(shù)據(jù)就出現(xiàn)在了人們的眼中,當(dāng)然隨之而來(lái)的另一個(gè)弊端就是刷量平臺(tái)應(yīng)運(yùn)而生,很多賬號(hào)存在閱讀量造假的問(wèn)題,但是閱讀量造假這事兒目前來(lái)說(shuō)還沒(méi)有平臺(tái)監(jiān)測(cè)可以做到,因?yàn)榉?wù)器成本太高,且并無(wú)多大意義,本身互聯(lián)網(wǎng)的水就很深,所有內(nèi)幕大白于天下終歸是不好的。

所有第三方平臺(tái)說(shuō)可以監(jiān)測(cè)到任何賬號(hào)閱讀量造假的說(shuō)法都是吹牛逼,因?yàn)槟壳暗谌奖O(jiān)測(cè)平臺(tái)判定一篇文章閱讀量是否真實(shí)的依據(jù)依然是對(duì)比近期平均閱讀的浮動(dòng),而這是可以通過(guò)刷不同文章的閱讀進(jìn)行模擬真實(shí)閱讀的。

微信公眾號(hào)后臺(tái)現(xiàn)在也出了文章閱讀的來(lái)源來(lái)規(guī)避刷閱讀量的現(xiàn)象,但是就在公眾號(hào)后臺(tái)升級(jí)顯示閱讀來(lái)源的第二天,某刷量平臺(tái)就出現(xiàn)了應(yīng)對(duì)措施,可以刷來(lái)源于不同渠道的閱讀數(shù),真是道高一尺魔高一丈。

對(duì)于第三方平臺(tái),通過(guò)獲取微信公眾號(hào)的部分?jǐn)?shù)據(jù)分析整合號(hào)稱大數(shù)據(jù)實(shí)屬過(guò)分吹噓,就連搜狗作為微信的合作伙伴都拿不到所有的微信接口,而你第三方平臺(tái)僅僅是抓取了用戶眼見(jiàn)的數(shù)據(jù)指標(biāo)就敢號(hào)稱微信大數(shù)據(jù)?我看你們所謂的大數(shù)據(jù)不過(guò)是大概的數(shù)據(jù)吧~

另外,透露一下,真正能夠監(jiān)測(cè)到閱讀量造假的技術(shù)是將監(jiān)測(cè)閱讀數(shù)的時(shí)間無(wú)限細(xì)分,時(shí)間段無(wú)限取中位數(shù),最后描繪出較長(zhǎng)時(shí)間周期內(nèi)的閱讀走勢(shì)。而這樣以來(lái)會(huì)大大增加服務(wù)器的成本,刷閱讀量的服務(wù)器成本是遠(yuǎn)遠(yuǎn)低于監(jiān)測(cè)成本的,所以有水分的互聯(lián)網(wǎng)還是不要太過(guò)吹毛求疵的好,睜一只眼閉一只眼,你高興我也自在。

總體來(lái)說(shuō)呢,說(shuō)到微信大數(shù)據(jù)分析,不過(guò)是可見(jiàn)數(shù)據(jù)的統(tǒng)計(jì)學(xué)展示,至于粉絲用戶人群畫(huà)像以及行為習(xí)慣等因素,已現(xiàn)有的監(jiān)測(cè)手段和接口開(kāi)放程度來(lái)說(shuō)是根本不可能的,如果有哪一方宣稱可以制作人群畫(huà)像,那也不過(guò)是基于手機(jī)型號(hào)大概推測(cè)用戶購(gòu)買力,用戶地區(qū)分布進(jìn)行區(qū)域劃分,男女性別比例進(jìn)行行業(yè)領(lǐng)域?qū)?yīng)等等,而相對(duì)較聰明的做法是將公眾號(hào)對(duì)應(yīng)的微博賬號(hào)粉絲進(jìn)行人群畫(huà)像分析,同樣的結(jié)合部分可見(jiàn)數(shù)據(jù)加權(quán)處理,模擬出大概的人群畫(huà)像,如果不準(zhǔn)確,那就多加幾個(gè)維度往最準(zhǔn)確的人群畫(huà)像進(jìn)行靠攏。

而用戶,尤其是廣告主,需要知道也無(wú)非就是賬號(hào)的有效累計(jì)粉絲,日活躍粉絲以及平均閱讀數(shù)或者頭條平均閱讀數(shù),至于更垂直更嚴(yán)苛的要求對(duì)于廣告投放來(lái)說(shuō)還不是太需要,相比之前公關(guān)公司只給到粉絲數(shù)和廣告報(bào)價(jià)來(lái)說(shuō),現(xiàn)有的第三方監(jiān)測(cè)已經(jīng)做得稍微好一點(diǎn)了,但是別以為做到這樣就是準(zhǔn)確的大數(shù)據(jù),還僅僅是大概數(shù)據(jù)而已,謹(jǐn)以此文告誡公關(guān)公司和廣告主們,不要對(duì)第三方公司的所謂大數(shù)據(jù)過(guò)分信賴,那也只不過(guò)是服務(wù)器幫助人做了計(jì)數(shù)平均取值的活兒而已。

而這種數(shù)據(jù)服務(wù)加到具體的自媒體大號(hào)報(bào)價(jià)里面那可就是你該掏錢(qián)的了,具體利潤(rùn)值多少在此就不便細(xì)說(shuō)了,行業(yè)內(nèi)不同公關(guān)公司報(bào)價(jià)是不一樣的,基于創(chuàng)意策劃的附加值服務(wù)加錢(qián)合情合理,但這種數(shù)據(jù)服務(wù)如果加價(jià)過(guò)高只能就有點(diǎn)太一勞永逸了。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)