大數(shù)據(jù)幫你洗腦:你是如何混淆因果關(guān)系的

責(zé)任編輯:editor004

2015-04-30 13:31:57

摘自:李叫獸

請(qǐng)一句話評(píng)價(jià)下列事件(假設(shè)數(shù)據(jù)是真實(shí)的):研究發(fā)現(xiàn),越是成功人士,睡眠時(shí)間越短。根據(jù)本人潛水博客論壇觀察總結(jié),大部分人的評(píng)價(jià)是這樣的(至少前3個(gè)事件的評(píng)價(jià)是這樣):1,研究發(fā)現(xiàn),越是成功人士,睡眠時(shí)間越短。

這是一個(gè)人人都談大數(shù)據(jù)的時(shí)代,不過數(shù)據(jù)真的是有益的嗎?其實(shí)不一定,數(shù)據(jù)經(jīng)常也會(huì)忽悠人。

請(qǐng)一句話評(píng)價(jià)下列事件(假設(shè)數(shù)據(jù)是真實(shí)的):

研究發(fā)現(xiàn),越是成功人士,睡眠時(shí)間越短。研究發(fā)現(xiàn),女人結(jié)婚后變得更加貧窮,男人結(jié)婚后變得更加富有。研究發(fā)現(xiàn),越富有的人越幸福。研究發(fā)現(xiàn),兒童時(shí)期吃西蘭花越多,成年后往往職業(yè)收入越多。研究發(fā)現(xiàn),去醫(yī)院越多,越容易生病。過去20多年跟蹤研究發(fā)現(xiàn),中國(guó)GDP越高,90后一代身高越高。

……

根據(jù)本人潛水博客論壇觀察總結(jié),大部分人的評(píng)價(jià)是這樣的(至少前3個(gè)事件的評(píng)價(jià)是這樣):

1,研究發(fā)現(xiàn),越是成功人士,睡眠時(shí)間越短。

這么說,我要是不睡覺,是不是薪水就上億了?

2,研究發(fā)現(xiàn),女人結(jié)婚后變得更加貧窮,男人結(jié)婚后變得更加富有。

看來還是女人對(duì)婚姻犧牲大??!結(jié)婚導(dǎo)致女人收入變低,卻增加了男人收入。

3,研究發(fā)現(xiàn),越富有的人越幸福。

屌絲們洗洗睡吧,你幻想的窮開心是不現(xiàn)實(shí)的。

4,研究發(fā)現(xiàn),兒童時(shí)期吃西蘭花越多,成年后往往職業(yè)收入越多。

我勒個(gè)去,都怪我小時(shí)候西蘭花吃少了,大白菜吃多了!

5,研究發(fā)現(xiàn),去醫(yī)院越多,越容易生病。

唉,以后生病還是別去醫(yī)院了。

6,過去20多年跟蹤研究發(fā)現(xiàn),中國(guó)GDP越高,90后一代身高越高。

哇!原來提高GDP還有這好處!不過,如果將來中國(guó)GDP下降,下一代怎么辦?

等等,貌似這上面的邏輯有點(diǎn)問題吧?

實(shí)際上,上面的每一個(gè)推理都有嚴(yán)重的邏輯錯(cuò)誤,都是錯(cuò)把相關(guān)關(guān)系當(dāng)做了因果關(guān)系:

A越多,B越多,這是相關(guān)關(guān)系。

A越多,導(dǎo)致B越多,這是因果關(guān)系。

而如果沒有進(jìn)一步的調(diào)查和理論,相關(guān)關(guān)系是推理不出因果關(guān)系的。

為什么?

請(qǐng)看下面這個(gè)“腦筋急轉(zhuǎn)彎”:

猜猜,下圖的雞和蛋是什么關(guān)系?

  直覺:母雞剛剛下了蛋。

第二直覺:還有可能是這個(gè)母雞是由這個(gè)雞蛋孵化出來的。

其實(shí),它們有4種可能的關(guān)系:

(注:雞蛋例子引用自李宏彬教授講座)

同樣,兩個(gè)“A越多,B越多”這樣的相關(guān)性實(shí)際上有4種可能(以收入和睡眠的為例):

A導(dǎo)致B:更少睡眠導(dǎo)致收入增加。B導(dǎo)致A:收入增加導(dǎo)致睡眠減少。A和B同時(shí)被C導(dǎo)致:隨著年齡的增長(zhǎng),人對(duì)睡眠要求減少,因此睡眠少。同時(shí)年齡大的人,往往經(jīng)驗(yàn)、人脈、知識(shí)更多,也自然收入更多。A和B沒有任何關(guān)系: 美國(guó)、西歐等經(jīng)濟(jì)發(fā)達(dá),導(dǎo)致人們收入高;同時(shí)他們愛吃牛排,導(dǎo)致睡眠需求減少。(數(shù)據(jù)僅為舉例,不代表真有這樣的關(guān)系。)

所以,當(dāng)你看到“睡眠越少,收入越多”這樣的統(tǒng)計(jì)結(jié)果后,不要天真地認(rèn)為只要你減少睡眠,你也能收入變高。

當(dāng)然生活中的確有人是這么做的:

我認(rèn)識(shí)一個(gè)人,看到了這樣一個(gè)微博上流行的統(tǒng)計(jì)結(jié)果后,為了獲得成功而刻意減少睡眠。

甚至,當(dāng)他凌晨2點(diǎn)還在玩DOTA時(shí),你過去問他:“你怎么還不睡?”他的回答是:“睡眠越少,將來越成功!為了賺大錢,我先從減少睡眠開始。而在這漆黑的夜里,只有DOTA能讓我清醒。”

所以,假設(shè)“成功導(dǎo)致睡眠少”而不是“睡眠少導(dǎo)致成功”,你是無法通過減少睡眠而變得更加成功的。就像白種人喜歡吃牛排,但是你無法通過吃牛排變得更白。

除了“成功VS睡眠”之外,其實(shí)上面每個(gè)新聞都有類似的邏輯錯(cuò)誤:

研究發(fā)現(xiàn),女人結(jié)婚后變得更加貧窮,男人結(jié)婚后變得更加富有。

這個(gè)數(shù)據(jù)其實(shí)無法推測(cè)出結(jié)婚讓女人變窮男人變富,還有可能是:預(yù)期自己將來沒什么錢賺的女人更想趕緊把自己嫁出去,而預(yù)期將來能賺很多錢的男人傾向于趕緊找個(gè)老婆。

當(dāng)然,還有可能是其他原因甚至是完全無關(guān)的因素造成了這個(gè)相關(guān)關(guān)系。

研究發(fā)現(xiàn),越富有的人越幸福。

通過這個(gè)數(shù)據(jù)并不能推測(cè)出你賺錢后就能變得更加富有。

實(shí)際上研究證明,當(dāng)金錢超過個(gè)人基本需求之后(比如已經(jīng)吃飽穿暖),對(duì)長(zhǎng)期幸福感沒有顯著影響。

比如中了巨額彩票的人得到的幸福感只是短期的(類似吸毒產(chǎn)生的幸福感),調(diào)查發(fā)現(xiàn),中彩票后6個(gè)月,即使你變得比之前富有上百倍,但是你的幸福感指數(shù)還是維持在6個(gè)月前水平。

(此研究詳細(xì)請(qǐng)看哈佛大學(xué)公開課《幸福課》,by Tal-Ben Sharhar)

那么為什么我們發(fā)現(xiàn)富有的人往往很幸福呢?

其實(shí)這是因?yàn)楦挥泻烷L(zhǎng)期幸福都由類似的因素導(dǎo)致:自信、熱忱、勤奮等。所以,你的自信、熱忱、勤奮等情商特征有2個(gè)產(chǎn)物:

能夠提升你長(zhǎng)期幸福感,讓你覺得生活更加有意義能夠讓你賺錢升職。但這不代表賺錢本身可以提高長(zhǎng)期幸福感。

  所以,“窮開心”還是存在的。

研究發(fā)現(xiàn),兒童時(shí)期吃西蘭花越多,成年后往往職業(yè)收入越多。

這個(gè)新聞是我YY的,但是這句話絕對(duì)的正確的!

為什么呢?因?yàn)闅W美國(guó)家的人往往吃西蘭花更多,而這些國(guó)家的普遍職業(yè)收入也很高,所以在全球統(tǒng)計(jì)數(shù)據(jù)上自然會(huì)發(fā)現(xiàn)“西蘭花攝入量”和“職業(yè)收入”的相關(guān)關(guān)系。

  但是這并不代表你增加西蘭花的攝入會(huì)提高未來收入!

研究發(fā)現(xiàn),去醫(yī)院越多,越容易生病。

嗯,這個(gè)也是我YY的研究,但數(shù)據(jù)也是千真萬確!但是這不代表不去醫(yī)院你就不生病了,因?yàn)椴皇?ldquo;去醫(yī)院導(dǎo)致你生病”,而不是“生病導(dǎo)致你去醫(yī)院”。

過去20多年跟蹤研究發(fā)現(xiàn),中國(guó)GDP越高,90后一代身高越高。

這更是絕對(duì)真實(shí)數(shù)據(jù)!

中國(guó)GDP和90后的身高自然是正相關(guān)啊—中國(guó)GDP從1990年的不到2萬億漲到2013年的50多萬億,90年出生的人身高也從0厘米增長(zhǎng)到170厘米。但是這并不能證明是中國(guó)GDP幫助了90后長(zhǎng)高。

   為什么我們總是錯(cuò)把“相關(guān)”當(dāng)“因果”?

先看下面這樣圖,如果讓你對(duì)圖中的形狀分組,你的第一直覺是什么?

我想大部分人是按照位置分類—把圖中的圖形按照上邊的、左邊的右邊的分為3組。

但是相互靠近的圖形可能并沒有任何關(guān)系,這樣分類可能是無效的。

那怎么不按照形狀分類呢?第一反應(yīng)怎么不是把圖形分成三角形、正方形和圓形?

這是因?yàn)槲覀?strong>本能—覺得相互靠近的東西一定是有關(guān)系的,同時(shí)出現(xiàn)的事件也一定是有關(guān)系的!

這樣的本能在遠(yuǎn)古時(shí)代是很有用的,可以幫助人類在陌生的叢林中生存下來。

當(dāng)他們發(fā)現(xiàn)了一個(gè)果殼,從而推測(cè)出這片森林有大片果樹;當(dāng)他們聽到雷聲,從而覺得雷聲導(dǎo)致了下雨,得趕緊避雨了等等。這些本能幫助人們更好的在那個(gè)簡(jiǎn)單、直接的世界生存。

但是現(xiàn)在社會(huì)瞬息萬變,信息復(fù)雜程度不知道超過遠(yuǎn)古時(shí)代多少倍,我們已經(jīng)無法通過簡(jiǎn)單的相關(guān)關(guān)系來推測(cè)因果了。同時(shí)出現(xiàn)的事件可能毫無關(guān)系,因果的順序也可能完全顛倒。

同時(shí)無數(shù)的錯(cuò)覺思維和錯(cuò)誤歸因不斷發(fā)生,比如:

1,大眾對(duì)新聞的錯(cuò)誤歸因

假設(shè)你看到這樣的新聞:

《同性戀搶劫超市,致6人死亡》

網(wǎng)友評(píng)價(jià):同性戀就是喜歡搶劫!以后遇到他們小心點(diǎn)!

但是,你怎么知道他們的搶劫行為是因?yàn)樗麄兊男匀∠驅(qū)е碌??如果搶劫劫匪?1碼的鞋,今后你會(huì)從此遠(yuǎn)離41碼鞋的人嗎?“同性戀”和“搶劫”只不過是同時(shí)發(fā)生的事件,并不代表它們有關(guān)系。

當(dāng)然,媒體人們?yōu)榱颂岣唿c(diǎn)擊率,經(jīng)常使用這樣的技巧:讓新聞當(dāng)事人的某個(gè)差異性特征出現(xiàn)在新聞上,從而讓大眾把“相關(guān)當(dāng)因果”,覺得是這個(gè)差異性特征導(dǎo)致了他的行為。

類似的新聞評(píng)論還有:

外籍男坐過車站搶方向盤敲打司機(jī)

這是因?yàn)樗?ldquo;外籍”的身份而導(dǎo)致其打司機(jī)嗎?中國(guó)人自己不打司機(jī)?

明星柯震東吸毒!當(dāng)明星真是容易墮落!

柯震東等人是因?yàn)槌雒締??難道你出名后容易吸毒或者你吸毒后容易出名?

2,盲目學(xué)習(xí)和模仿

我們經(jīng)常盲目模仿成功者的特點(diǎn),覺得模仿了他的特點(diǎn),我們也能成功。

比如知名的大學(xué)無用論:比爾蓋茨和扎克伯格都是輟學(xué)后才成功的,所以為了成功,我沒必要上大學(xué)。

請(qǐng)問:他們是輟學(xué)導(dǎo)致了成功,還是成功導(dǎo)致了輟學(xué),還是其他因素影響?

健康的人都不去醫(yī)院,所以你堅(jiān)持不去醫(yī)院,你就能變得健康?

再比如企業(yè)管理的例子:

蘋果公司很成功,同時(shí)它給設(shè)計(jì)師付出的薪水也是最高的。難道就說明它的成功是由其設(shè)計(jì)師的高薪水導(dǎo)致的?所以你提高自己公司設(shè)計(jì)師的薪水,你就能成功?

3,刻意規(guī)避和迷信

你可能對(duì)這個(gè)故事感覺到很熟悉:

唉,有一年我第一次吃榴蓮,結(jié)果當(dāng)天就遇到了車禍,從此以后,我就再也不敢吃榴蓮了。

實(shí)際上主人公的車禍和榴蓮可能沒有任何關(guān)系,但是因?yàn)槭?ldquo;同時(shí)發(fā)生的事件”,主人公潛意識(shí)覺得吃榴蓮導(dǎo)致了車禍,從而對(duì)榴蓮一輩子心有芥蒂。

錯(cuò)把相關(guān)當(dāng)做因果是很多讓人難以理解的迷信的根源之一。

比如在我家鄉(xiāng)都有敬車的習(xí)慣(每年固定時(shí)間向燒紙向上天祈福平安),但是去年突然變更了敬車的習(xí)俗—由過去的車頭向北變成了車頭向南。后來我才知道是因?yàn)槿ツ瓿隽撕芏嘬嚨?,大家覺得是敬車時(shí)車頭向北導(dǎo)致的(相關(guān)變因果),從而今年改成了向南。

所以,如果你仔細(xì)觀察,很多讓你難以理解的祖?zhèn)鹘?,?shí)際上可能是當(dāng)年某個(gè)相關(guān)事件的發(fā)生導(dǎo)致的—比如出了車禍就再也不吃榴蓮了。

結(jié)語:

我們正在面臨越來越多的數(shù)據(jù)和越來越多的復(fù)雜事件,同時(shí)也被要求做出越來越準(zhǔn)確的決策。為了應(yīng)對(duì)這樣的問題,請(qǐng)不要忘記—別拿相關(guān)當(dāng)因果,數(shù)據(jù)也會(huì)忽悠你!

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)