大數(shù)據(jù)VS心理學:大數(shù)據(jù)將革新心理學-互聯(lián)網(wǎng)分析沙龍

責任編輯:editor007

2016-03-17 21:50:04

摘自:互聯(lián)網(wǎng)分析沙龍

數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識,然后人們在數(shù)據(jù)挖掘的基礎(chǔ)上再進行明確目標的數(shù)據(jù)分析。大數(shù)據(jù)就像金庸筆下的俠客,武功高強,出神入化,萬夫莫敵,但容易劍走偏鋒,走火入魔。

行業(yè)數(shù)據(jù)

大數(shù)據(jù)VS心理學:大數(shù)據(jù)將革新心理學

什么是心理學?

依照百度百科的描述,心理學是一門研究人類的心理現(xiàn)象、精神功能和行為的科學。心理學研究涉及知覺、認知、情緒、人格、行為、人際關(guān)系、社會關(guān)系等許多領(lǐng)域,也與日常生活的許多領(lǐng)域——家庭、教育、健康、社會等發(fā)生關(guān)聯(lián)。

心理學一方面嘗試用大腦運作來解釋個體基本的行為與心理機能;同時,心理學也嘗試解釋個體心理機能在社會行為與社會動力中的角色;而且,它也與神經(jīng)科學、醫(yī)學、生物學等科學有關(guān),因為這些科學所探討的生理作用會影響個體的心智。

心理學包括基礎(chǔ)心理學與應(yīng)用心理學兩大領(lǐng)域。心理學家從事基礎(chǔ)研究的目的是描述、解釋、預(yù)測和影響行為。應(yīng)用心理學家還有第五個目的——提高人類生活的質(zhì)量。這些目標構(gòu)成了心理學事業(yè)的基礎(chǔ)。

依照傳統(tǒng)的方法,心理學數(shù)據(jù)分析依靠的是樣本,而心理學樣本基本上是小樣本,樣本可以是幾百人,或者多達5000人,但終究還是樣本,這離理論上的樣本數(shù)目還是相差甚遠,其分析結(jié)果依然被認為不夠準確,需要不斷地對模型進行學習和訓練來提高所謂的準確度。所以,可以這么說,心理學由于其的特點,限制了心理學科的發(fā)展。

大數(shù)據(jù)時代的來臨

如今人工智能和計算機科學的大力發(fā)展讓認知研究發(fā)生了革命性的變化。很多的數(shù)據(jù)已經(jīng)不需要心理學家們?nèi)タ桃獠杉?,人們在互?lián)網(wǎng)的世界里,自覺自愿或者無意識地提供一種真實、準確、及時的數(shù)據(jù),這就是社會媒體的數(shù)據(jù),這個數(shù)據(jù)就是大數(shù)據(jù)。

在一些大型的互聯(lián)網(wǎng)公司手中,就有很多這種準確記錄了用戶行為的大數(shù)據(jù)資料。在大數(shù)據(jù)時代,有人可以做到比你自己更了解你自己。大數(shù)據(jù)已經(jīng)對我們的社會科學、人文科學會產(chǎn)生很大的影響。

什么是大數(shù)據(jù)?

大數(shù)據(jù)是一個含義廣泛的術(shù)語,是指面對的數(shù)據(jù)集是如此的龐大而復雜,需要專門設(shè)計的硬件和軟件工具進行處理。該數(shù)據(jù)集通常是萬億字節(jié)或EB字節(jié)的大小。這些數(shù)據(jù)集收集自各種各樣的來源:傳感器、氣候信息、公開的信息、如雜志、報紙、文章,可能是線性的,但更多的是非線性的。大數(shù)據(jù)產(chǎn)生的其他例子包括購買交易記錄、網(wǎng)絡(luò)日志、病歷、事監(jiān)控、視頻和圖像檔案、及大型電子商務(wù)。大數(shù)據(jù)分析是在研究大量的數(shù)據(jù)的過程中尋找模式、相關(guān)性和其他有用的信息,它可以幫助公司政府等更好地適應(yīng)變化,并做出更明智的決策。

這就是,人們通常用4個V(即Volume、Variety、Value、Velocity)來描述大數(shù)據(jù)的特征:數(shù)據(jù)體量巨大(Volume);數(shù)據(jù)類型繁多(Variety,結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù));價值密度低(Value) ;處理速度要求快(Velocity,在巨大的數(shù)據(jù)量面前,對處理速度的要求就顯得“大”)。

什么是數(shù)據(jù)挖掘?

數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識,然后人們在數(shù)據(jù)挖掘的基礎(chǔ)上再進行明確目標的數(shù)據(jù)分析。

數(shù)據(jù)挖掘中最經(jīng)典算法就是PageRank。PageRank是Google背后最重要的算法,他是Google創(chuàng)始人之一拉里·佩奇(Larry Page)提出,并且在2001年9月被授予美國專利。PageRank里的page可是認為是網(wǎng)頁,表示網(wǎng)頁排名,也可以認為是Larry Page(google 產(chǎn)品經(jīng)理),因為他是這個算法的發(fā)明者之一,還是指佩奇(Larry Page),即這個等級方法是以佩奇來命名的。PageRank根據(jù)網(wǎng)站的外部鏈接和內(nèi)部鏈接的數(shù)量和質(zhì)量,衡量網(wǎng)站的價值。PageRank背后的概念是,每個到頁面的鏈接都是對該頁面的一次投票,被鏈接的越多,就意味著被其他網(wǎng)站投票越多,也意味著PageRank越高。PageRank其級別從0到10級,10級為滿分。一般PR值達到4,就算是一個不錯的網(wǎng)站了。Google把自己的網(wǎng)站的PR值定到10。

大數(shù)據(jù)與心理學的結(jié)合

當然,任何手段都不是萬能的。“大數(shù)據(jù)”也有其不擅長的方面,

首先,數(shù)據(jù)不懂社交。大腦在計算方面很差勁(不信你可以心算一下678的平方是多少),但是大腦懂得社會認知。人們擅長反射彼此的情緒狀態(tài),擅長偵測出不合作的行為,擅長用情緒為事物賦予價值。

計算機擅長計算“量”而非“質(zhì)”。計算機可以計算出你在83%的時間里與6名同事的社交互動情況,但是他們不可能捕捉到你心底對于那些多年未見的童年玩伴的感情,更不必說賈寶玉對于僅有三面之緣的史湘云的感情了。因此,在社交關(guān)系的決策中,不要愚蠢到放棄自己的感覺和思考,而去相信你桌子上的那臺筆記本。

而且,數(shù)據(jù)偏愛潮流,忽視杰作。當大量個體對某種文化產(chǎn)品迅速產(chǎn)生興趣時,數(shù)據(jù)分析可以敏銳地偵測到這種趨勢。但是,一些重要的(也是有收益的)特性有可能在一開始就被數(shù)據(jù)擯棄了,僅僅因為它們的特異之處不為人所熟知。

大數(shù)據(jù)就像金庸筆下的俠客,武功高強,出神入化,萬夫莫敵,但容易劍走偏鋒,走火入魔。這是引入大數(shù)據(jù)推進心理學研究,一定要注意的。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號