以互聯(lián)網(wǎng)和信息科學(xué)技術(shù)的快速發(fā)展推動(dòng)的信息技術(shù)革命,使得人類步入了數(shù)據(jù)充裕的數(shù)字化信息時(shí)代。在生產(chǎn)、存儲(chǔ)數(shù)據(jù)的能力獲得了巨大發(fā)展的信息化時(shí)代,人們生活在一個(gè)規(guī)模難以想象的龐大數(shù)字化世界里。人們在論壇、博客、微博、微信、電子商務(wù)交易平臺(tái)、搜索引擎等平臺(tái)上積累的海量數(shù)據(jù),成為大數(shù)據(jù)時(shí)代寶貴的信息資源和財(cái)富。目前,大數(shù)據(jù)已經(jīng)被廣泛應(yīng)用于政治選舉、企業(yè)(尤其是電子商務(wù)公司)戰(zhàn)略布局、金融交易、生物研發(fā)、醫(yī)療衛(wèi)生、國防安全、公共管理、社會(huì)治安、交通管理、氣象監(jiān)測等諸多實(shí)踐領(lǐng)域。
一、心理學(xué)與大數(shù)據(jù)的相遇
網(wǎng)絡(luò)的廣泛應(yīng)用以及與現(xiàn)實(shí)的密切交織,不僅改變了人們的生活方式,也推動(dòng)了學(xué)術(shù)研究范式的變革。[1]一方面,海量的(移動(dòng))互聯(lián)網(wǎng)用戶借助微博、論壇等社交媒體產(chǎn)品和移動(dòng)互聯(lián)網(wǎng)工具記錄自己的生活,并高密度地進(jìn)行突破傳統(tǒng)時(shí)間、空間限制的人際、人機(jī)互動(dòng),積累了前所未有的海量在線文本、圖片、視頻信息;另一方面,數(shù)據(jù)挖掘等計(jì)算機(jī)和信息科學(xué)技術(shù)的發(fā)展,使得高效處理和分析海量人類行為數(shù)據(jù)成為可能,從而奠定了海量數(shù)據(jù)挖掘的技術(shù)基礎(chǔ)。[2]網(wǎng)絡(luò)大數(shù)據(jù)為社會(huì)科學(xué)的發(fā)展帶來了前所未有的機(jī)遇,Lazer等一批來自政治學(xué)、計(jì)算機(jī)科學(xué)等諸多跨學(xué)科領(lǐng)域的研究者于2009年在《科學(xué)》雜志上聯(lián)合撰文,正式提出了“計(jì)算社會(huì)科學(xué)”(Computational Social Science)的研究領(lǐng)域。[3]
心理學(xué)作為社會(huì)科學(xué)的重要組成部分,致力于探討人類的心理與行為規(guī)律。(移動(dòng))互聯(lián)網(wǎng)平臺(tái)和網(wǎng)絡(luò)應(yīng)用積累的海量網(wǎng)絡(luò)大數(shù)據(jù)記載著大規(guī)模人群所思、所想和所感,這為挖掘人類的心理與行為規(guī)律提供了龐大、客觀、真實(shí)的數(shù)據(jù)資源。尤其是現(xiàn)代化數(shù)據(jù)分析技術(shù)的發(fā)展,例如,開源統(tǒng)計(jì)分析軟件R語言、社會(huì)網(wǎng)絡(luò)分析技術(shù),為數(shù)據(jù)挖掘和數(shù)據(jù)分析提供了堅(jiān)實(shí)的技術(shù)支撐。受信息科學(xué)在生物基因、天文學(xué)等領(lǐng)域成功應(yīng)用的啟發(fā),Yarkoni首次提出了“心理信息學(xué)”(Psychoinformatics)這一新穎的交叉學(xué)科概念。他把利用計(jì)算機(jī)和信息科學(xué)技術(shù)工具來獲取、管理和分析心理學(xué)數(shù)據(jù)的研究領(lǐng)域稱為“心理信息學(xué)”。[4]作為一門立足于心理學(xué)研究問題的新興交叉學(xué)科,心理信息學(xué)的研究重點(diǎn)關(guān)注如何借助計(jì)算機(jī)和信息科學(xué)技術(shù)的優(yōu)勢,在心理學(xué)研究的各個(gè)分支領(lǐng)域和研究環(huán)節(jié)中充分發(fā)揮作用,從而為心理學(xué)問題提供更為科學(xué)、客觀的研究證據(jù)。[1]
正如計(jì)算社會(huì)科學(xué)可追溯到社會(huì)物理學(xué)、社會(huì)計(jì)算(social computing)等研究領(lǐng)域,心理學(xué)與大數(shù)據(jù)、信息科學(xué)的相遇,并非出于歷史的偶然巧合,而是心理學(xué)與信息科學(xué)為尋求自身發(fā)展而產(chǎn)生的必然結(jié)合。[1]心理學(xué)與大數(shù)據(jù)、信息科學(xué)的結(jié)合最早可追溯到1998年Nowak等提出的計(jì)算社會(huì)心理學(xué)(computational social psychology)研究領(lǐng)域。[2]該領(lǐng)域最早的內(nèi)涵是指利用計(jì)算機(jī)模擬的技術(shù)手段對社會(huì)心理學(xué)中的群體心理與行為進(jìn)行建模和仿真模擬,從而揭示社會(huì)群體的心理與行為模式和規(guī)律特征。但后來隨著計(jì)算機(jī)科學(xué)技術(shù)的發(fā)展,尤其是社交媒體的發(fā)展,信息科學(xué)可為心理學(xué)提供的不再局限于仿真模擬這樣一種特定的技術(shù)手段,而是數(shù)據(jù)獲取、數(shù)據(jù)管理、數(shù)據(jù)分析等全方位的支持。研究者通過計(jì)算機(jī)數(shù)據(jù)抓取手段(例如,網(wǎng)絡(luò)爬蟲)或由網(wǎng)絡(luò)服務(wù)商提供獲得的Twitter、新浪微博、Google網(wǎng)絡(luò)搜索等網(wǎng)絡(luò)大數(shù)據(jù),在數(shù)據(jù)的樣本覆蓋量、時(shí)間精度等方面都具有突破性優(yōu)勢。此外,研究者可以通過(移動(dòng))互聯(lián)網(wǎng)平臺(tái)和以更經(jīng)濟(jì)、更快捷的方式,招募大批量的被試,從而完成在線問卷調(diào)查或網(wǎng)絡(luò)心理學(xué)實(shí)驗(yàn)。例如,比較流行的在線問卷調(diào)查平臺(tái)“調(diào)查猴子”(Survey Monkey),和被試招募平臺(tái)“亞馬遜土耳其機(jī)器人”(Amazon's Mechanical Turk,MTurk)。有研究證據(jù)表明,由于網(wǎng)絡(luò)覆蓋面廣、成本低等優(yōu)勢的存在,通過網(wǎng)絡(luò)平臺(tái)收集的數(shù)據(jù)在樣本多樣性、數(shù)據(jù)質(zhì)量等方面等同于甚至高于傳統(tǒng)研究方法采用的數(shù)據(jù)收集手段。[5-6]
心理學(xué)與網(wǎng)絡(luò)大數(shù)據(jù)的結(jié)合,既為傳統(tǒng)心理學(xué)通過具有代表性的大樣本深入挖掘個(gè)體層面的心理與行為機(jī)制提供了更為廣闊的平臺(tái)和機(jī)會(huì),也同時(shí)為深入挖掘大規(guī)模人群在群體層面涌現(xiàn)出來的群體心理行為規(guī)律提供了可能。近些年,在心理學(xué)等社會(huì)科學(xué)和信息科學(xué)研究者的合作和共同努力下,在應(yīng)用社會(huì)心理學(xué)的諸多領(lǐng)域取得了一批具有代表性意義的研究成果。
二、大數(shù)據(jù)視角下的社會(huì)心理學(xué)研究進(jìn)展
(一)大數(shù)據(jù)與情緒心理學(xué)
情緒是心理學(xué)研究的重要研究對象之一,也是目前為止和大數(shù)據(jù)結(jié)合最為緊密、成果最為豐富的研究領(lǐng)域。傳統(tǒng)心理學(xué)關(guān)于個(gè)體情緒在日周期水平上的波動(dòng)節(jié)律研究,尤其是主要圍繞積極情緒和消極情緒開展的研究,一直沒有得到較為一致的結(jié)果。在分析其原因時(shí),研究者普遍承認(rèn)目前的研究抽樣存在偏差(主要以美國大學(xué)生樣本為主),在實(shí)驗(yàn)室或者通過自我報(bào)告的調(diào)查等測量方式對情緒的波動(dòng)節(jié)律進(jìn)行精確測量也均存在較大的偏差。但遵循心理學(xué)范式的研究者又暫時(shí)無法找到切實(shí)可行的,能夠?qū)缥幕髽颖救巳哼M(jìn)行數(shù)周以上以小時(shí)為時(shí)間精度上追蹤研究的測量方法??紤]到以上研究現(xiàn)狀,美國康奈爾大學(xué)心理學(xué)家Golder和其合作者M(jìn)acy認(rèn)為,社交媒體的興起及其產(chǎn)生的覆蓋跨文化、大樣本、客觀、實(shí)時(shí)的海量用戶行為數(shù)據(jù),為解決這一困境提供了可能。[7]他們發(fā)表在《科學(xué)》雜志的一項(xiàng)研究分析了2008年2月至2010年1月期間,覆蓋全球84個(gè)使用英文的國家,約240多萬用戶產(chǎn)生的5億多條Twitter數(shù)據(jù)的情緒信息。結(jié)果發(fā)現(xiàn),積極情緒和消極情緒在一周七天內(nèi)的波動(dòng)節(jié)律幾乎一致,積極情緒在周六、周日顯著高于工作日。在日內(nèi)波動(dòng)上,積極情緒在早上(大約在人們上班的時(shí)間)開始下降,而在晚上(大約在人們下班的時(shí)間)回升;而消極情緒則在早上(早上7~9點(diǎn)附近)達(dá)到最低點(diǎn),隨后在一天內(nèi)均呈上升趨勢,達(dá)到0點(diǎn)左右的峰值。這種模式支持了人們可通過一晚上的睡眠恢復(fù)情緒的假設(shè)。關(guān)于積極情緒和消極情緒的關(guān)系,研究者發(fā)現(xiàn)消極情緒的波動(dòng)模式并不完全等同于積極情緒的反向波動(dòng)特征,二者僅呈現(xiàn)出低度相關(guān)(r=-0.08)。該證據(jù)通過跨文化、地域的大樣本數(shù)據(jù)為積極情緒和消極情緒是兩個(gè)獨(dú)立的維度提供了支持。研究者進(jìn)一步由情緒的日內(nèi)波動(dòng)規(guī)律拓展到季節(jié)性波動(dòng)規(guī)律,并嘗試同樣借助Twitter情緒數(shù)據(jù)探索當(dāng)前心理學(xué)研究中關(guān)于季節(jié)性情感障礙的成因的兩種觀點(diǎn),即光照時(shí)間不足的解釋和基于生物晝夜節(jié)律的“階段轉(zhuǎn)換假說”(Phase-shift Hypothesis)。結(jié)果發(fā)現(xiàn),絕對日照時(shí)長對積極情緒和消極情緒均沒有顯著作用,但相對日照時(shí)長卻與情緒有顯著關(guān)聯(lián)。因此,該結(jié)果支持了有關(guān)情緒與季節(jié)關(guān)聯(lián)的“階段轉(zhuǎn)換假說”,而沒有獲得“情緒隨日照時(shí)間變化”的競爭假說證據(jù)。[7]
情緒傳染和情緒傳播也是社會(huì)心理學(xué)中關(guān)于社會(huì)影響領(lǐng)域的重要議題。Kramer等基于Facebook上近69萬用戶的實(shí)驗(yàn)研究發(fā)現(xiàn),人們的情緒狀態(tài)會(huì)無意識(shí)地體驗(yàn)到與他人相同的情緒狀態(tài),即情緒可通過情緒傳染機(jī)制傳播給他人。他們通過客觀實(shí)驗(yàn)的方法證實(shí)了僅僅暴露在完全缺乏非言語線索的好友情緒表達(dá)的網(wǎng)絡(luò)環(huán)境中也可以發(fā)生情緒傳染效應(yīng)。[8]Coviello等也探討了類似的問題,研究者抓取了2009年1月至2012年3月期間美國100個(gè)大城市Facebook用戶的“狀態(tài)”數(shù)據(jù),結(jié)果發(fā)現(xiàn),下雨天會(huì)直接影響人們的Facebook狀態(tài)中的情緒水平,有趣的是,這種情緒狀態(tài)還能進(jìn)一步影響到遠(yuǎn)在其他城市,沒有直接體驗(yàn)到下雨天氣的好友的情緒水平。該研究也證實(shí)了情緒傳染的傳染機(jī)制,并且揭示了在線社交網(wǎng)絡(luò)在放大全球情緒同步中扮演的重要作用。[9]Facebook數(shù)據(jù)已經(jīng)成為心理學(xué)研究者探索大規(guī)模人群社會(huì)影響作用機(jī)制的重要工具。例如,Aral和Walker通過130萬Facebook用戶的隨機(jī)實(shí)驗(yàn),較為系統(tǒng)地揭示了人們在社交網(wǎng)絡(luò)中影響力和易受影響程度的規(guī)律特征。結(jié)果發(fā)現(xiàn):年輕人相對年長者更容易被影響;男性比女性影響力大,但女性對男性的影響力比她們對其他女性的影響力大;已婚人士在新產(chǎn)品決策中最不容易受影響。[10]
(二)大數(shù)據(jù)與人格心理學(xué)
揭示人們心理行為一般規(guī)律的人格心理學(xué)是心理學(xué)的基礎(chǔ)性研究領(lǐng)域。傳統(tǒng)心理學(xué)研究主要通過自我報(bào)告的線下問卷調(diào)查方法對人格結(jié)構(gòu)開展了一系列卓有成效的研究,例如經(jīng)典的“大五人格模型”(Five-factor Model)。對于人格心理學(xué)研究者而言,網(wǎng)絡(luò)大數(shù)據(jù)為刻畫和挖掘人們的心理行為規(guī)律提供了新的視角和數(shù)據(jù)資源。對于計(jì)算機(jī)科學(xué)領(lǐng)域的研究者而言,挖掘用戶的心理與行為規(guī)律對于提高技術(shù)的準(zhǔn)確度、提升產(chǎn)品的用戶體驗(yàn)具有重要意義。因此,基于大數(shù)據(jù)的人格心理學(xué)研究,也成為了心理學(xué)與信息科學(xué)結(jié)合的重要研究議題。
語言被認(rèn)為是人們在表達(dá)自己內(nèi)在想法和感受時(shí)使用最為普遍、穩(wěn)定的方式。因此,研究者致力于挖掘人們在網(wǎng)絡(luò)上的語言表達(dá)與人格特征之間的關(guān)聯(lián)。例如,Schwartz等基于7.5萬志愿者提供的人格測驗(yàn)結(jié)果,以及從用戶Facebook信息中提取得到的7億條單詞、短語和話題數(shù)據(jù),較為系統(tǒng)地探索了用戶在Facebook上的語言表達(dá)與其人格、性別、年齡之間的關(guān)系。結(jié)果發(fā)現(xiàn):外向型的用戶更傾向于提及“聚會(huì)”“愛你”等詞匯;開放型的用戶更傾向于提及“音樂”“藝術(shù)”“夢想”等詞匯;而神經(jīng)質(zhì)的用戶則更傾向于提及“厭煩”“抑郁”等詞匯。研究者采用了開源詞匯技術(shù)(open-vocabulary technique)來構(gòu)建人格預(yù)測模型,并在樣本外測試中達(dá)到了91.9%的預(yù)測準(zhǔn)確率。[11]該團(tuán)隊(duì)的Park等進(jìn)一步通過Facebook用戶的樣本檢驗(yàn)了該人格預(yù)測模型的穩(wěn)健性,結(jié)果證明了基于社交媒體語言表達(dá)數(shù)據(jù)和開源詞匯技術(shù)的自動(dòng)化人格預(yù)測模型具有較好的信度和外在效度。[12]
還有不少研究發(fā)現(xiàn),人們在社交網(wǎng)絡(luò)上的一些客觀行為,例如Facebook上的點(diǎn)贊行為,也為開發(fā)自動(dòng)化預(yù)測用戶人格或其他屬性的計(jì)算機(jī)模型提供了可能。例如,Kosinski等通過5.8萬Facebook用戶的點(diǎn)贊數(shù)據(jù)、人格測試等心理測驗(yàn)數(shù)據(jù)以及人口統(tǒng)計(jì)學(xué)調(diào)查數(shù)據(jù),發(fā)現(xiàn)人們在Facebook的點(diǎn)贊數(shù)據(jù)能自動(dòng)化地、較為準(zhǔn)確地預(yù)測出用戶的人格、性取向、民族、宗教信仰、政治觀點(diǎn)、幸福感、物質(zhì)濫用、年齡、性別等特征和屬性。其中,對開放性人格維度的預(yù)測準(zhǔn)確性幾乎與標(biāo)準(zhǔn)化的人格測試精度相近,對性取向的預(yù)測準(zhǔn)確率達(dá)到88%,對民主主義和自由主義的政治態(tài)度預(yù)測準(zhǔn)確率達(dá)到85%。[13]Wu等通過8.6萬Facebook用戶網(wǎng)絡(luò)賬戶信息和人格測試數(shù)據(jù)發(fā)現(xiàn),基于用戶的Facebook點(diǎn)贊等電子化行為信息構(gòu)建的機(jī)器學(xué)習(xí)計(jì)算機(jī)模型對人格具有顯著預(yù)測力。尤為有趣的是,基于Facebook點(diǎn)贊數(shù)據(jù)構(gòu)建的人格預(yù)測模型(與用戶自身的人格測驗(yàn)相關(guān)r=0.56)準(zhǔn)確率要比與用戶關(guān)系親密的好友通過問卷調(diào)查的判斷(r=0.49)準(zhǔn)確率還高。[14]
(三)大數(shù)據(jù)與行為金融學(xué)
行為金融學(xué)的研究致力于揭示人們的非理性成分在金融決策中的作用,或者說人們在有限理性情境下的決策規(guī)律。其中,以情緒與決策之間的關(guān)系最具代表性,例如,情緒預(yù)測股市的研究。賴凱聲等對情緒預(yù)測股市的理論機(jī)制,圍繞投資者情緒指標(biāo)、社會(huì)情緒指標(biāo)的實(shí)證研究等多方面進(jìn)行了較為系統(tǒng)的梳理。[15]他們認(rèn)為,近些年隨著網(wǎng)絡(luò)的普及和信息科學(xué)技術(shù)的發(fā)展,基于網(wǎng)絡(luò)大數(shù)據(jù)的社會(huì)情緒研究,為情緒與股市的關(guān)系這一遠(yuǎn)未形成定論的研究領(lǐng)域注入了新的活力。尤其是考慮到股市走勢是宏觀群體層面市場投資者共同決策的結(jié)果,傳統(tǒng)行為經(jīng)濟(jì)學(xué)常用的實(shí)驗(yàn)范式難以直接回答宏觀群體心理與金融決策之間的關(guān)系。因此,基于人們在網(wǎng)絡(luò)環(huán)境下留下的客觀行為數(shù)據(jù)成為挖掘群體心理與宏觀金融決策關(guān)系研究的重要線索。
例如,Bollen等利用心理學(xué)情緒量表設(shè)定的情緒分類標(biāo)準(zhǔn),分析了2008年美國微博網(wǎng)站Twitter上的海量數(shù)據(jù),發(fā)現(xiàn)Twitter用戶微博條目中的“鎮(zhèn)定”(calm)類情緒詞匯量變化趨勢可以成功預(yù)測2~6天后美國道瓊斯工業(yè)指數(shù)的升降趨勢,對于指數(shù)升降的預(yù)測準(zhǔn)確率可達(dá)到87%。[16]Bordino等的研究發(fā)現(xiàn),納斯達(dá)克100指數(shù)與其成分股的雅虎搜索量顯著相關(guān),并且在搜索指數(shù)的峰值附近有提前1天的預(yù)測作用。[17]Preis等系統(tǒng)考察了98個(gè)金融相關(guān)詞匯的Google搜索數(shù)據(jù)與美國股市走勢之間的關(guān)系。結(jié)果發(fā)現(xiàn)金融詞匯的搜索數(shù)據(jù)能提前預(yù)測股市的走勢,并且也證明了基于以上規(guī)律構(gòu)建的量化策略的確能跑贏隨機(jī)策略。[18]
(四)大數(shù)據(jù)與健康心理學(xué)
隨著人們對健康問題的關(guān)注,與健康相關(guān)的心理與行為規(guī)律也逐漸受到公共醫(yī)學(xué)、心理學(xué)等跨學(xué)科領(lǐng)域研究者的關(guān)注。大數(shù)據(jù)應(yīng)用于健康相關(guān)的研究議題,無論是在學(xué)術(shù)界還是產(chǎn)業(yè)界都是關(guān)注度非常高的應(yīng)用領(lǐng)域之一。利用網(wǎng)絡(luò)大數(shù)據(jù)進(jìn)行健康心理領(lǐng)域研究的基本前提假設(shè)是:人們線下的健康狀況、健康行為等特征與其在線上的社交媒體表達(dá)、網(wǎng)絡(luò)搜索關(guān)注等行為之間存在一定的聯(lián)系。因此,基于大數(shù)據(jù)的健康心理學(xué)研究,可通過人們在網(wǎng)絡(luò)上行為特征來盡可能地揭示、解釋甚至預(yù)測人們的健康狀況。
例如,Ginsberg等認(rèn)為,每年大約有9 000萬成年人會(huì)通過網(wǎng)絡(luò)搜索引擎搜索特定疾病相關(guān)的信息,這為通過網(wǎng)絡(luò)搜索引擎數(shù)據(jù)監(jiān)測疾病暴發(fā)狀況提供了可能。[19]他們利用人們在Google上5 000萬條搜索數(shù)據(jù),成功開發(fā)了預(yù)測季節(jié)性流感傳播的模型。相較于傳統(tǒng)的流感預(yù)測工作,由于數(shù)據(jù)收集方法和過程的限制,往往會(huì)有1至2周的延遲。因此,他們的預(yù)測研究對于監(jiān)測和預(yù)測流感的暴發(fā)趨勢,從而為政府相關(guān)部門做好流感應(yīng)急準(zhǔn)備和部署具有重要的價(jià)值。該研究引領(lǐng)了一大批基于網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測各種疾病的探索和嘗試。[20-22]此外,社交媒體數(shù)據(jù)也被證明對于預(yù)測健康問題具有重要作用。例如,Eichstaedt等的研究發(fā)現(xiàn),人們在Twitter上的網(wǎng)絡(luò)表達(dá)對于美國郡層面的心臟病死亡率有顯著預(yù)測作用。其中,與負(fù)面社會(huì)關(guān)系、分離和負(fù)面情緒(尤其是憤怒)相關(guān)的網(wǎng)絡(luò)表達(dá)與心臟病死亡率正相關(guān);而積極情緒和心理參與相關(guān)的網(wǎng)絡(luò)表達(dá)與心臟病死亡率負(fù)相關(guān)。[23]
除了疾病預(yù)測外,還有一些研究者也開展了一些借助網(wǎng)絡(luò)大數(shù)據(jù)揭示網(wǎng)絡(luò)線上行為與線下健康行為(例如,自殺行為)之間關(guān)系的研究。例如,McCarthy利用谷歌網(wǎng)站記錄的2004年至2007年間網(wǎng)民對于自殺、自殘類詞匯的搜索量數(shù)據(jù),發(fā)現(xiàn)其與美國疾病控制與預(yù)防中心(the Centers for Disease Control and Prevention,CDC)記載的2004年至2007年期間大眾現(xiàn)實(shí)自殺、自殘數(shù)據(jù)呈顯著統(tǒng)計(jì)相關(guān)關(guān)系。但在大眾群體中呈顯著負(fù)相關(guān),在青少年群體中卻呈顯著正相關(guān)。[24]
(五)大數(shù)據(jù)與政治心理學(xué)
大數(shù)據(jù)也被廣泛應(yīng)用到政治心理學(xué)議題中,包括選舉行為及其相關(guān)心理規(guī)律,與政治意識(shí)形態(tài)相關(guān)的心理學(xué)規(guī)律。例如,Caldarelli等的研究發(fā)現(xiàn),意大利網(wǎng)民在Twitter上提及各黨派領(lǐng)導(dǎo)人的微博數(shù)量及其隨時(shí)間的變化特征對于預(yù)測全國政治大選具有顯著價(jià)值。[25]Markey通過分析2004、2006、2008年美國大選期間,搜索引擎網(wǎng)站Google上美國各州的色情類詞匯搜索量波動(dòng)趨勢,發(fā)現(xiàn)如果某政黨“票倉州”所支持的參選者最終確實(shí)獲勝,選舉之后該州的色情類詞匯搜索量會(huì)快速上升,顯著高于其他州。該網(wǎng)絡(luò)行為現(xiàn)象驗(yàn)證了進(jìn)化心理學(xué)中著名的“挑戰(zhàn)假說”(Challenge Hypothesis)。[26]
在政治意識(shí)形態(tài)方面,Bond和Messing的研究證明了通過Facebook數(shù)據(jù)預(yù)測大眾政治意識(shí)形態(tài)的有效性和可行性,并提出了以此進(jìn)一步開展政治計(jì)劃、政治意識(shí)形態(tài)結(jié)構(gòu)及其與政治參與率關(guān)系研究的研究方向。[27]Wojcik等最近發(fā)表在《科學(xué)》雜志的一項(xiàng)研究試圖探索到底持保守主義政治意識(shí)形態(tài)者和自由主義者誰更幸福。結(jié)果發(fā)現(xiàn),在自我報(bào)告的問卷調(diào)查結(jié)果中,持保守主義政治意識(shí)形態(tài)者報(bào)告了比自由主義者更高的幸福感,而通過Twitter等社交媒體數(shù)據(jù)的客觀幸福感指標(biāo)(例如積極情緒的表達(dá)、微笑)看,保守主義者卻顯著地表達(dá)了比自由主義者更低的幸福感。[28]
(六)其他富有前景的應(yīng)用領(lǐng)域
大數(shù)據(jù)已經(jīng)廣泛應(yīng)用于心理學(xué)的各分支領(lǐng)域,并不局限于以上列舉的這些應(yīng)用領(lǐng)域。例如,在文化心理學(xué)研究領(lǐng)域,有研究者通過Google Ngram基于Google掃描全球所有已出版書籍中約4%數(shù)據(jù)集所提供的歷時(shí)近200年的大數(shù)據(jù)來研究文化的變遷[29-30],包括個(gè)體主義—集體主義文化的歷史變遷[31-33],美國性別平等文化與女性地位的歷史變遷等[34]。還有其他豐富的數(shù)據(jù)來源也被巧妙地應(yīng)用到各研究中。例如,通過15萬歷史名人的出生地、死亡地?cái)?shù)據(jù)來反映歐洲和北美的文化歷史變遷[35];智能手機(jī)的數(shù)據(jù)被應(yīng)用于實(shí)時(shí)刻畫大規(guī)模人群的人口分布[36],研究人們對突發(fā)事件的集群行為規(guī)律。[37]
三、我國的大數(shù)據(jù)社會(huì)心理學(xué)研究實(shí)踐
我國的社會(huì)心理學(xué)研究者已經(jīng)主要就中國微博情緒的在線測量和應(yīng)用問題,嘗試與信息科學(xué)領(lǐng)域的研究者一起展開了一系列的研究和探索。
(一)微博情緒測量工具的開發(fā)
微博積累的海量信息為直接測量大規(guī)模人群的態(tài)度、社會(huì)情緒提供了可能。對在線文本進(jìn)行情感分析一直是信息科學(xué)領(lǐng)域的熱點(diǎn)問題,但傳統(tǒng)在線文本分析技術(shù)主要以數(shù)據(jù)驅(qū)動(dòng)或者經(jīng)驗(yàn)驅(qū)動(dòng),例如包含正向情緒和負(fù)向情緒的二分法。情緒、情感是心理學(xué)領(lǐng)域的經(jīng)典研究問題,將心理學(xué)領(lǐng)域關(guān)于情緒相關(guān)的研究成果應(yīng)用于在線文本分析技術(shù),可從理論視角為提升在線文本分析技術(shù)的有效性提供支持和幫助。樂國安等對情感分析技術(shù)、情緒詞庫的構(gòu)建與發(fā)展、在線文本情感分析技術(shù)的實(shí)踐應(yīng)用等問題進(jìn)行了較為系統(tǒng)的總結(jié)和歸納。[38]
詞匯匹配技術(shù)是目前分析海量微博客(例如Twitter、新浪微博)使用最為廣泛,也是效果相對較好的方法。該方法的原理主要是通過統(tǒng)計(jì)目標(biāo)文本中與情緒詞庫中特定類型的情緒詞的詞頻多少來計(jì)算該文本的情緒定向。[39]因此,情緒詞庫的建設(shè)是基于詞匯匹配技術(shù)的在線文本情感分析技術(shù)的核心。董穎紅等基于心理學(xué)經(jīng)典的基本情緒結(jié)構(gòu)理論,將微博情緒分為快樂、悲傷、憤怒、恐懼和厭惡五種(其中驚奇情緒由于在測試中發(fā)現(xiàn)使用頻率較低而未納入詞庫中),構(gòu)建了包含818個(gè)情緒詞(快樂306個(gè);悲傷205個(gè);厭惡142個(gè);恐懼72個(gè);憤怒93個(gè))的標(biāo)準(zhǔn)化微博客基本情緒詞庫(Weibo Basic Mood Lexicon,Weibo-5BML)。[39]
為了檢驗(yàn)該情緒詞庫和工具的有效性,研究團(tuán)隊(duì)與華東師范大學(xué)軟件學(xué)院海量計(jì)算研究所團(tuán)隊(duì)合作,在160多萬新浪微博用戶2011年7月至2012年11月期間發(fā)布的微博文本上進(jìn)行測試。首先,對五種微博情緒之間的內(nèi)部相關(guān)性進(jìn)行測試,結(jié)果發(fā)現(xiàn):快樂和悲傷、厭惡、憤怒、恐懼情緒均為顯著負(fù)相關(guān);而悲傷、厭惡、憤怒和恐懼情緒之間呈現(xiàn)顯著正相關(guān)。該檢驗(yàn)結(jié)果與心理學(xué)經(jīng)典的情緒理論,例如效價(jià)—喚醒理論,有較好的一致性。其次,通過整理五種微博情緒在一周內(nèi)(周一至周日)的周變化趨勢,結(jié)果發(fā)現(xiàn):快樂情緒在周末顯著高于工作日,而周三的快樂情緒達(dá)到最低點(diǎn)。這為探索大規(guī)模人群的整體情緒的節(jié)律變化提供了新的證據(jù)。最后,為了檢驗(yàn)微博情緒測量工具的生態(tài)效度,研究團(tuán)隊(duì)還分析了五種微博情緒對現(xiàn)實(shí)社會(huì)中重大節(jié)日、重大社會(huì)熱點(diǎn)事件的反應(yīng)。結(jié)果發(fā)現(xiàn),微博情緒對2011年“7·23甬溫線旅客列車特別重大事故”、2012年“釣魚島之爭”、春節(jié)、中秋節(jié)、感恩節(jié)等重大事件和節(jié)假日都呈現(xiàn)出了較為靈敏而合理的反應(yīng)。例如,2011年7月23日,甬溫線段發(fā)生了旅客列車特別重大事故,事故發(fā)生當(dāng)天,快樂情緒開始下降,而悲傷、憤怒和恐懼情緒開始上升。隨后的幾天人們一直沉浸在悲傷、憤怒和恐懼的氛圍中,一直到7月29日悼念活動(dòng)結(jié)束以后公眾的各種基本情緒才逐漸恢復(fù)到往日的水平。尤其是在事故發(fā)生之初,生命至上、緊急救援是主要問題,因此人們的悲傷情緒首先上升到高點(diǎn);但隨著時(shí)間的推移,事故的處理方式和對原因的調(diào)查使得公眾對政府的不滿、憤怒情緒不斷推高。以上檢驗(yàn)結(jié)果表明,研究團(tuán)隊(duì)基于基本情緒結(jié)構(gòu)理論開發(fā)的Weibo-5BML微博情緒測量工具,在分析大眾情緒信息時(shí)是有效的,這對于實(shí)時(shí)、高效地感知公眾的社會(huì)情緒變化具有重要的意義。[39]
(二)基于微博情緒的應(yīng)用社會(huì)心理學(xué)研究
1.預(yù)測股市
在發(fā)現(xiàn)新浪微博上單個(gè)情緒詞(例如“緊張”)與上證指數(shù)之間存在顯著關(guān)聯(lián)的基礎(chǔ)上,為了探索更一般性的微博情緒與股市關(guān)系,賴凱聲等基于心理學(xué)的情緒理論和情緒測量量表,抓取了新浪微博上2011年8月1日至2012年2月29日期間2 242個(gè)情緒詞匯的詞頻數(shù)據(jù)。結(jié)果發(fā)現(xiàn),2242個(gè)情緒詞中,有993個(gè)情緒詞與上證指數(shù)之間存在顯著的相關(guān)關(guān)系,并且基于這2 242個(gè)情緒詞通過相關(guān)系數(shù)篩選、加權(quán)得到的微博情緒綜合指數(shù)與上證指數(shù)之間的相關(guān)高達(dá)0.877。進(jìn)一步對微博情緒綜合指數(shù)和上證指數(shù)的時(shí)間序列構(gòu)建協(xié)整模型發(fā)現(xiàn),二者存在顯著的長期均衡關(guān)系,且微博情緒綜合指數(shù)能顯著預(yù)測下一個(gè)交易日的上證指數(shù)。[40]
Dong等通過構(gòu)建的微博客基本情緒詞庫(Weibo-5BML)工具和2012年2月1日至2012年11月30日期間的新浪微博數(shù)據(jù),檢驗(yàn)了不同類型的微博情緒與股市之間的關(guān)系。研究結(jié)果發(fā)現(xiàn),五種情緒中悲傷情緒能顯著提高上證指數(shù)成交量(預(yù)測準(zhǔn)確率提高2.4%)??紤]到悲傷情緒的喚醒度最低,研究者再把悲傷情緒詞中喚醒度最低的25%作為新的悲傷指數(shù),結(jié)果發(fā)現(xiàn)對上證指數(shù)成交量的預(yù)測能力仍然顯著。該研究結(jié)果表明,具有低喚醒度的負(fù)性情緒與上證指數(shù)交易量相關(guān),該結(jié)果從群體層面支持了情緒維持假說,并為情緒泛化假說和情緒維持假說的爭論提供了新證據(jù)。[41]
2.風(fēng)險(xiǎn)社會(huì)預(yù)測
處于社會(huì)轉(zhuǎn)型期和全球化進(jìn)程的中國社會(huì)面臨著各種社會(huì)風(fēng)險(xiǎn)。個(gè)體層面的研究認(rèn)為,由感知的社會(huì)風(fēng)險(xiǎn)誘發(fā)的情緒,例如憤怒,可能會(huì)引發(fā)集體行動(dòng)。但在宏觀群體層面,由于測量手段和成本的限制,大眾感知的社會(huì)風(fēng)險(xiǎn)與社會(huì)情緒之間的關(guān)系并不明確。為探索大眾對感知的社會(huì)風(fēng)險(xiǎn)的情緒反應(yīng)規(guī)律,Dong等的研究通過百度搜索數(shù)據(jù)來刻畫中國網(wǎng)民的社會(huì)風(fēng)險(xiǎn)感知水平(分為社會(huì)穩(wěn)定風(fēng)險(xiǎn)、日常生活風(fēng)險(xiǎn)、資源環(huán)境風(fēng)險(xiǎn)、公共道德風(fēng)險(xiǎn)、政府執(zhí)政風(fēng)險(xiǎn)、國家安全風(fēng)險(xiǎn)、經(jīng)濟(jì)金融風(fēng)險(xiǎn)七大類),通過微博客基本情緒詞庫(Weibo-5BML)工具分析新浪微博數(shù)據(jù)得到五類基本情緒水平。通過Granger因果檢驗(yàn)發(fā)現(xiàn),大眾感知的社會(huì)風(fēng)險(xiǎn)對社會(huì)情緒有顯著的預(yù)測力,但不同的風(fēng)險(xiǎn)類型對不同情緒的預(yù)測力是不同的。例如,感知的政治執(zhí)政風(fēng)險(xiǎn)能顯著預(yù)測憤怒情緒,資源環(huán)境風(fēng)險(xiǎn)感知能顯著預(yù)測未來2~5日的悲傷情緒。[42]
另一方面,大眾感知的社會(huì)風(fēng)險(xiǎn)對社會(huì)穩(wěn)定和社會(huì)和諧有負(fù)面影響,因此研究群體層面的大眾情緒能否影響或預(yù)測社會(huì)風(fēng)險(xiǎn)感知也具有重要意義。Dong等同樣采用百度搜索數(shù)據(jù)和新浪微博數(shù)據(jù),研究了中國網(wǎng)民的社會(huì)情緒對大眾社會(huì)風(fēng)險(xiǎn)感知的預(yù)測效果。結(jié)果發(fā)現(xiàn),社會(huì)情緒對大眾感知的社會(huì)風(fēng)險(xiǎn)具有顯著的預(yù)測力,但不同的社會(huì)情緒對不同類型的社會(huì)風(fēng)險(xiǎn)感知的預(yù)測效果是不同的。相比快樂情緒,悲傷、厭惡、憤怒、恐懼四種負(fù)性社會(huì)情緒是社會(huì)風(fēng)險(xiǎn)感知水平更為重要的預(yù)測變量。關(guān)于社會(huì)風(fēng)險(xiǎn)與社會(huì)風(fēng)險(xiǎn)感知水平的關(guān)系研究表明,通過社會(huì)化媒體捕捉和研究大眾心理特征和規(guī)律是可行的。[43]
3.精英與大眾的微博情緒關(guān)系
關(guān)于精英與大眾的關(guān)系一直是政治學(xué)、社會(huì)學(xué)、傳播學(xué)、心理學(xué)等多學(xué)科領(lǐng)域?qū)W者關(guān)注的問題。傳播學(xué)的意見領(lǐng)袖研究認(rèn)為,意見領(lǐng)袖在信息傳播中起著二級傳播的作用,對大眾具有重要的引領(lǐng)作用;政治學(xué)領(lǐng)域的研究者認(rèn)為,政治精英只是強(qiáng)化和激發(fā)現(xiàn)存的公共輿論,整體上對公共輿論的影響是“微不足道”的;而另一些研究則反對這種認(rèn)為影響微不足道的觀點(diǎn),并給出了一些政治精英利用大眾傳媒操縱公共輿論的證據(jù)。隨著社會(huì)的發(fā)展,精英和大眾之間的關(guān)系變得越來越復(fù)雜。尤其是互聯(lián)網(wǎng)時(shí)代,微博等自媒體的發(fā)展,精英與大眾互動(dòng)的頻率和強(qiáng)度都產(chǎn)生了巨大的飛躍,這無疑更加凸顯了探究精英和大眾的關(guān)系問題的重要性。精英是因?yàn)槟軠?zhǔn)確感知大眾輿論的趨勢,迎合或順應(yīng)大眾的“民意”,從而獲得大眾擁戴,即“時(shí)勢造英雄”;還是因?yàn)槟軕{借自身能力制造、引領(lǐng)時(shí)勢,充當(dāng)大眾引領(lǐng)者的角色,即“英雄造時(shí)勢”?
Lai等以微博情緒的分析視角為切入點(diǎn),借助研究團(tuán)隊(duì)構(gòu)建的微博客基本情緒詞庫(Weibo-5BML)工具和新浪微博2011-2012年的微博數(shù)據(jù),探索了覆蓋房地產(chǎn)、教育等9個(gè)行業(yè)的894名微博精英和160多萬名大眾用戶之間的微博情緒關(guān)系。綜合分析9大領(lǐng)域結(jié)果發(fā)現(xiàn):(1)當(dāng)下中國的經(jīng)濟(jì)資本比文化資本具有更大的影響力。房產(chǎn)、財(cái)經(jīng)和科技類意見領(lǐng)袖(即經(jīng)濟(jì)資本領(lǐng)域)均有顯著領(lǐng)先于大眾情緒的傾向,而傳媒、時(shí)尚、藝術(shù)、娛樂、教育、文學(xué)意見領(lǐng)袖(即文化資本領(lǐng)域)領(lǐng)先大眾情緒的傾向相對更低甚至落后于大眾情緒。(2)不同領(lǐng)域、不同情緒類型下的影響關(guān)系不完全相同,但總體來看,“時(shí)勢造英雄”的效果要比“英雄造時(shí)勢”的效果強(qiáng)些。(3)消極情緒比積極情緒更易傳播。其中,積極情緒中快樂情緒在4個(gè)領(lǐng)域的意見領(lǐng)袖群體和大眾情緒中有顯著的領(lǐng)先和滯后關(guān)系;而消極情緒中悲傷情緒在8個(gè)領(lǐng)域、厭惡情緒在6個(gè)領(lǐng)域、恐懼情緒在5個(gè)領(lǐng)域、憤怒情緒在2個(gè)領(lǐng)域內(nèi)的意見領(lǐng)袖群體和大眾情緒中有顯著的領(lǐng)先和滯后關(guān)系??偟膩碚f,經(jīng)濟(jì)資本和文化資本之間的支配和被支配關(guān)系取決于哪類資本占據(jù)了相對較高的話語權(quán)?;谖⒉┣榫w的研究發(fā)現(xiàn)經(jīng)濟(jì)資本比文化資本更具影響力的結(jié)果在一定程度上能反映轉(zhuǎn)型期中國文化轉(zhuǎn)型落后于經(jīng)濟(jì)轉(zhuǎn)型的社會(huì)現(xiàn)狀。[44]
4.厭惡情緒預(yù)測地區(qū)民族主義
關(guān)注情緒的進(jìn)化意義的研究者認(rèn)為,厭惡情緒可保護(hù)人們免受有毒物質(zhì)、病菌和疾病的威脅。[45]厭惡情緒在道德決策和意識(shí)形態(tài)層面的影響作用也得到了研究者的關(guān)注。個(gè)體層面的實(shí)驗(yàn)和調(diào)查證據(jù)發(fā)現(xiàn),厭惡情緒與個(gè)體的政治意識(shí)形態(tài),例如預(yù)測保守主義、投票行為,有顯著關(guān)聯(lián)。民族主義是個(gè)體認(rèn)同或依附于自己民族和國家的一種信仰或意識(shí)形態(tài),具有以自我民族中心,以及排斥、貶低外民族的傾向等主要特征。那么,在群體層面的厭惡情緒與地區(qū)的民族主義是否有關(guān)聯(lián)?
高樹青等借助研究團(tuán)隊(duì)構(gòu)建的微博客基本情緒詞庫(Weibo-5BML)工具來測量2011年中國各省(市、自治區(qū))的新浪微博厭惡情緒表達(dá),并結(jié)合包含17萬網(wǎng)民樣本的“中國政治坐標(biāo)系測試”關(guān)于政治意識(shí)形態(tài)網(wǎng)絡(luò)大調(diào)查數(shù)據(jù),從宏觀層面探索了網(wǎng)絡(luò)厭惡情緒表達(dá)與地區(qū)民主主義之間的關(guān)系。研究結(jié)果發(fā)現(xiàn):(1)中國各省的厭惡情緒表達(dá)與地區(qū)民族主義存在顯著相關(guān);(2)在控制了各省的人均GDP、地理封閉性、農(nóng)村人口比重等變量之后,厭惡情緒表達(dá)與地區(qū)民族主義之間的相關(guān)仍然顯著;(3)進(jìn)一步的穩(wěn)健性檢驗(yàn)發(fā)現(xiàn),5類基本情緒中,有且僅有厭惡情緒與地區(qū)民族主義具有顯著關(guān)聯(lián)。因此,微博厭惡情緒表達(dá)與地區(qū)民族主義正相關(guān)的結(jié)果具有較好的區(qū)分效度,這為理解群體層面的情緒表達(dá)和民族主義傾向之間的關(guān)系提供了直接證據(jù)。[46]
四、大數(shù)據(jù)研究存在的問題
(一)大數(shù)據(jù)“萬能論”與“無用論”
關(guān)于網(wǎng)絡(luò)大數(shù)據(jù)的定位問題,尤其是大數(shù)據(jù)在受到商界熱炒的背景下,如何客觀、理性地看待大數(shù)據(jù)研究也是一個(gè)值得討論的問題。認(rèn)為大數(shù)據(jù)能解決一切問題,采用大數(shù)據(jù)的研究方法就是高質(zhì)量的研究,這便是推崇大數(shù)據(jù)“萬能論”;也有觀點(diǎn)認(rèn)為大數(shù)據(jù)一無是處,存在數(shù)據(jù)不精確,結(jié)果是偽相關(guān)等問題,便是信奉大數(shù)據(jù)“無用論”。筆者認(rèn)為,我們既不要盲從于大數(shù)據(jù)“萬能論”,也不必因大數(shù)據(jù)“無用論”而望而卻步。客觀來講,大數(shù)據(jù)更像是一種新范式或者新方法,它有它自己的優(yōu)勢,例如樣本量大、生態(tài)效度高。大數(shù)據(jù)也有一些缺陷,包括不精確、信度低,難以揭示因果等問題。正如傳統(tǒng)的實(shí)驗(yàn)法有控制嚴(yán)格的優(yōu)點(diǎn)和生態(tài)效度低的缺點(diǎn),而問卷法有被試范圍廣的優(yōu)點(diǎn)和存在社會(huì)稱許性反應(yīng)的弊端一樣,大數(shù)據(jù)會(huì)存在優(yōu)點(diǎn)和缺點(diǎn)自然也屬情理之中。因此,將大數(shù)據(jù)看成一種新的研究范式,研究者可以更好地結(jié)合一般方法論、研究范式的優(yōu)缺點(diǎn)的視角來客觀、理性地評價(jià)和應(yīng)用它。
(二)大數(shù)據(jù)的因果關(guān)系問題
大數(shù)據(jù)研究具有全體、混雜和相關(guān)三大特點(diǎn)。[47]27-96其中,相關(guān)指的是大數(shù)據(jù)研究通常更加關(guān)注相關(guān)性,而不是因果性。因果關(guān)系的確立需要排除很多可能的干擾因素,而大數(shù)據(jù)混雜的特點(diǎn)很難保證因果關(guān)系的推論,要通過大數(shù)據(jù)來研究因果是比較困難的。很多大數(shù)據(jù)研究中找到的因果也只是統(tǒng)計(jì)學(xué)意義上的因果,例如,基于Granger因果檢驗(yàn)的研究。但統(tǒng)計(jì)意義上的因果關(guān)系代表的是數(shù)據(jù)在時(shí)間上的領(lǐng)先滯后關(guān)系,與邏輯學(xué)意義上的因果并不等同。因此,如果需要進(jìn)一步確定因果關(guān)系,建議可再結(jié)合傳統(tǒng)的實(shí)驗(yàn)法進(jìn)行檢驗(yàn)和確定。值得一提的是,大數(shù)據(jù)發(fā)現(xiàn)的相關(guān),尤其是時(shí)間序列上的領(lǐng)先—滯后相關(guān)由于具有預(yù)測性,因此仍然是具有較強(qiáng)的實(shí)踐應(yīng)用價(jià)值的。這也可能是大數(shù)據(jù)在產(chǎn)業(yè)界傳播范圍廣、影響力大的重要原因之一。
(三)大數(shù)據(jù)的隱私問題
在大數(shù)據(jù)被廣泛應(yīng)用于科研、商業(yè)和管理等諸多實(shí)踐領(lǐng)域的同時(shí),人們也開始思考大數(shù)據(jù)對人類帶來的威脅和負(fù)面影響。其中以對數(shù)據(jù)隱私問題的顧慮最具代表性。人們在搜索引擎上的搜索記錄、在電子商務(wù)網(wǎng)站上的購物記錄、在社交媒體上與好友的互動(dòng)記錄等,這些數(shù)據(jù)都被網(wǎng)絡(luò)服務(wù)商所掌握。這些數(shù)據(jù)的安全性則成為了網(wǎng)絡(luò)信息化社會(huì)的一大隱患。尤其是2013年的“棱鏡門”事件更是激發(fā)了人們對數(shù)據(jù)安全、數(shù)據(jù)隱私問題的關(guān)注。關(guān)于數(shù)據(jù)收集者是否有權(quán)收集、分析以及使用相關(guān)信息也引起了廣泛的討論。例如,傳統(tǒng)社會(huì)中,由于社會(huì)流動(dòng)性的存在,對于一些犯過一些過錯(cuò)的人,往往還具備通過更換環(huán)境來重新開啟新生活的權(quán)力。但網(wǎng)絡(luò)社會(huì)信息的全覆蓋,一旦有任何負(fù)面的信息發(fā)布到網(wǎng)上,幾乎世界上任何有互聯(lián)網(wǎng)覆蓋的角落都能知道該信息,并且它可能被永久的記載。換言之,在大數(shù)據(jù)時(shí)代,人們的隱私空間越來越小,這種現(xiàn)象被稱為“被遺忘權(quán)”的剝奪。數(shù)據(jù)隱私權(quán)隱患引起了社會(huì)各界的大討論,世界各國已經(jīng)開始著手建設(shè)和完善大數(shù)據(jù)隱私保護(hù)相關(guān)的法律。對于學(xué)術(shù)研究而言,大數(shù)據(jù)研究者可通過建立一個(gè)自由、透明的學(xué)術(shù)共同體,共同遵循和監(jiān)督在充分保證用戶個(gè)人隱私的條件下開展有價(jià)值的學(xué)術(shù)研究的數(shù)據(jù)使用原則。例如,對個(gè)體關(guān)鍵信息進(jìn)行匿名化處理是大數(shù)據(jù)研究中常用的保護(hù)用戶個(gè)人隱私的辦法。
五、未來研究展望
近些年圍繞網(wǎng)絡(luò)大數(shù)據(jù)的社會(huì)心理學(xué)研究展現(xiàn)出了巨大的發(fā)展?jié)摿?,在研究視角、研究方法的多元化等方面都取得了重大的突破?013年Watts曾就計(jì)算社會(huì)科學(xué)的研究現(xiàn)狀和面臨的挑戰(zhàn)問題指出,雖然目前已經(jīng)有了成百上千篇關(guān)于社會(huì)網(wǎng)絡(luò)、金融危機(jī)、群體形成等問題相關(guān)的計(jì)算社會(huì)科學(xué)研究成果,但這些成果中很少能被傳統(tǒng)社會(huì)科學(xué)的期刊所認(rèn)可并發(fā)表。[48]換言之,Watts一針見血地指出了當(dāng)時(shí)信息科學(xué)領(lǐng)域研究者與社會(huì)科學(xué)研究者之間的合作仍然不夠充分,從而導(dǎo)致主流社會(huì)科學(xué)和計(jì)算社會(huì)科學(xué)研究領(lǐng)域之間仍然存在較深隔閡的問題。這也與大多數(shù)計(jì)算社會(huì)科學(xué)領(lǐng)域的研究缺乏對傳統(tǒng)社會(huì)科學(xué)理論和現(xiàn)實(shí)重要社會(huì)實(shí)踐的關(guān)注有關(guān)。對于大數(shù)據(jù)心理學(xué)研究領(lǐng)域的發(fā)展而言,該問題和挑戰(zhàn)同樣存在,并且將長期存在。值得肯定的是,就在最近的幾年發(fā)展中,已經(jīng)開始涌現(xiàn)出一批具有代表性意義的大數(shù)據(jù)心理學(xué)研究,并得到了一些主流心理學(xué)期刊的認(rèn)可。例如,在2014-2015年期間,有多篇基于Facebook、Twitter、Google網(wǎng)絡(luò)搜索的大數(shù)據(jù)研究相繼在社會(huì)心理學(xué)領(lǐng)域的國際頂級期刊,如美國的《人格與社會(huì)心理學(xué)》《心理科學(xué)》等雜志上發(fā)表。這意味著基于大數(shù)據(jù)的社會(huì)心理學(xué)研究領(lǐng)域已經(jīng)逐漸步入主流心理學(xué)研究的視野,并開始展示其蓬勃的生命力。筆者認(rèn)為,要想獲得長足的發(fā)展,并且真正獲得主流心理學(xué)的認(rèn)可,研究者在未來研究中不能僅僅只把網(wǎng)絡(luò)作為一種人類活動(dòng)的特定情境來研究網(wǎng)絡(luò)用戶的心理與行為規(guī)律,更應(yīng)重視借助網(wǎng)絡(luò)大數(shù)據(jù)相關(guān)的研究技術(shù)和手段來解決心理學(xué)領(lǐng)域的重要理論和現(xiàn)實(shí)問題。
尤其是對于國內(nèi)的研究者而言,國內(nèi)相關(guān)領(lǐng)域的研究總體上仍處于探索期,研究成果和經(jīng)驗(yàn)相對較少。這既意味著存在廣闊的發(fā)展空間,也意味著面臨巨大的挑戰(zhàn)。數(shù)據(jù)公開、數(shù)據(jù)共享也是未來發(fā)展的大趨勢。我國作為人口大國,網(wǎng)民用戶群體規(guī)模龐大,這為研究者研究轉(zhuǎn)型期中國人的心理與行為規(guī)律提供了鮮活的證據(jù)。當(dāng)前正處于轉(zhuǎn)型期的中國,在大眾心理與行為層面涌現(xiàn)出許多可供深入挖掘的研究資源。建議國內(nèi)研究者在延續(xù)傳統(tǒng)心理學(xué)研究范式,探討網(wǎng)絡(luò)化環(huán)境下個(gè)體心理、社會(huì)適應(yīng)的影響機(jī)制研究的同時(shí),也多關(guān)注借助網(wǎng)絡(luò)大數(shù)據(jù)探索群體心理和行為問題。這對于及時(shí)發(fā)現(xiàn)和解決社會(huì)問題,從而促進(jìn)社會(huì)的和諧發(fā)展具有重要的意義。
建議未來研究多結(jié)合心理信息學(xué)的視角,將網(wǎng)絡(luò)大數(shù)據(jù)研究技術(shù)多應(yīng)用于解決具有重要現(xiàn)實(shí)意義的社會(huì)問題(例如,醫(yī)療衛(wèi)生問題、幸福感問題、環(huán)境問題),落實(shí)心理學(xué)服務(wù)社會(huì)的使命。從已有的研究證據(jù)來看,心理信息學(xué)的研究范式不但在探索有關(guān)個(gè)體和群體心理與行為規(guī)律的研究問題上展示出了巨大的潛力,還能幫助研究者從理論驅(qū)動(dòng)出發(fā),通過網(wǎng)絡(luò)大數(shù)據(jù)來驗(yàn)證一些心理學(xué)的經(jīng)典假設(shè),從而為理論假說、爭論提供新的證據(jù)。因此,心理信息學(xué)有望成為未來心理學(xué)發(fā)展的重要方向之一。[1]但心理信息學(xué)研究的順利開展,需要心理學(xué)和信息科學(xué)領(lǐng)域研究者的密切配合以及相關(guān)資源的全力支持。建議國家多提供一些跨學(xué)科領(lǐng)域合作的資源項(xiàng)目,支持和鼓勵(lì)開展跨學(xué)科領(lǐng)域合作的課題;而研究者自身則應(yīng)能主動(dòng)地學(xué)習(xí)和了解相關(guān)領(lǐng)域的知識(shí),打破傳統(tǒng)的學(xué)科思維界限,積極投身于跨學(xué)科合作實(shí)踐中,從而把握網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代的機(jī)遇。