美國(guó)總統(tǒng)利用大數(shù)據(jù)來幫助競(jìng)選早就不是什么新鮮事,奧巴馬2012年就利用說服模型會(huì)開啟政治競(jìng)選中的全新篇章。
(上接B02版)
但大部分人所不知道的是,總統(tǒng)競(jìng)選活動(dòng)要把針對(duì)范圍進(jìn)一步縮小,美國(guó)總統(tǒng)競(jìng)選確實(shí)是把微觀定位提到了全新的高度。奧巴馬的競(jìng)選團(tuán)隊(duì)押對(duì)了寶,他們通過上提模型設(shè)計(jì)了數(shù)百萬份針對(duì)個(gè)體選民的競(jìng)選決策,由此也打破了競(jìng)選周期的常規(guī),收到了十分積極的說服效果。
但2012年的風(fēng)潮還不止于此?,F(xiàn)在,人們的關(guān)注點(diǎn)已經(jīng)超越了競(jìng)選活動(dòng)定位,而是開始關(guān)注競(jìng)選背后的數(shù)理分析。
普通預(yù)測(cè)是等到美國(guó)各州結(jié)果出來之后進(jìn)行總結(jié)判斷,但預(yù)測(cè)分析卻可提供旨在指導(dǎo)行動(dòng)的知識(shí):對(duì)每個(gè)選民進(jìn)行預(yù)測(cè)。
說服建模的成功運(yùn)用
總統(tǒng)選舉的標(biāo)準(zhǔn)一定要超過那些普通的商業(yè)營(yíng)銷。在這種精益求精的無情競(jìng)爭(zhēng)中,可支配的資源顯得尤為寶貴。
“我們的建模團(tuán)隊(duì)對(duì)每個(gè)政治意向不明確的州都建立了說服模型,”2012年美國(guó)總統(tǒng)選舉中奧巴馬陣營(yíng)的首席數(shù)據(jù)科學(xué)家拉伊德·加尼表示,“然后再用模型去預(yù)測(cè),在這些州里,數(shù)百萬搖擺選民中每個(gè)選民的具體情況如何。模型會(huì)告訴我們,我們能為奧巴馬贏得哪些選民,以及我們應(yīng)該避免接觸哪些選民。”
對(duì)模型所預(yù)測(cè)的每個(gè)可說服的選民,競(jìng)選團(tuán)隊(duì)都配備了大量的資源,志愿者會(huì)站在街上宣傳鼓勁,也會(huì)撥打電話到家里,勸說他們?yōu)閵W巴馬投票。當(dāng)志愿者開始家訪時(shí),他們并不是挨家挨戶敲門,而是針對(duì)那些被預(yù)測(cè)系統(tǒng)定位為可影響的選民敲門。類似地,傳單也主要用來針對(duì)那些可說服的選民。
說服建模取得了效果。相比其他傳統(tǒng)競(jìng)選定位方法,這種方式讓更多的選民選擇了奧巴馬。而且,說服模型也引導(dǎo)了奧巴馬競(jìng)選團(tuán)隊(duì)的廣告投放。電視節(jié)目的廣告時(shí)段會(huì)按收視人群的多寡和分布來售賣廣告位。奧巴馬競(jìng)選團(tuán)隊(duì)會(huì)用說服模型來梳理這些收視人群數(shù)據(jù),然后確定在哪里投放廣告。
這是先進(jìn)技術(shù),也是分析學(xué)的前沿應(yīng)用,但這并不神秘,說服模型會(huì)開啟政治競(jìng)選中的全新篇章,即便臉書被曝光了,特朗普尋求連任的路上,也離不開大數(shù)據(jù)的應(yīng)用。
販賣個(gè)人信息
地下數(shù)據(jù)黑產(chǎn)業(yè)鏈?zhǔn)只钴S
多年來,以販賣個(gè)人信息為主的地下數(shù)據(jù)黑產(chǎn)業(yè)鏈?zhǔn)只钴S,這在一定程度上制約了合法大數(shù)據(jù)交易產(chǎn)業(yè)的發(fā)展。
據(jù)了解,正規(guī)交易的數(shù)據(jù)需要經(jīng)過采集、清洗、脫敏、脫密、融合等流程,保障了數(shù)據(jù)的合法性、真實(shí)性和安全性,成本也相應(yīng)提高。但黑市交易的大部分?jǐn)?shù)據(jù)多由內(nèi)鬼或黑客竊取得來,幾乎是無本萬利。比如,正規(guī)渠道的人臉識(shí)別數(shù)據(jù)價(jià)格為每條0.1元,而黑市上只需花1分錢就能獲取同樣的數(shù)據(jù)。
幾年前,全球最大的電子郵件營(yíng)銷公司艾司隆(Epsilon)發(fā)生了史上最嚴(yán)重的黑客入侵事件,主要的企業(yè)客戶名單以及電子郵件地址因此外泄,受害企業(yè)包括摩根大通、第一資本集團(tuán)、萬豪酒店、美國(guó)銀行、花旗銀行及電視購(gòu)物網(wǎng)絡(luò)等。而就在不到一個(gè)月時(shí)間的同年4月底,索尼公司遭到黑客攻擊,泄露了一億份賬戶資料,其Play Station網(wǎng)絡(luò)和Qriocity流媒體服務(wù)不得不關(guān)閉將近一個(gè)月。索尼公司因此花費(fèi)了約1.71億美元來彌補(bǔ)這個(gè)損失。
業(yè)內(nèi)專家表示,隨著云計(jì)算、物聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)應(yīng)用規(guī)模日趨擴(kuò)大,在數(shù)據(jù)采集、存儲(chǔ)、開放共享等方面均存在安全隱患。由于數(shù)據(jù)隱私管理法規(guī)不健全,數(shù)據(jù)產(chǎn)權(quán)立法滯后,缺乏推動(dòng)各個(gè)部門數(shù)據(jù)交換和共享的制度、規(guī)范和標(biāo)準(zhǔn),公民隱私得不到合法保護(hù),與此同時(shí),社交網(wǎng)站的隱私數(shù)據(jù)也可能被不法商家利用,這些都給數(shù)據(jù)安全帶來了巨大的挑戰(zhàn)。
關(guān)于隱私保護(hù)
歐盟推《通用數(shù)據(jù)保護(hù)條例》
如今,在互聯(lián)網(wǎng)時(shí)代各類媒體掌握著大量用戶數(shù)據(jù),數(shù)據(jù)采集分析技術(shù)也日新月異。在日常生活中,搜索諸如疾病或者地點(diǎn)類詞條后,網(wǎng)站就跳出相關(guān)產(chǎn)品和服務(wù)廣告已不是新鮮事;打開打車或者運(yùn)動(dòng)手機(jī)軟件,生活軌跡一目了然;在社交媒體上訂閱新聞推送,為某個(gè)群體和活動(dòng)點(diǎn)贊,可能已經(jīng)暴露了你的興趣愛好乃至價(jià)值取向……
而大部分人對(duì)自己什么時(shí)候被采集了哪些信息、信息會(huì)被如何利用、能否選擇性刪除數(shù)據(jù)、軟件公司通過何種方式保障隱私安全等問題,都一頭霧水。
需要法律規(guī)范
沒有健全的法律規(guī)范,僅靠企業(yè)自律來保護(hù)用戶個(gè)人隱私,可能引發(fā)民眾對(duì)大數(shù)據(jù)技術(shù)的恐懼。對(duì)此,歐洲正以立法等形式清理個(gè)人“數(shù)字足跡”、保障信息安全,讓網(wǎng)絡(luò)使用者擁有“被遺忘權(quán)”。
英國(guó)政府在2017年8月宣布將修改相關(guān)法律條文,讓個(gè)人對(duì)自己的數(shù)據(jù)擁有更大掌控權(quán),比如可要求臉書等社交媒體平臺(tái)刪除一些自己以前發(fā)布的個(gè)人信息,且機(jī)構(gòu)收集個(gè)人數(shù)據(jù)的過程也會(huì)被更嚴(yán)格地監(jiān)管。
擁有“被遺忘權(quán)”
被看作數(shù)據(jù)保護(hù)里程碑式法律的歐盟《通用數(shù)據(jù)保護(hù)條例》也將于今年5月25日正式生效。此外,歐盟還在致力于建立一套適用于全歐盟范圍的、有關(guān)網(wǎng)絡(luò)安全“產(chǎn)品、服務(wù)和程序”的統(tǒng)一安全認(rèn)證體系。
《通用數(shù)據(jù)保護(hù)條例》第17條“被遺忘權(quán)”特別指出,當(dāng)個(gè)人數(shù)據(jù)與收集處理的目的無關(guān)、數(shù)據(jù)主體不希望其數(shù)據(jù)被處理或數(shù)據(jù)控制者已沒有正當(dāng)理由保存該數(shù)據(jù)時(shí),數(shù)據(jù)主體可隨時(shí)要求收集其數(shù)據(jù)的企業(yè)或個(gè)人刪除其個(gè)人數(shù)據(jù)。
如何更好地保障數(shù)據(jù)隱私,各國(guó)仍在摸索中。不少人認(rèn)為,此次臉書數(shù)據(jù)泄露事件可能會(huì)促使美國(guó)通過立法手段,加強(qiáng)對(duì)網(wǎng)絡(luò)社交媒體和數(shù)據(jù)安全的監(jiān)管。一些專家提出,要切實(shí)保護(hù)用戶數(shù)據(jù)隱私,嚴(yán)格的立法與執(zhí)法必不可少。例如,歐盟《通用數(shù)據(jù)保護(hù)條例》中,違規(guī)企業(yè)面臨高達(dá)全球營(yíng)業(yè)額2%至4%的罰款,強(qiáng)有力的處罰可直接促使企業(yè)加強(qiáng)自我規(guī)范。