互聯(lián)網(wǎng)充斥著謠言和虛假消息。春節(jié)期間一篇“微波爐有害健康”的謠言文章廣為傳播,又一次向我們展示了網(wǎng)絡(luò)信息可以多么不可靠。當(dāng)真真假假的內(nèi)容魚龍混雜,鑒別它們的可信度是一件非常讓人頭疼的事情。令人沮喪的事實(shí)是,往往沖擊性的謠言的傳播能量遠(yuǎn)勝過平淡的真相,似乎人類天生就喜歡“來個(gè)大新聞”。
谷歌想要改變這個(gè)現(xiàn)狀,或者說,嘗試去改善它。作為搜索引擎市場(chǎng)的壟斷者,谷歌的搜索排名基于每個(gè)網(wǎng)頁(yè)的流行程度——一個(gè)鏈接被引用的次數(shù)越多,在搜索結(jié)果中的排名越高。這樣的算法使瀏覽者很容易找到受歡迎的頁(yè)面,卻也助長(zhǎng)了廣受關(guān)注的謠言與不實(shí)信息傳播的勢(shì)頭。
谷歌的研究小組開發(fā)出了一種新算法,可以根據(jù)網(wǎng)頁(yè)的內(nèi)容真實(shí)性,而非受歡迎程度對(duì)鏈接進(jìn)行了評(píng)級(jí)。新技術(shù)分析網(wǎng)頁(yè)的內(nèi)容,提取其中的觀點(diǎn)、論據(jù)并加以分析;網(wǎng)頁(yè)包含的真實(shí)、正確信息越多,獲得的評(píng)級(jí)就越高,在搜索結(jié)果中就會(huì)越靠前。該項(xiàng)技術(shù)依賴谷歌的自動(dòng)化知識(shí)庫(kù)作為“事實(shí)”的判斷依據(jù),后者自動(dòng)從全網(wǎng)絡(luò)抓取并研究信息,挑出那些大多數(shù)人一致認(rèn)可、經(jīng)久不衰的論點(diǎn)充實(shí)到自己的內(nèi)容庫(kù)中。如果一名主婦詢問這個(gè)知識(shí)庫(kù)微波爐與人體健康的關(guān)系,它一定不會(huì)說這種機(jī)器會(huì)讓人致癌這類蠢話。
谷歌的這項(xiàng)研究肯定會(huì)贏的中國(guó)網(wǎng)民的歡心——假設(shè)大陸可以正常使用Google搜索的話。占據(jù)中國(guó)搜索引擎市場(chǎng)的百度走的是另一條路,靠人力而非機(jī)器獲取信息:百度貼吧、百度百科、百度知道等社區(qū)如今成了百度搜索的重要結(jié)果來源,以至于大量謠言都是從這些社區(qū)傳播出去的。某檔電視節(jié)目曾因?yàn)椴患诱鐒e地引用百度百科內(nèi)容,鬧出了把游戲顯卡稱為軍用反航母武器的大笑話。如果制作組有機(jī)會(huì)用上谷歌的新技術(shù),絕對(duì)不會(huì)落得如此尷尬。用戶生成內(nèi)容太容易被篡改,穩(wěn)定性、可靠性終究難以匹敵冰冷、精確的機(jī)器數(shù)據(jù)庫(kù)。
那么是不是可以說未來的互聯(lián)網(wǎng)就可以擺脫謠言和欺騙內(nèi)容的困擾了呢?雖然理想很美好,但現(xiàn)實(shí)恐怕還是難盡人意。
最大的問題出在對(duì)“真實(shí)”的判斷上。谷歌使用的知識(shí)庫(kù)可以自動(dòng)獲取并學(xué)習(xí)知識(shí),但也只能做到一定的精確度?,F(xiàn)在知識(shí)庫(kù)收集的十幾億條信息中,擁有9成以上可信度的知識(shí)只占20%。這些數(shù)據(jù)本身就無法保證完全的可靠性,以它們作為“事實(shí)”的評(píng)價(jià)標(biāo)準(zhǔn)自然也會(huì)出現(xiàn)問題。何況,十幾億的知識(shí)儲(chǔ)量聽上去很龐大,至少比“十萬個(gè)為什么”的數(shù)量多多了;但與互聯(lián)網(wǎng)的信息海洋相比,這點(diǎn)內(nèi)容只能算小小的湖泊。如果知識(shí)庫(kù)不能覆蓋大部分的搜索需求,自然也無法給多數(shù)搜索請(qǐng)求給出參考基準(zhǔn)。
即便谷歌解決了知識(shí)庫(kù)的精度、深度和覆蓋率的問題,它依舊要面臨嚴(yán)峻的挑戰(zhàn):人類在與機(jī)器比拼智慧的歷史上極少落敗,找到機(jī)器的空子并加以利用是許多人的樂趣乃至工作。既然“包含較多真實(shí)內(nèi)容”的鏈接可以得到更高排名,人們可以很容易通過語(yǔ)言技巧來制造出機(jī)器算法偏愛的文章,并在其中摻雜虛假的內(nèi)容。典型的,記者可以通過對(duì)諸多真相的選擇性報(bào)道來傳達(dá)偏向性的觀點(diǎn),因?yàn)檎摀?jù)均為真實(shí)所以很容易騙過電腦。這類技巧早在幾千年前就已經(jīng)出現(xiàn),我們的先賢就曾使用“春秋筆法”來撰寫史書。計(jì)算機(jī)對(duì)此注定無能為力。
更何況許多事情的真相究竟為何,就連我們?nèi)祟愖约憾几悴磺宄?。暗殺肯尼迪總統(tǒng)的是誰?克林頓究竟有沒有和實(shí)習(xí)生上床?喬布斯生前是否參與了iPhone 5的研發(fā)?連人都爭(zhēng)執(zhí)不休的議題,機(jī)器怎可能給出公允的判斷呢?我們希望人類能有阿西莫夫著名的《基地》系列描寫的那位全知全能的機(jī)器人一樣的計(jì)算機(jī)朋友,但理想畢竟只是理想。到頭來,探索真相的鑰匙還是只能掌握在我們自己手里。
谷歌的新技術(shù)或許能在一定程度上改善互聯(lián)網(wǎng)的環(huán)境,但不是什么一勞永逸的終極解決方案。與謠言和虛假消息斗爭(zhēng)的責(zé)任還是會(huì)落在我們每個(gè)人頭上。如果多數(shù)人還是喜歡不假思索地接受看似合理真實(shí)的內(nèi)容并加以傳播,那么網(wǎng)絡(luò)世界的風(fēng)氣就不會(huì)獲得顯著改善。獨(dú)立思考和判斷比較費(fèi)力氣,但它的確是分辨真假的最有力武器。所以,與其指望新的程序或算法,還是多練習(xí)我們自己的大腦吧。