2/23日隨著搜狐自媒體考察團(tuán)去了趟微軟加速器,然后我發(fā)現(xiàn)此前有個(gè)認(rèn)識(shí)有點(diǎn)偏差,國(guó)內(nèi)的數(shù)據(jù)分析類公司并不像我想的那么少。抽象看,未來的世界大概會(huì)是這么個(gè)模式:一端是各種產(chǎn)品不停的獲取各種數(shù)據(jù),一端則是人工智能里的機(jī)器學(xué)習(xí)算法對(duì)已經(jīng)獲取的數(shù)據(jù)進(jìn)行吞吐,獲得自己想要的東西。我之前一直認(rèn)為國(guó)內(nèi)智能硬件比較火,但后端處理數(shù)據(jù)的還沒起來,但這次看到了些公司,比如GrowingIO既在前端采集數(shù)據(jù)也在后端作分析多少改變了我的印象。當(dāng)智能硬件和人工智能的數(shù)據(jù)處理能力都準(zhǔn)備好了,那會(huì)形成一種正反饋,讓變化來的越來越快,但有些變化估計(jì)不是每個(gè)人都喜歡。
這十年到底賣了多少攝像頭
如果同十年前比較,我們會(huì)發(fā)現(xiàn)這世界上增加的最多的電子產(chǎn)品還不是手機(jī),而是攝像頭?,F(xiàn)在不帶攝像頭的手機(jī)幾乎沒有,而在此之外當(dāng)我們用地圖進(jìn)行導(dǎo)航時(shí),我們就會(huì)不停的聽到這里有闖紅燈照相等,在小區(qū)、超市里各個(gè)屋頂角落也是一定會(huì)安裝上攝像頭,近來則更近一部,攝像頭也開始走進(jìn)家庭成為家庭安防的一個(gè)環(huán)節(jié)。
這么多的攝像頭意味著什么?這意味著原子世界的信息正在被完整采集,這部分?jǐn)?shù)據(jù)采集的越多,就越可能在比特的世界里重建一個(gè)真實(shí)世界。如果想初步感受這趨勢(shì)的威力,那可以從違反交規(guī)這事來體驗(yàn),現(xiàn)在的城市里或者高速上只要你違規(guī)或者超速,那就不可能查不出來。車牌的識(shí)別率幾乎逼近100%,這樣像超速這種事情,甚至不需要實(shí)時(shí)拍照,可以記錄進(jìn)出某個(gè)路段的時(shí)間。
事情還沒完,不只是攝像頭在大范圍的監(jiān)控這世界,個(gè)人的生活細(xì)節(jié)也越來越多的記錄到網(wǎng)上,微博、朋友圈在記錄你的言行和觀點(diǎn),淘寶京東在記錄你的消費(fèi),美團(tuán)、點(diǎn)評(píng)在記錄你的看電影和吃飯,滴滴在記錄你的移動(dòng)位置,支付寶等在記錄你的金錢流向,諸如此類讓生活方便的工具所起的另一個(gè)作用就是人事實(shí)上在數(shù)字世界里可以被越來越精準(zhǔn)的描述出來,阻礙人變的透明的越來越不是技術(shù)而是某種權(quán)限邊界。
故事到這里仍然沒完,即使通過這些工具,那記錄的數(shù)據(jù)仍然不算精確冗余率很低,比如記錄的聲音可能就很多噪聲,記錄的影響可能很大一段就沒什么價(jià)值。又由于量過于龐大,從這些價(jià)值密度比較稀疏的數(shù)據(jù)中提煉出價(jià)值也沒那么容易。正在這時(shí)候,人工智能的各種突破出現(xiàn)了。
人工智能一邊讓端上的數(shù)據(jù)采集可以更有效率,比如通過把計(jì)算機(jī)視覺集成到芯片里讓終端產(chǎn)品只采集更有價(jià)值的內(nèi)容,比如通過各種算法更有效的降噪音采集更精確的聲音。一方面則讓海量數(shù)據(jù)的分析能在極短的時(shí)間內(nèi)完成。
天網(wǎng)就在那里悄悄萌芽
外媒The Intercept曾經(jīng)發(fā)了一篇惹起極大爭(zhēng)議的文章,大意是說美國(guó)反恐過程中通過機(jī)器學(xué)習(xí)算法來對(duì)巴勒斯坦人進(jìn)行分類 ,之后把疑似恐怖分子的人砸死。事情的真相仍然需要進(jìn)一步的澄清,但整個(gè)過程正好充分的說明了上述人工智能與數(shù)據(jù)采集以及數(shù)據(jù)分析相結(jié)合后的后果。這篇報(bào)道中與此相關(guān)的描述如下(新智元原創(chuàng)翻譯):
“天網(wǎng)”的工作方式就像一個(gè)現(xiàn)代典型的大數(shù)據(jù)業(yè)務(wù)應(yīng)用。這個(gè)程序收集來元數(shù)據(jù)、將它們儲(chǔ)存在NSA的云服務(wù)器上,提取相關(guān)信息,然后應(yīng)用機(jī)器學(xué)習(xí)的方法來辨別執(zhí)行既定行動(dòng)的線索。除了不像商業(yè)應(yīng)用那樣試圖向目標(biāo)人群兜售某樣?xùn)|西之外,這種活動(dòng)——考慮到美國(guó)政府在巴基斯坦的整體業(yè)務(wù)重心——可能也涉及到美國(guó)政府的另一個(gè)機(jī)構(gòu),CIA或者軍方,通過掠食者無人機(jī)和地面暗殺小隊(duì)(death squads)來執(zhí)行他們的“尋覓——修正——收工(Find-Fix-Finish)”策略。除了要處理記錄下的蜂窩手機(jī)通話數(shù)據(jù)(所謂的“DNR”,也就是被叫號(hào)碼識(shí)別數(shù)據(jù),包括通話時(shí)間、通話長(zhǎng)度、誰呼叫誰等數(shù)據(jù)),“天網(wǎng)”也收集用戶的位置信息,建立詳細(xì)的出行檔案。關(guān)閉手機(jī)則被當(dāng)做是試圖逃避監(jiān)控的跡象而受到“天網(wǎng)”的標(biāo)記。天真地相信更換SIM卡就能防止被追蹤、并且這么做了的人,也會(huì)受到“天網(wǎng)”的標(biāo)記(燒入手機(jī)的ESN、MEID或是IMEI會(huì)讓手機(jī)即使換了SIM卡也會(huì)被追蹤痕跡)?;脽羝Q,即使是更換手機(jī)也會(huì)被探測(cè)到并受到標(biāo)記。這種探測(cè),我們只能猜測(cè)(因?yàn)榛脽羝蠜]有對(duì)這一點(diǎn)進(jìn)行詳細(xì)介紹),可能是基于其他元數(shù)據(jù)(比如現(xiàn)實(shí)世界中的用戶位置、社交網(wǎng)絡(luò)等)不變的基礎(chǔ)上的。
有了完整的元數(shù)據(jù)集,“天網(wǎng)”就能拼湊出一個(gè)人典型的日常軌跡——和誰一起出行、有哪些共同聯(lián)系人、和朋友們一起通宵、去其他國(guó)家旅行或是永久地搬離了??傮w而言,這些幻燈片顯示,NSA的機(jī)器學(xué)習(xí)算法使用超過80種不同的屬性來為人們的“恐怖分子程度”打分。
幻燈片告訴我們,這個(gè)程序的假設(shè)是,恐怖分子與普通居民在其中一些屬性的行為上有顯著的區(qū)別。然而,在Intercept去年的披露中可以清楚地看到,被這個(gè)機(jī)器學(xué)習(xí)程序打出最高分的是Ahmad Zaidan,半島電視臺(tái)在伊斯蘭堡的分社社長(zhǎng)。
這里并不想窮究這事情本身的好壞是非,想強(qiáng)調(diào)的是用終端采集數(shù)據(jù)(上面的例子中主要是手機(jī)),云端對(duì)數(shù)據(jù)進(jìn)行分析提取(上面的例子是通過機(jī)器學(xué)習(xí)對(duì)人的行為特征打分),獲得自己想要的東西(上述例子是標(biāo)識(shí)出恐怖分子),這個(gè)過程是不可逆的。一方面我們采集的數(shù)據(jù)會(huì)越來越精確、越來越多,想象下我們說的萬物互聯(lián)(IoT)的本質(zhì)含義,手表、騎行、家電、健康追蹤等,事實(shí)上都在加速這一過程。人類在這種浪潮前完全沒有抵抗能力,比如說如果有一天人的血糖可以不抽血就檢測(cè)了,并且這種技術(shù)可以集成到手表里了,那有多少人會(huì)因?yàn)閾?dān)心數(shù)據(jù)泄露而不戴手表,仍然采用抽血的方式進(jìn)行檢查呢。所以世界的數(shù)據(jù)化,人的數(shù)據(jù)化是不可抗拒的趨勢(shì),而另一方面計(jì)算能力和分析能力會(huì)越來越強(qiáng)。
作為結(jié)果比特世界對(duì)真實(shí)世界的描述一定越來越精準(zhǔn)。而數(shù)據(jù)化的程度越高,中介就會(huì)被去的越徹底,自動(dòng)化的程度也就會(huì)越高。我們會(huì)越來越以數(shù)據(jù)的思路來思考問題。所以說天網(wǎng)就在那里悄悄的萌芽。
隱私上的爭(zhēng)議其實(shí)徒勞而無功
這里最具爭(zhēng)議的地方估計(jì)是隱私,但有的時(shí)候我們會(huì)發(fā)現(xiàn)隱私其實(shí)與發(fā)展往往是對(duì)立的。隱私有兩種保護(hù)方式,一種是靠規(guī)則,比如法律等;一種則是靠物理的手段,比如我就不上網(wǎng),不用手機(jī)。《國(guó)家敵人》里的老特工就是用這方式來對(duì)抗政府的追蹤。后者與人們的意識(shí)形態(tài)和歷史傳承深度關(guān)聯(lián),但確實(shí)會(huì)阻礙很多東西的發(fā)展,比如說一個(gè)朋友告訴我德國(guó)人更喜歡用現(xiàn)金,因?yàn)檫@會(huì)更好的保護(hù)自己的隱私,但這種習(xí)慣無疑會(huì)阻礙電商這類互聯(lián)網(wǎng)業(yè)務(wù)的發(fā)展。這類習(xí)慣其實(shí)相當(dāng)于擋在數(shù)據(jù)化大潮正前端的障礙,體現(xiàn)為和發(fā)展相博弈的力量。
最終隱私的保護(hù)不可能通過逃避數(shù)據(jù)化來實(shí)現(xiàn),而只可能依賴于規(guī)則和立法。在技術(shù)上隱私是處在消亡之中,人越來越是透明人。長(zhǎng)線看,也可以說透明人是技術(shù)發(fā)展必然結(jié)果。
小結(jié)
這個(gè)時(shí)代的所有人幾乎都是迷茫的,我們不知道接下來會(huì)發(fā)生什么,也不知道會(huì)發(fā)生的事情究竟是好還是壞。技術(shù)上變透明這事其實(shí)是中性,往好處想可以講它帶來了解決人類不適合處理公共事務(wù)這千古難題的契機(jī),往壞處想則可以講它帶來了一個(gè)人有能力統(tǒng)治整個(gè)世界的可能性。