芯片是硅做的,人是碳做的,硅與碳在元素周期表上正是同一族。讓機(jī)器像人一樣思考,是順理成章的事。
——IBM 全球副總裁王陽(yáng)談人工智能和 Waston
自馮•諾依曼體系建立起來(lái),機(jī)器計(jì)算就是線程的,計(jì)算機(jī)處理的世界就是結(jié)構(gòu)化的。但世界往前發(fā)展了,數(shù)字大爆炸,信息已經(jīng)不再是結(jié)構(gòu)的或者非結(jié)構(gòu)的,而是模糊的。是不是能夠教會(huì)計(jì)算機(jī)我們是怎么理解世界的、人類是怎么進(jìn)行學(xué)習(xí)的、甚至人類對(duì)這個(gè)世界的認(rèn)識(shí)的方式。一旦把這個(gè)事情教給計(jì)算機(jī),所有數(shù)據(jù)的產(chǎn)生就讓可以計(jì)算機(jī)自己去學(xué)習(xí)了。
2011 年 2 月,IBM 的超級(jí)計(jì)算機(jī) Watson 參加智力競(jìng)賽節(jié)目“Jeopardy!”,戰(zhàn)勝了兩位人類冠軍選手,聲名鵲起,備受關(guān)注。后來(lái),Watson 一方面在華爾街打打零工,一方面潛心修煉讓癌癥宣戰(zhàn),最近還做起了廚子沒(méi)事配配各種味道還不錯(cuò)的暗黑料理。這些曾經(jīng)看起來(lái)不可思議的背后,就是人工智能的崛起。
第一個(gè)版本的 Watson 還是一個(gè)超級(jí)計(jì)算機(jī),配置的是 90 臺(tái)服務(wù)器,15TB 的內(nèi)存?,F(xiàn)在 IBM 已經(jīng)把它部署到云上,到 2013 年時(shí),它的運(yùn)算速度已經(jīng)是過(guò)去的 240 倍。所以,你可以把 Watson 理解成一種云端的應(yīng)用,嫁接在 Saas 的層面,是 Saas 和下面的 Paas 是相連接的部分,有大數(shù)據(jù)的分析能力,可以對(duì)各個(gè)行業(yè)產(chǎn)生的數(shù)據(jù)進(jìn)行認(rèn)知計(jì)算,進(jìn)行學(xué)習(xí),總結(jié)出一些規(guī)律,或者是提供一些知識(shí),輔助行業(yè)專家進(jìn)行決策。
自然語(yǔ)言處理
看過(guò) Waston 參加的那期“Jeopardy!”,你首先會(huì)感慨的肯定是 Waston 的自然語(yǔ)言處理能力。“Jeopardy!”是美國(guó)著名的智力問(wèn)答競(jìng)賽節(jié)目,不同的是它是由答案反推問(wèn)題。舉個(gè)例子來(lái)說(shuō),主持人說(shuō)“今天的北京天氣特別好天空非常藍(lán)”,Waston 就要反推問(wèn)題“什么叫 APEC 藍(lán)”。當(dāng)時(shí)主持人在答案中用到了不少反語(yǔ)、諷刺語(yǔ)、俚語(yǔ),而 Waston 都是應(yīng)對(duì)自如。
王陽(yáng)說(shuō),把自然語(yǔ)言記錄下來(lái)是第一步,之后要理解它的語(yǔ)義,還有關(guān)鍵詞,到底是什么意思。人類的語(yǔ)言是很復(fù)雜的,字面的理解和非字面的語(yǔ)義,有一些隱含的意思,不能搞錯(cuò)的。IBM 在這些方面有很獨(dú)特的認(rèn)識(shí)。事實(shí)上,當(dāng)人機(jī)對(duì)話的時(shí)候,與英語(yǔ)相比,中文反而更容易被理解。這是因?yàn)橹形亩挤浅R?guī)則,都有一個(gè)元音。而英文一個(gè)單詞好幾個(gè)元音,也可能一個(gè)元音一個(gè)段,比較難一點(diǎn)。
第二步就是翻譯系統(tǒng),從一個(gè)語(yǔ)言翻譯到另外一個(gè)語(yǔ)言,翻譯好了以后可以發(fā)聲。機(jī)器可以根據(jù)文字進(jìn)行發(fā)聲。為了更加直觀、界面更加友好,可以根據(jù)不同的人來(lái)發(fā)不同的聲,你選擇美國(guó)總統(tǒng)奧巴馬的聲音,這句話就以?shī)W巴馬的聲音來(lái)讀。只要你說(shuō)一段話,元音的發(fā)音方式都已經(jīng)有了,把它解析出來(lái)以后,就可以用機(jī)器說(shuō)任何話,就像你說(shuō)話一樣。比如《終結(jié)者 2》里,有一個(gè)機(jī)器人就是模仿人的聲音,他聽了別人說(shuō)的話,電話里馬上可以模仿說(shuō)話聲音,就欺騙了別人,這種技術(shù)現(xiàn)在可以完全做到了。
神經(jīng)網(wǎng)絡(luò)
事實(shí)上,與自然語(yǔ)言處理同樣重要的還有神經(jīng)網(wǎng)絡(luò)。我們一直采用的馮•諾依曼體系,最大的特點(diǎn)是存放信息和程序指令的內(nèi)存與處理信息的處理器是分離的。由于處理器是按照線序執(zhí)行指令的,所以必須不斷與內(nèi)存通過(guò)總線反復(fù)交換信息—而這個(gè)會(huì)成為拖慢速度和浪費(fèi)能量的瓶頸。盡管后來(lái)采用了多核芯片和緩存技術(shù),但是這些只能提高速度而不能降低太多能耗,而且沒(méi)辦法實(shí)時(shí)處理,因?yàn)橥ㄐ攀瞧款i—內(nèi)存和 CPU 的大量通信要通過(guò)總線進(jìn)行。因此,近幾十年來(lái)研究人員一直在致力于尋找突破原有體系的技術(shù)。模仿人類大腦是科學(xué)家尋求突破的方向。這后面的事情,大家就清楚了。那就是IBM的百萬(wàn)神經(jīng)元類人腦芯片TrueNorth,用單晶硅模擬神經(jīng)元。
郵票大小、重量只有幾克,但卻集成了 54 億個(gè)硅晶體管,內(nèi)置了 4096 個(gè)內(nèi)核,100 萬(wàn)個(gè)“神經(jīng)元”、2.56 億個(gè)“突觸”,能力相當(dāng)于一臺(tái)超級(jí)計(jì)算機(jī),功耗卻只有 65 毫瓦。
這種芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU 和通信部件是完全集成在一起。因此信息的處理完全在本地進(jìn)行,而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計(jì)算機(jī)內(nèi)存與 CPU 之間的瓶頸不復(fù)存在了。同時(shí)神經(jīng)元之間可以方便快捷地相互溝通,只要接收到其他神經(jīng)元發(fā)過(guò)來(lái)的脈沖(動(dòng)作電位),這些神經(jīng)元就會(huì)同時(shí)做動(dòng)作。
現(xiàn)在,這個(gè)芯片的智力現(xiàn)在跟蜜蜂的智力水平差不多。王陽(yáng)相信,他們還可以再疊加幾層,不久的將來(lái),它甚至可能超越人腦的能力。
事實(shí)上,芯片都是用單晶硅做的,人是用什么做的?人是由碳組成的。單晶硅的 SI 和 C,周期表是同一個(gè)縱向,只是多了一圈而已,這就延伸到將來(lái)機(jī)器人怎么和人相連,都有物理、化學(xué)構(gòu)造上的相似性。而具體到如何連接,王陽(yáng)只是說(shuō)他們已經(jīng)在和合作伙伴做這個(gè)事情了。
事實(shí)上, 經(jīng)常出現(xiàn)在我們眼前的萬(wàn)能材料石墨烯,也是 C 的一種。這似乎又提供了更多的遐想。
量子計(jì)算 那這是否就意味著全面的洗牌呢?王陽(yáng)說(shuō)這還是階段性的東西?,F(xiàn)在人類產(chǎn)生的數(shù)據(jù)量是 20ZB(ZB 就是 10 的 21 次方)。我們以什么樣的速度產(chǎn)生這些數(shù)據(jù)呢?到明年年底,又會(huì)產(chǎn)生大約 20ZB 的數(shù)據(jù),相當(dāng)于從原始社會(huì)到現(xiàn)在的所有數(shù)據(jù)。指數(shù)級(jí)的增長(zhǎng),既源源不斷的提供了機(jī)器學(xué)習(xí)、訓(xùn)練的素材與資料,又需要更先進(jìn)的處理計(jì)算能力。
我認(rèn)為將來(lái)是要做到量子計(jì)算,IBM 在這個(gè)方面也有很大的突破。量子計(jì)算是不得了的事。到時(shí)候人類就不用干活了,只需要讓計(jì)算機(jī)來(lái)工作就可以了。當(dāng)然,人類還需要再獲得新的數(shù)據(jù)。
量子計(jì)算機(jī)跟傳統(tǒng)計(jì)算機(jī)的不同在于,普通的計(jì)算機(jī)的 2 位寄存器在某一時(shí)刻只能存儲(chǔ)(00、01、10、11)中的一個(gè),而量子計(jì)算機(jī)的 2 位量子位(qubit)寄存器可同時(shí)存儲(chǔ)這四個(gè)數(shù)。這種疊加使得量子計(jì)算機(jī)可以同時(shí)執(zhí)行許多次的運(yùn)算,而傳統(tǒng)的計(jì)算機(jī)僅能做一次。所以量子計(jì)算機(jī)的計(jì)算能力要比傳統(tǒng)計(jì)算機(jī)強(qiáng)勁很多。
根據(jù)羅斯定律,每增加一個(gè)量子位(等同于傳統(tǒng)芯片中的晶體管),處理器的計(jì)算能力就會(huì)翻番。2012 年時(shí),曾有預(yù)言稱:量子計(jì)算在 2014 年可以解決任何非量子計(jì)算機(jī)均無(wú)法解決的問(wèn)題。除了加拿大的 D-Wave ,今年 YC 舉辦了 2014 年夏季班 Demo Day 上,Rigetti Computing就表示他們希望生產(chǎn)出世界上最強(qiáng)大的超級(jí)量子計(jì)算機(jī)。
人類已經(jīng)把 IT 的觸角延伸到各個(gè)角落,什么東西都能感知。什么地方發(fā)生什么事情,包括你的睡眠情況,虛擬世界完全可以仿真真實(shí)世界里做的事情。真的需要這樣的神經(jīng)網(wǎng)絡(luò)、認(rèn)知計(jì)算這樣一些新的創(chuàng)新,進(jìn)一步認(rèn)識(shí)這個(gè)世界。我們認(rèn)識(shí)這個(gè)世界的速度太慢了。
按照進(jìn)化論來(lái)說(shuō),這是個(gè)最好的腦袋,是來(lái)認(rèn)識(shí)世界的,為什么我們不做一個(gè)這樣的計(jì)算機(jī)來(lái)幫助我們認(rèn)識(shí)世界。它確實(shí)是有感覺,能夠感受到這個(gè)世界的變化,還有我們總結(jié)出來(lái)的語(yǔ)言,它能夠?qū)W習(xí)。未來(lái)是非常令人興奮的,未來(lái)是人機(jī)交融的世界。