英特爾正在發(fā)力人工智能技術(shù),試圖在這一領(lǐng)域挑戰(zhàn)領(lǐng)先者英偉達(dá)。近期收購的Nervana Systems將是英特爾開拓人工智能市場的先鋒。
英特爾已公布了關(guān)于人工智能的計(jì)劃,但至少有一塊關(guān)鍵拼圖尚未完成。
英特爾此前收購了Nervana Systems,并宣布將繼續(xù)銷售該公司的所有產(chǎn)品。這些產(chǎn)品面向高端應(yīng)用,尤其是神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。這一領(lǐng)域目前的領(lǐng)先者是英偉達(dá)。與此同時(shí),英特爾收購Movidius的交易尚未完成,因此在計(jì)算機(jī)視覺和邊緣網(wǎng)絡(luò)方面還有很大的缺失需要填補(bǔ)。此外,英特爾還公布了多個(gè)人工智能軟件產(chǎn)品、服務(wù)和合作項(xiàng)目。
在近期舉行的英特爾人工智能活動(dòng)上,Movidius CEO曾短暫露面。他沒有透露,這筆交易將于何時(shí)完成以及障礙是什么。他表示:“我們期待加入英特爾大家庭。”他介紹了應(yīng)用至汽車、無人機(jī)、安防攝像頭和其他產(chǎn)品的低功耗芯片的計(jì)劃。
即使這筆交易完成,英特爾也無法提供完整的人工智能產(chǎn)品。不過,毫無疑問這是英特爾的目標(biāo)所在。
英特爾CEO科再奇(Brian Krzanich)在此次活動(dòng)的主題演講上表示:“人工智能將變革我們目前所知的大部分行業(yè),因此我們希望成為人工智能領(lǐng)域可信賴的領(lǐng)導(dǎo)者和開發(fā)者。”
Nervana CEO及聯(lián)合創(chuàng)始人奈文·拉奧(Naveen Rao)是此次活動(dòng)上的明星。英特爾已經(jīng)為Nervana的全系列產(chǎn)品大開綠燈,其中涉及處理器、板卡、系統(tǒng)、軟件和人工智能云計(jì)算服務(wù)。
Nervana的加速處理器Lake Crest將于明年推出。據(jù)稱在同樣的能耗水平上,相對(duì)于目前的頂級(jí)圖形處理器,這款產(chǎn)品在運(yùn)行神經(jīng)網(wǎng)絡(luò)任務(wù)時(shí)將會(huì)有更好的性能。這款芯片將使用臺(tái)積電的28納米工藝制造。
拉奧首次展示了這款芯片從頭開始設(shè)計(jì)的架構(gòu)。這款芯片可以加速各類神經(jīng)網(wǎng)絡(luò),例如谷歌TensorFlow框架。芯片由所謂的“處理集群”陣列構(gòu)成,處理被稱作“活動(dòng)點(diǎn)”的簡化數(shù)學(xué)運(yùn)算。相對(duì)于浮點(diǎn)運(yùn)算,這種方法所需的數(shù)據(jù)量更少,因此帶來了10倍的性能提升。
Lake Crest利用私有的數(shù)據(jù)連接創(chuàng)造了規(guī)模更大、速度更快的集群,其拓?fù)浣Y(jié)構(gòu)為圓環(huán)形或其他形式。這幫助用戶創(chuàng)造更大、更多元化的神經(jīng)網(wǎng)絡(luò)模型。這一數(shù)據(jù)連接中包含12個(gè)100Gbps的雙向連接,其物理層基于28G的串并轉(zhuǎn)換。
這一2.5D芯片搭載了32GB的HBM2內(nèi)存,內(nèi)存帶寬為8Tbps。芯片中沒有緩存,完全通過軟件去管理片上存儲(chǔ)。
英特爾并未透露這款產(chǎn)品的未來路線圖,僅僅表示計(jì)劃發(fā)布一個(gè)名為Knights Crest的版本。該版本將集成未來的至強(qiáng)處理器和Nervana加速處理器。預(yù)計(jì)這將會(huì)支持Nervana的集群。不過英特爾沒有透露,這兩大類型的芯片將如何以及何時(shí)實(shí)現(xiàn)整合。
拉奧表示,整合的版本將會(huì)有更強(qiáng)的性能,同時(shí)更易于編程。目前基于圖形處理芯片(GPU)的加速處理器使編程變得更復(fù)雜,因?yàn)殚_發(fā)者要維護(hù)單獨(dú)的GPU和CPU內(nèi)存。
拉奧還表示,到2020年,英特爾將推出芯片,使神經(jīng)網(wǎng)絡(luò)訓(xùn)練的性能提高100倍。一名分析師表示,這一目標(biāo)“極為激進(jìn)”。毫無疑問,英特爾將迅速把這一架構(gòu)轉(zhuǎn)向更先進(jìn)的制造工藝,與已經(jīng)采用14納米或16納米FinFET工藝的GPU展開競爭。
最初的加速處理器需要通過PCI-E總線去連接主機(jī)。近期,英特爾決定更進(jìn)一步,不僅提供應(yīng)用,也提供云計(jì)算服務(wù)。
這款產(chǎn)品是英特爾大膽的一步。英特爾希望憑借這款產(chǎn)品取得相對(duì)于英偉達(dá)的技術(shù)優(yōu)勢。目前,后者的GPU芯片被廣泛用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。這是一項(xiàng)非常依賴于處理器的任務(wù)。百度等公司的研究人員表示,為了限制數(shù)據(jù)集的規(guī)模,他們往往要花幾個(gè)月時(shí)間。
拉奧表示:“目前,藝術(shù)級(jí)的神經(jīng)網(wǎng)絡(luò)模型需要花幾周到幾個(gè)月時(shí)間去訓(xùn)練。”他指出,百度研究院使用的一個(gè)模型需要消耗百萬萬億次運(yùn)算。
科再奇則表示:“Nervana定位高端,給我們帶來了深度學(xué)習(xí)最頂尖的性能。”
然而,這仍是一個(gè)規(guī)模較小的新興市場。
英特爾數(shù)據(jù)中心集團(tuán)總經(jīng)理戴安·布萊恩特(Diane Bryant)指出,去年只有0.15%的服務(wù)器被專門用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練。布萊恩特指出,英特爾收購人工智能云計(jì)算服務(wù)Saffron Technologies已吸引了終端用戶。
4名研究員已同意加入Nervana的人工智能顧問委員會(huì),幫助該公司芯片架構(gòu)未來的發(fā)展。Nervana將研究多種方式去優(yōu)化算法,簡化神經(jīng)網(wǎng)絡(luò)模型,探索降精度運(yùn)算的新方向,以及如何擴(kuò)大芯片規(guī)模。
分析師則對(duì)英特爾擁抱非x86架構(gòu)表示看好。
Moor Insights &Strategy總裁帕特里克·莫爾海德(Patrick Moorhead)表示:“如果去看看,他們?nèi)绾窝杆賹ltera、Nervana、Phi、至強(qiáng)和其他所需的軟件整合在一起,那么對(duì)英特爾這么大規(guī)模的公司而言,這令人印象深刻。目前的情況將取決于英特爾如何無錯(cuò)地執(zhí)行。”
盡管沒有針對(duì)人工智能進(jìn)行優(yōu)化,但英特爾仍然非常專注于至強(qiáng)Phi。這類多核x86芯片正被越來越多地用于超級(jí)計(jì)算機(jī)的加速處理器。
明年將推出的Knights Mill版本將可以支持最多400GB的主內(nèi)存,遠(yuǎn)遠(yuǎn)超過當(dāng)前GPU的16GB主內(nèi)存。Knights Mill使用其中一個(gè)x86核心作為集成的主控制器,并支持多種精度的運(yùn)算。
英特爾已開發(fā)了系統(tǒng),使用最多128個(gè)當(dāng)前Knights Landing版本的Phi芯片。英特爾并行計(jì)算實(shí)驗(yàn)室主任普拉迪普·杜貝(Pradeep Dubey)表示:“我們計(jì)劃將芯片個(gè)數(shù)擴(kuò)大至數(shù)百個(gè),甚至數(shù)千個(gè)。”
在軟件方面,英特爾明年初將發(fā)布并開源面向Nervana的圖形編譯器。英特爾也在優(yōu)化運(yùn)行在x86處理器之上的主流人工智能框架,包括在今年底之前推出TensorFlow的一個(gè)版本。用于深度學(xué)習(xí)的SDK將于1月份推出。
英特爾正在從多個(gè)方面去培育人工智能開發(fā)者社區(qū)。
英特爾與谷歌達(dá)成了廣泛合作,優(yōu)化基于x86處理器的云計(jì)算代碼。英特爾宣布了為期5年、總額2500萬美元的投資,與Broad Institute合作開發(fā)用于基因處理的工具和參考架構(gòu)。英特爾還專門為Nervana架構(gòu)創(chuàng)建了新的開發(fā)者社區(qū),并啟動(dòng)了新的人工智能學(xué)生開發(fā)者項(xiàng)目。