給機(jī)器人“造腦”:英偉達(dá)在AI芯片領(lǐng)域有多牛?

責(zé)任編輯:zsheng

2018-06-14 23:10:19

摘自:21IC電子網(wǎng)

AI芯片全球起步時(shí)間幾乎同步,此時(shí),人工智能領(lǐng)域尚未出現(xiàn)“獨(dú)步天下”的國(guó)際巨頭。但是也要警惕“全民造芯”虛火,目前還沒(méi)有出現(xiàn)像CPU(中央處理器)一樣的AI通用算法芯片,AI的殺手級(jí)應(yīng)用還沒(méi)出現(xiàn),未來(lái)這個(gè)產(chǎn)業(yè)還有很長(zhǎng)一段路要走。

AI芯片全球起步時(shí)間幾乎同步,此時(shí),人工智能領(lǐng)域尚未出現(xiàn)“獨(dú)步天下”的國(guó)際巨頭。但是也要警惕“全民造芯”虛火,目前還沒(méi)有出現(xiàn)像CPU(中央處理器)一樣的AI通用算法芯片,AI的殺手級(jí)應(yīng)用還沒(méi)出現(xiàn),未來(lái)這個(gè)產(chǎn)業(yè)還有很長(zhǎng)一段路要走。

AI芯片之于人工智能的意義,則可以理解為發(fā)動(dòng)機(jī)之于汽車。人工智能這一理論已經(jīng)提出了多年,但是由于實(shí)現(xiàn)它需要的計(jì)算量實(shí)在太大,這輛“跑車”一直沒(méi)有配備上合適的“發(fā)動(dòng)機(jī)”,只能放在倉(cāng)庫(kù)積灰。直到AI算法和大數(shù)據(jù)時(shí)代的到來(lái)、以及AI芯片的出現(xiàn)。

第三波AI浪潮的發(fā)展主要由深度學(xué)習(xí)技術(shù)的突破引領(lǐng),而英偉達(dá)(Nvidia)憑借其通用的GPU單元,專門(mén)的TensorRT加速器,強(qiáng)勁的矩陣運(yùn)算性能加上對(duì)其他算法的兼顧,英偉達(dá)不僅能用GPU滿足AI構(gòu)建的訓(xùn)練需求,還能用TeslaRT用來(lái)部署,很好實(shí)現(xiàn)AI構(gòu)建,所以英偉達(dá)也率先成了這一波AI熱潮的最大受益者。

給機(jī)器人“造腦”,英偉達(dá)發(fā)布全新AI芯片Jetson Xavier

近日,英偉達(dá)正式發(fā)布了一款全新AI芯片—Jetson Xavier,Jetson Xavier作NVIDIA Isaac平臺(tái)的核心,是全球首款專為機(jī)器人設(shè)計(jì)的計(jì)算機(jī)。該公司CEO黃仁勛在周一的新聞發(fā)布會(huì)上表示:“這臺(tái)小電腦,將成為未來(lái)機(jī)器人的大腦”。

Jetson Xavier包含了六顆處理器,包括1個(gè)Volta Tensor Core GPU、1個(gè)8核ARM64 CPU、2個(gè)NVDLA深度學(xué)習(xí)加速器、1個(gè)圖像處理器、1個(gè)視覺(jué)處理器和1個(gè)視頻處理器,每秒可執(zhí)行30萬(wàn)億次操作。為了打造它,Nvidia足足耗費(fèi)了五年的時(shí)間——三年設(shè)計(jì)、兩年筑造,共有超過(guò)8000人參與了設(shè)計(jì)與開(kāi)發(fā),可以說(shuō)這是Nvidia單獨(dú)做過(guò)的最長(zhǎng)的一個(gè)處理器項(xiàng)目。它的處理能力與配備了10萬(wàn)美元GPU的工作站大致相同,但功率僅為30瓦。

簡(jiǎn)而言之,就是Nvidia成功地將1000瓦性能的10萬(wàn)美元級(jí)工作站,縮小到了30瓦的‘掌中寶’的程度。

NVIDIA為Jetson Xavier的模擬、訓(xùn)練、驗(yàn)證和部署提供了一個(gè)工具箱。該機(jī)器人軟件包含Isaac SDK、Isaac IMX、Isaac Sim三方面內(nèi)容:

l Isaac SDK:一套API和工具,可借助全面加速的庫(kù),開(kāi)發(fā)機(jī)器人算法軟件及運(yùn)行時(shí)框架。

l Isaac IMX:Isaac智能機(jī)器加速應(yīng)用,是NVIDIA開(kāi)發(fā)的機(jī)器人算法軟件的集合。

l 當(dāng)前Nvidia的技術(shù),已經(jīng)被一些企業(yè)用于自主倉(cāng)庫(kù)機(jī)器人、機(jī)器采摘和農(nóng)業(yè)機(jī)器人。不過(guò)黃仁勛表示,JetsonXavier要比之前的AI芯片要強(qiáng)大20倍。

l Isaac Sim:高度逼真的虛擬仿真環(huán)境,可供開(kāi)發(fā)者訓(xùn)練自主機(jī)器,并使用Jetson Xavier進(jìn)行硬件在環(huán)測(cè)試。

提早轉(zhuǎn)型,英偉達(dá)開(kāi)啟人工智能之路

作為一家圖像處理芯片公司,Nvidia約在7年前就已經(jīng)開(kāi)始轉(zhuǎn)型布局人工智能。當(dāng)時(shí)人工智能概念還未興起,AI仍是一片藍(lán)海。經(jīng)過(guò)持續(xù)多年的研發(fā),公司在近年來(lái)陸續(xù)推出人工智能芯片、系統(tǒng)、軟件和服務(wù),打造世界頂級(jí)人工智能公司。

2009年 英偉達(dá)Tegra進(jìn)入奧迪汽車

德國(guó)大眾為旗下的奧迪汽車引入新式導(dǎo)航系統(tǒng),并首次采用NVIDIATegra片上系統(tǒng)處理器。相比于2009年初的多媒體交互系統(tǒng)(MMI),新的Tegra核心導(dǎo)航系統(tǒng)自然要更加高級(jí),不但功能上更強(qiáng)大,效果也應(yīng)該更酷一些。

在后來(lái)的GTC 2014大會(huì)上,奧迪自動(dòng)駕駛汽車再次展示了基于Tegra K1開(kāi)發(fā)套件的車載智能系統(tǒng),可提供自動(dòng)駕駛、導(dǎo)航、碰撞感應(yīng)、智能鏈接等功能。

2013年11月 IBM和英偉達(dá)聯(lián)合開(kāi)發(fā)超級(jí)計(jì)算機(jī)

IBM與芯片廠商英偉達(dá)Nvidia達(dá)成戰(zhàn)略合作,共同設(shè)計(jì)開(kāi)發(fā)新型超級(jí)計(jì)算機(jī)系統(tǒng)和服務(wù)器。英偉達(dá)開(kāi)發(fā)的圖形處理單元芯片(GPU),很好適用于浮點(diǎn)計(jì)算,表現(xiàn)勝于英特爾的傳統(tǒng)CPU Xeon和AMD的Opteron。排名第二位的“泰坦”也搭載了GPU。

根據(jù)IBM和英偉達(dá)合作內(nèi)容,雙方在芯片方面就行合作,通過(guò)技術(shù)共享,讓英偉達(dá)的Tesla GPU更好與前者的Power 8芯片協(xié)同工作。

早期的Tesla車型曾使用過(guò)Tegra 2,但處理能力遠(yuǎn)遠(yuǎn)不夠,所以后來(lái)升級(jí)到了Tegra 3。特斯拉Model S電動(dòng)車的車載娛樂(lè)系統(tǒng)也是基于Tegra 3設(shè)計(jì)。Nvidia基于在圖形處理方面長(zhǎng)期積累與CUDA架構(gòu),和特斯拉建立密切的合作。而特斯拉為Nvidia在高度智能化的汽車上的布局上起到助推作用。

2014年早期特斯拉ModelS搭載英偉達(dá)Tegra 3

Nvidia不僅在硬件上有布局,同時(shí)已經(jīng)滲透到了軟件層面。Nvidia將一輛Jeep進(jìn)行深度改裝,但改的不是發(fā)動(dòng)機(jī)、輪轂或包圍,而是中控系統(tǒng)。改裝后的Jeep采用3D打印制造出的中控臺(tái),搭配一個(gè)17英寸的電容屏。屏幕劃分為3個(gè)區(qū)域,上中下分貝顯示地圖、娛樂(lè)信息以及HVAC(比如空調(diào)控制)。配合Tegra K1,Nvidia直接切入到了車輛的CAN總線中,實(shí)現(xiàn)了對(duì)整個(gè)車輛的控制。

2014年初,世界上采用NVIDIA處理器的汽車已經(jīng)超過(guò)450萬(wàn)輛,涉及20多個(gè)品牌、100多款車型,其中包括奧迪、寶馬、大眾等車企巨頭,也包括特斯拉這種車界新貴。2015年,Tegra芯片在汽車領(lǐng)域發(fā)展加快,在道路上跑的汽車有超過(guò)800萬(wàn)輛搭載Tegra芯片。2015年第三季度Nvidia在汽車領(lǐng)域的業(yè)務(wù)銷量增長(zhǎng)了51%。

2015年12月 Facebook開(kāi)源BigSur

Facebook研發(fā)代號(hào)為“BigSur”的新一代硬件的設(shè)計(jì)目標(biāo)是訓(xùn)練神經(jīng)網(wǎng)絡(luò)。除人工智能外,這一技術(shù)還經(jīng)常被稱作機(jī)器或深度學(xué)習(xí)。Facebook與Nvidia進(jìn)行合作,是第一家采用英偉達(dá)TeslaM40GPU加速器的廠商。M40GPU面向深度神經(jīng)網(wǎng)絡(luò),是BigSur平臺(tái)和OpenRack兼容硬件的關(guān)鍵。

采用M40的BigSur平臺(tái)的速度是該Facebook上一代產(chǎn)品的2倍,使得訓(xùn)練規(guī)模相當(dāng)于原來(lái)2倍的神經(jīng)網(wǎng)絡(luò)的速度提高1倍。BigSur是第一款針對(duì)機(jī)器學(xué)習(xí)、人工智能研究開(kāi)發(fā)的開(kāi)放源代碼計(jì)算系統(tǒng),F(xiàn)acebook將把設(shè)計(jì)材料提交給開(kāi)放計(jì)算項(xiàng)目。

2016年新款特斯拉model S采用Tegrak1

2016年新款狀態(tài)顯示器分辨率升級(jí),從過(guò)去的1280x480 升級(jí)到1920x720,因此副處理器也從Tegra 2升級(jí)為T(mén)egra 3,主處理器從Tegra 3升級(jí)到了Tegra k1 從而更好地支持自動(dòng)輔助駕駛功能。

Tesla P40、Tesla P4高性能計(jì)算卡

2016年9月,NVIDIA發(fā)布新一代高性能計(jì)算卡Tesla P40、Tesla P4,它們倆將取代上代麥克斯韋架構(gòu)的Tesla M40/M4,進(jìn)化到最新的帕斯卡架構(gòu),擁有16nm工藝。這兩款計(jì)算卡主要負(fù)責(zé)圖像、文字和語(yǔ)音識(shí)別,專為人工智能、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)推演而生。

Tesla P4及P40特別針對(duì)推論設(shè)計(jì),使用經(jīng)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)識(shí)別語(yǔ)音、影像及文字以回應(yīng)使用者和裝置要求。Pascal架構(gòu)GPU具備以8位(INT8)運(yùn)算為主的專門(mén)推論指令,提供比CPU快45倍的反應(yīng)速度,與不到一年前推出的GPU解決方案相比則提升了4倍。

深度學(xué)習(xí)超級(jí)計(jì)算機(jī)NVIDIADGX-1

深度學(xué)習(xí)最苛刻的部分是訓(xùn)練。NVIDIA專為深度學(xué)習(xí)設(shè)計(jì)的PASCAL架構(gòu),助推深度學(xué)習(xí)加速高達(dá)65倍,并且能夠支持每個(gè)主要的深度學(xué)習(xí)框架。在此架構(gòu)基礎(chǔ)上,NVIDIA創(chuàng)造了專為GPU深度學(xué)習(xí)所設(shè)計(jì)的超級(jí)計(jì)算機(jī)DGX1。

NVIDIA的DGX-1基于Tesla P100加速卡(研發(fā)費(fèi)用高達(dá)20億美元)是世界上首款專為深度學(xué)習(xí)而打造的系統(tǒng),具備全面集成的硬件和軟件,可以輕松快速地完成部署。NVIDIADGX-1革命性的性能可大幅加快訓(xùn)練速度,成為世界上首款體積小性能強(qiáng)(單機(jī)箱)的深度學(xué)習(xí)超級(jí)計(jì)算機(jī)。

協(xié)同駕駛AI Co-Pilot

XAVIER已經(jīng)被英偉達(dá)安裝在一輛基于林肯MKC所打造的自動(dòng)駕駛測(cè)試車BB8上,另外,英偉達(dá)還將在自動(dòng)駕駛領(lǐng)域同奧迪展開(kāi)合作,其全自動(dòng)駕駛汽車預(yù)計(jì)將在2020年上路。

AI Co-Pilot(人工智能協(xié)同駕駛)系統(tǒng)該系統(tǒng)具有人臉識(shí)別、頭部追蹤、視線追蹤等功能,能在行車中輔助駕駛者,提高駕駛安全性與便利性。AI Co-Pilot還能在復(fù)雜的噪聲環(huán)境中通過(guò)讀唇獲知駕駛者的需求,準(zhǔn)確率已達(dá)93.4%。

英偉達(dá)的優(yōu)勢(shì)真的是無(wú)人能擋嗎?

英偉達(dá)上周發(fā)布的第一季財(cái)報(bào)再次超出業(yè)界預(yù)期,財(cái)報(bào)顯示這一季度總收入增長(zhǎng)了66%,其中數(shù)據(jù)中心業(yè)務(wù)營(yíng)收增長(zhǎng)71%達(dá)到7.01億美元。英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)包含HPC(高性能計(jì)算)、數(shù)據(jù)中心GPU以及AI加速器即使相比過(guò)去幾年2-3倍的增長(zhǎng)率要少很多,但極具潛力的AI芯片市場(chǎng)空間依舊吸引了眾多巨頭和創(chuàng)業(yè)者的參與。

不過(guò)英偉達(dá)現(xiàn)在具有優(yōu)勢(shì)并不意味著AI市場(chǎng)的蛋糕會(huì)被英偉達(dá)獨(dú)吞,無(wú)論是科技巨頭英特爾、谷歌、IBM、AMD還是OURS、地平線、寒武紀(jì)等初創(chuàng)企業(yè)都紛紛加入了AI芯片領(lǐng)域的競(jìng)爭(zhēng)。

英特爾這幾年也是卯足了勁入軍AI市場(chǎng),英特爾的All in AI實(shí)力也是不容小覷。除了鞏固資深的優(yōu)勢(shì)產(chǎn)品以外,還進(jìn)行了一系列的收購(gòu)以增強(qiáng)自己的能力。英特爾針對(duì)已有的優(yōu)勢(shì)產(chǎn)品XeonPhi加速計(jì)算卡、收購(gòu)的Altera FPGA、 Nervana System幾大產(chǎn)品線進(jìn)行深度學(xué)習(xí)的優(yōu)化,從AI構(gòu)建的訓(xùn)練和部署都能夠看出這均與英偉達(dá)形成競(jìng)爭(zhēng),在自動(dòng)駕駛應(yīng)用場(chǎng)景中也通過(guò)收購(gòu)Mobileye與英偉達(dá)形成強(qiáng)競(jìng)爭(zhēng)關(guān)系。同時(shí)還基于FPGA打造自己在AI領(lǐng)域的特色,對(duì)人工智能初創(chuàng)芯片企業(yè)的持續(xù)投資也有助于英特爾在AI芯片領(lǐng)域?qū)崿F(xiàn)后來(lái)居上。

除了英特爾All In AI全面叫板英偉達(dá),眾多初創(chuàng)公司也會(huì)成為挑戰(zhàn)英偉達(dá)不可忽視的對(duì)手。

以2017年由兩位華人在美國(guó)硅谷創(chuàng)立的OURS為代表,OURS以低功耗端計(jì)算AI芯片為核心技術(shù),目標(biāo)是解決工業(yè)/商業(yè)、機(jī)器人、汽車自動(dòng)駕駛、安防等領(lǐng)域的3D機(jī)器視覺(jué)和多傳感器融合的問(wèn)題。OURS的核心技術(shù)之一就是硅光技術(shù),這一技術(shù)很適合于計(jì)算機(jī)內(nèi)部和多核之間的大規(guī)模通信,其最大的優(yōu)勢(shì)在于擁有相當(dāng)高的傳輸速率,可使處理器內(nèi)核之間的數(shù)據(jù)傳輸速度比目前快 100 倍甚至更高。OURS 采用的是以數(shù)據(jù)為中心的RISC-V 計(jì)算機(jī)指令集架構(gòu),這也是OURS的另一大核心優(yōu)勢(shì)。

寒武紀(jì)近日也發(fā)布了一款云端智能芯片Cambricon MLU100,詞云端芯片也延續(xù)了寒武紀(jì)產(chǎn)品通用性的特點(diǎn),支持各類深度學(xué)習(xí)和經(jīng)典機(jī)器學(xué)習(xí)算法,滿足視覺(jué)、語(yǔ)音、自然語(yǔ)言處理、經(jīng)典數(shù)據(jù)挖掘等領(lǐng)域復(fù)雜場(chǎng)景下(如大數(shù)據(jù)量、多任務(wù)、多模態(tài)、低延時(shí)、高通量)的云端智能處理需求。

不只是硬件,寒武紀(jì)還努力實(shí)現(xiàn)軟硬件的協(xié)同工作,寒武紀(jì)從 2016 年起逐步推出了寒武紀(jì) NeuWare 軟件工具鏈,該平臺(tái)終端和云端產(chǎn)品均支持,可以實(shí)現(xiàn)對(duì) tensorflow、caffe 和 mxnet 的 API 兼容,同時(shí)提供寒武紀(jì)專門(mén)的高性庫(kù),可以方便地進(jìn)行智能應(yīng)用的開(kāi)發(fā),遷移和調(diào)優(yōu)。

小結(jié):

AI芯片全球起步時(shí)間幾乎同步,此時(shí),人工智能領(lǐng)域尚未出現(xiàn)“獨(dú)步天下”的國(guó)際巨頭。但是也要警惕“全民造芯”虛火,目前還沒(méi)有出現(xiàn)像CPU(中央處理器)一樣的AI通用算法芯片,AI的殺手級(jí)應(yīng)用還沒(méi)出現(xiàn),未來(lái)這個(gè)產(chǎn)業(yè)還有很長(zhǎng)一段路要走。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)