近年來(lái),英偉達(dá)(Nvidia)公司一直在蓬勃發(fā)展,因?yàn)樗膱D形芯片對(duì)于人工智能的分支非常有用,這些分支導(dǎo)致了語(yǔ)音和圖像識(shí)別以及自動(dòng)駕駛汽車(chē)的突破。現(xiàn)在,它的目標(biāo)是在這方面領(lǐng)先——搶先提供從芯片到云服務(wù)的一切適用于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的東西。
為此,該公司在加利福尼亞州圣何塞市的GPU技術(shù)大會(huì)上推出了大量的新產(chǎn)品和服務(wù),所有這些產(chǎn)品和服務(wù)都把重點(diǎn)放在圖形處理單元芯片和相關(guān)軟件上。新產(chǎn)品既可以提高芯片和電腦的性能,也可以增強(qiáng)使用它們的云服務(wù)的性能,并將深度學(xué)習(xí)延伸到潛在的數(shù)十億種產(chǎn)品——從自動(dòng)駕駛汽車(chē)到消費(fèi)電子產(chǎn)品再到手機(jī)。
英偉達(dá)的創(chuàng)始人兼首席執(zhí)行官黃仁勛(圖)說(shuō):“使用GPU計(jì)算的人數(shù)呈指數(shù)增長(zhǎng)。我們正處在臨界點(diǎn)。”
在所有這些公告中唯一漏掉的一件事是新一代GPU,這往往是會(huì)議的重頭戲。英偉達(dá)在去年五月的同一次會(huì)議上介紹了基于其Volta技術(shù)的Tesla V100芯片。但直到去年11月,其最強(qiáng)大的芯片才能通過(guò)所有主要的高性能計(jì)算和云計(jì)算提供商獲得,并且勢(shì)頭仍在增長(zhǎng)。
黃仁勛確實(shí)公布了他稱之為世界上最大的GPU——基于Volta的Quadro GV100。它擁有16個(gè)Tesla V100芯片內(nèi)核以及更多的內(nèi)存和一項(xiàng)用于連接芯片中處理內(nèi)核的新技術(shù)。它還使用了在游戲開(kāi)發(fā)者大會(huì)上介紹的名為RTX的新圖形技術(shù)。英偉達(dá)表示,這是它首次能夠?qū)崟r(shí)地完成光線追蹤并創(chuàng)建真實(shí)圖像的過(guò)程。黃仁勛說(shuō):“這對(duì)于實(shí)時(shí)計(jì)算機(jī)圖形來(lái)說(shuō)是一個(gè)巨大的飛躍。”
但是,最近幾年的主要焦點(diǎn)是深度學(xué)習(xí),英偉達(dá)并不缺乏支持使用深度學(xué)習(xí)的Volta芯片的新技術(shù)。首先,黃仁勛介紹了對(duì)英偉達(dá)平臺(tái)進(jìn)行的一系列改進(jìn),這些平臺(tái)在六個(gè)月前將深度學(xué)習(xí)工作負(fù)載的性能提高了八倍。
原因之一是該公司已將V100上的內(nèi)存量增加了一倍,達(dá)到了32千兆字節(jié),這將內(nèi)存受限的高性能計(jì)算應(yīng)用程序的性能提高了一半。另一個(gè)原因是一個(gè)連接于名為NVSwitch的GPU的新“架構(gòu)(fabric)”,它可以讓多達(dá)16個(gè)V100進(jìn)行快速通信,以運(yùn)行更大的數(shù)據(jù)集和一個(gè)更新的軟件“棧”。
同樣重要的是,還有一款新名為DGX-2的服務(wù)器,英偉達(dá)表示它是第一款可以提供每秒2千萬(wàn)億次或者數(shù)十億浮點(diǎn)運(yùn)算能力的單一服務(wù)器。該機(jī)在第三季度推出時(shí)售價(jià)為399000美元,它可以在兩天(而不是15天)內(nèi)處理標(biāo)準(zhǔn)的FAIRSeq機(jī)器翻譯模型。黃仁勛說(shuō):“我們正在以超越摩爾定律的速度大幅提升平臺(tái)的性能”,芯片性能每隔兩年就翻一番。
Moor Insights&Strategy的總裁兼首席分析師Patrick Moorhead表示:“DGX-2的最大特點(diǎn)是新的NVSwitch。這可以提高性能,并減少延遲,因?yàn)镚PU不需要頻頻訪問(wèn)主內(nèi)存......這是非常重要的事情。”
運(yùn)行模型
英偉達(dá)的芯片已被大多數(shù)公司用于訓(xùn)練語(yǔ)音和圖像識(shí)別等應(yīng)用的深度學(xué)習(xí)模型,并宣布了運(yùn)行這些模型的名為“推斷”的新技術(shù)。Nvidia Accelerated Computing的副總裁兼總經(jīng)理Ian Buck在新聞發(fā)布會(huì)上表示,GPU在推斷中得到了越來(lái)越多的使用。
例如,堪薩斯城正在使用深度學(xué)習(xí)來(lái)預(yù)測(cè)道路上出現(xiàn)坑洞的準(zhǔn)確率為76%,它預(yù)計(jì)準(zhǔn)確率將達(dá)到95%。品趣志公司(Pinterest Inc.)使用基于GPU的系統(tǒng)來(lái)執(zhí)行實(shí)時(shí)圖像分類和推薦系統(tǒng)。Buck說(shuō):“我們正在創(chuàng)建一個(gè)新的計(jì)算模型,這實(shí)際上就是軟件自己編寫(xiě)軟件。”
英偉達(dá)為了進(jìn)一步擴(kuò)大其在推斷工作中的影響力,它宣布要推出新版本的TensorRT推斷軟件,其中包括與谷歌公司(Google Inc.)的受人青睞的TensorFlow機(jī)器學(xué)習(xí)軟件框架的集成。英偉達(dá)還與亞馬遜網(wǎng)絡(luò)服務(wù)公司、臉書(shū)公司(Facebook Inc.)和微軟公司合作,確保Caffe 2、MXNet CNTK、Chainer和Pytorch等框架可以在英偉達(dá)平臺(tái)上輕松運(yùn)行。同樣重要的是,現(xiàn)在針對(duì)軟件容器的流行“編排”工具Kubernetes有了GPU加速功能,它可以讓?xiě)?yīng)用程序在多種計(jì)算機(jī)、操作系統(tǒng)和云上運(yùn)行。
物聯(lián)網(wǎng)
英偉達(dá)旨在將深度學(xué)習(xí)引進(jìn)汽車(chē)乃至智能手機(jī)的“物聯(lián)網(wǎng)”設(shè)備。為此,它已經(jīng)與ARM Holdings(制造主要用于移動(dòng)設(shè)備的節(jié)能芯片的廠家)建立了合作關(guān)系,將英偉達(dá)的開(kāi)源Deep Learning Accelerator架構(gòu)整合到ARM的Trillium機(jī)器學(xué)習(xí)處理器項(xiàng)目中。
Moorhead說(shuō):“這一消息使英偉達(dá)的機(jī)器學(xué)習(xí)技術(shù)能夠應(yīng)用于家居自動(dòng)化,甚至是智能手機(jī)等更小的物聯(lián)網(wǎng)設(shè)備中。與ARM的合作并不能保證英偉達(dá)的NVDLA能在‘非常小的優(yōu)勢(shì)’上取得成功,但卻大大增加了它的機(jī)會(huì)。”
同樣重要的是,英偉達(dá)正在處理改進(jìn)自動(dòng)駕駛汽車(chē)的關(guān)鍵任務(wù),其中一個(gè)任務(wù)緣起優(yōu)步(Uber Technologies Inc.)在亞利桑那州引發(fā)的一起行人喪生事故,這起事故似乎是可以預(yù)防的。英偉達(dá)的資深汽車(chē)總監(jiān)Danny Shapiro指出,蘭德公司(Rand Corp.)認(rèn)為要使自動(dòng)駕駛汽車(chē)變得安全,數(shù)十億英里的訓(xùn)練是少不了的。他說(shuō),在合理的時(shí)間范圍內(nèi)做到這一點(diǎn)的唯一方法是通過(guò)快速,超現(xiàn)實(shí)的模擬。
這就是英偉達(dá)宣布的內(nèi)容。DRIVE Constellation是一款使用虛擬現(xiàn)實(shí)技術(shù)的自動(dòng)駕駛模擬器,它可以模擬攝像機(jī),LiDAR和用于汽車(chē)操作的雷達(dá)。來(lái)自該模擬器的數(shù)據(jù)被送入車(chē)內(nèi)的第二臺(tái)服務(wù)器DRIVE Pegasus進(jìn)行處理,并且駕駛命令以每秒30次的頻率傳回Constellation,以驗(yàn)證車(chē)輛是否正常運(yùn)行。我們可以反復(fù)模擬各種罕見(jiàn)的“奇怪”駕駛情況來(lái)改進(jìn)系統(tǒng)。
這可能特別關(guān)鍵,因?yàn)橛ミ_(dá)宣布,作為對(duì)最近發(fā)生的交通事故,它暫時(shí)停止了自動(dòng)駕駛汽車(chē)的測(cè)試,隨后優(yōu)步也停止了在亞利桑那州的測(cè)試。數(shù)百家致力于自動(dòng)駕駛汽車(chē)的公司使用英偉達(dá)的DRIVE技術(shù)。
Moorhead說(shuō):“DRIVE Constellation意義非凡,因?yàn)橛ミ_(dá)能根據(jù)人們?cè)谟螒蛑械谋尘昂陀捌瑒?chuàng)意提供他們想要的盡可能真實(shí)的圖像。讓我喜歡的是:汽車(chē)公司可以模擬數(shù)百億英里的駕駛,而不必在真正的可能會(huì)危及生命的汽車(chē)中駕駛。”
前沿
此外,與人工智能相關(guān)的公告似乎讓英偉達(dá)走到了前沿——機(jī)器學(xué)習(xí)模型的訓(xùn)練和運(yùn)行所需的芯片和軟件。盡管最近這種競(jìng)爭(zhēng)更激烈。例如,英特爾公司在11月宣布與長(zhǎng)期競(jìng)爭(zhēng)對(duì)手超微半導(dǎo)體公司(Advanced Micro Devices Inc.,AMD)建立了令人驚訝的合作伙伴關(guān)系,為高端筆記本電腦制造芯片,這些電腦將英特爾的中央處理器與超微半導(dǎo)體的GPU相結(jié)合。谷歌已經(jīng)利用其專用于機(jī)器學(xué)習(xí)的自有張量處理單元(Tensor Processing Unit)芯片服務(wù)在云方面抓住了時(shí)機(jī)。
盡管如此,Buck還是指出,由于機(jī)器學(xué)習(xí)的發(fā)展還處于很早的階段,而且新模型也在不斷涌現(xiàn),“有一個(gè)可編程的程序來(lái)處理這些問(wèn)題是非常重要的”。Moor Insights & Strategy的高性能計(jì)算和深度學(xué)習(xí)的咨詢負(fù)責(zé)人Karl Freund稱:到目前為止,他是對(duì)的。
Freund說(shuō):“我不認(rèn)為有任何競(jìng)爭(zhēng)對(duì)手此時(shí)會(huì)產(chǎn)生任何有意義的影響力。這可能會(huì)發(fā)生改變,但與英偉達(dá)相比,迄今為止他們所付出所有努力都顯得徒勞無(wú)功。”
機(jī)器學(xué)習(xí)的發(fā)展并沒(méi)有明顯的減速。Global Equities Research的分析師Trip Chowdhry表示:“深度機(jī)器學(xué)習(xí)是所有企業(yè)應(yīng)用和所有消費(fèi)應(yīng)用的前沿地帶,因此對(duì)英偉達(dá)的GPU的投資是不會(huì)那么快消停的。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。