隨著英偉達(dá)不斷推出Tesla V100 GPU產(chǎn)品,多家知名服務(wù)器制造商業(yè)推出相應(yīng)搭載的企業(yè)級(jí)服務(wù)器。但出現(xiàn)的一個(gè)很大的問題是,隨著企業(yè)越來越多轉(zhuǎn)向云,這些為機(jī)器學(xué)習(xí)而設(shè)計(jì)的服務(wù)器真的可以阻止企業(yè)服務(wù)器業(yè)務(wù)的下滑嗎?最近推出用于IoT的硬化工業(yè)服務(wù)器可能都在表達(dá)一個(gè)信息:服務(wù)器制造商正在尋求在垂直市場(chǎng)的增長突破。
將企業(yè)工作負(fù)載轉(zhuǎn)移到亞馬遜、谷歌、IBM和其他托管基礎(chǔ)設(shè)施方面是可以理解的,按需資源的可伸縮性、云規(guī)模的運(yùn)營效率和安全性是其中的三個(gè)原因。例如,谷歌有90名工程師正在進(jìn)行的是大多數(shù)企業(yè)人員不足的安全防范工作。
上個(gè)季度,除戴爾外,每個(gè)企業(yè)服務(wù)器公司的收入都有所下降。服務(wù)器業(yè)務(wù)正在增長,卻不在企業(yè)級(jí)領(lǐng)域。云供應(yīng)商并沒有購買太多,相反,他們購買了根據(jù)其規(guī)范構(gòu)建的組件,并為其龐大的24X7工作負(fù)載優(yōu)化了基礎(chǔ)架構(gòu)。谷歌、Facebook、IBM和其他云服務(wù)商,通過由Facebook創(chuàng)建的開放計(jì)算項(xiàng)目開展工程并指定新的硬件組件。這意味著云供應(yīng)商將直接從服務(wù)器廠商的供應(yīng)鏈購買。前幾季度的下降表明,這將會(huì)是一個(gè)難以扭轉(zhuǎn)的長期趨勢(shì)。
企業(yè)級(jí)機(jī)器學(xué)習(xí)市場(chǎng)還很年輕,但是這些服務(wù)器的利潤將會(huì)很高。為企業(yè)創(chuàng)新者的機(jī)器學(xué)習(xí)工作負(fù)載提供經(jīng)GPU優(yōu)化的服務(wù)器將是有利可圖的。隨著行業(yè)的成熟,及早獲得市場(chǎng)份額對(duì)企業(yè)來說很重要。
英偉達(dá)與英特爾
英偉達(dá)是機(jī)器學(xué)習(xí)和人工智能界的英特爾。在英偉達(dá)的Volta架構(gòu)上,還借鑒了英特爾的劇本。英特爾在PC和服務(wù)器平臺(tái)獲得了主導(dǎo)地位,通過為其他組件生產(chǎn)商如內(nèi)存、硬盤開放標(biāo)準(zhǔn)接口,為系統(tǒng)制造商如戴爾、聯(lián)想提供參考規(guī)范,以及為許多小型制造商設(shè)計(jì)系統(tǒng)幫助其優(yōu)化PC和服務(wù)器的性能及價(jià)格。
看看Volta架構(gòu)白皮書,英偉達(dá)與英特爾采取的方法十分相似,但是有一個(gè)不同的用例:神經(jīng)網(wǎng)絡(luò)。用神經(jīng)網(wǎng)絡(luò)應(yīng)用計(jì)算資源來解決具有非常大矩陣的機(jī)器學(xué)習(xí)線性代數(shù)問題,迭代以做出準(zhǔn)確的統(tǒng)計(jì)決策。神經(jīng)網(wǎng)絡(luò)是計(jì)算密集型的,因?yàn)樗鼈冃枰啻胃聰?shù)百萬個(gè)參數(shù),以最小化誤差并產(chǎn)生準(zhǔn)確的模型。這些更新基本上是大型矩陣乘法運(yùn)算。
雖然有許多不同類型的機(jī)器學(xué)習(xí)和AI,但是大多數(shù)應(yīng)用機(jī)器學(xué)習(xí)是受到監(jiān)督的。監(jiān)督意味著用標(biāo)記的數(shù)據(jù)集來訓(xùn)練機(jī)器學(xué)習(xí)模型。
機(jī)器學(xué)習(xí)是一種實(shí)證科學(xué)。工程師需要多次迭代才能學(xué)習(xí)如何訓(xùn)練神經(jīng)網(wǎng)絡(luò)來了解一個(gè)新的用例。即使是最有經(jīng)驗(yàn)的機(jī)器學(xué)習(xí)專家也不能肯定地說,到底需要多少的矢量來訓(xùn)練一個(gè)模型。這意味著大量的實(shí)驗(yàn)可以為新的用例創(chuàng)建一個(gè)模型,然后再進(jìn)行優(yōu)化以適應(yīng)具有ROI的計(jì)算預(yù)算。
如今,大多數(shù)機(jī)器學(xué)習(xí)模式,都是從自然語言或圖像識(shí)別等學(xué)術(shù)界開始,由谷歌、Facebook、IBM和微軟的大型精湛的研究人員和工程團(tuán)隊(duì)進(jìn)一步研究。但這些問題與企業(yè)的用例、搜索排名、圖像和對(duì)象識(shí)別等相匹配,這些問題常常是開源的,可供企業(yè)使用,但可能不適用于企業(yè)用例。企業(yè)機(jī)器學(xué)習(xí)專家和數(shù)據(jù)科學(xué)家將不得不從頭開始研究,并迭代構(gòu)建新的高精度模型。
英偉達(dá)的Volta架構(gòu)
Volta架構(gòu)包括許多在超級(jí)計(jì)算機(jī)中使用的特性,用于加速計(jì)算并優(yōu)化以前的CPU和現(xiàn)在的GPU、內(nèi)存和互連帶寬。
·Volta架構(gòu)使用流式多處理器進(jìn)行深度學(xué)習(xí),以混合計(jì)算和尋址計(jì)算進(jìn)行優(yōu)化調(diào)整,并行處理通過并行線程之間的細(xì)粒度同步和協(xié)作得到改進(jìn)。連接的L1數(shù)據(jù)緩存和共享內(nèi)存可以顯著提高性能并簡化編程。
·它具有更高帶寬實(shí)現(xiàn)高速互連。多GPU系統(tǒng)之間的更多連接增加了可擴(kuò)展性和并行性。
·內(nèi)存子系統(tǒng)使用三星HBM2內(nèi)存快速存儲(chǔ)器提供900 GB /秒的峰值內(nèi)存帶寬,可以使用高達(dá)95%的內(nèi)存帶寬利用率運(yùn)行許多工作負(fù)載。
·多進(jìn)程服務(wù)提高了共享GPU的多個(gè)計(jì)算應(yīng)用程序的性能、隔離性和服務(wù)質(zhì)量。在多GPU應(yīng)用程序中,獲取接近GPU的數(shù)據(jù)執(zhí)行指令的速度性能。統(tǒng)一的內(nèi)存和地址轉(zhuǎn)換服務(wù)將內(nèi)存頁面遷移到最頻繁訪問它們的處理器,從而提高處理器之間共享的內(nèi)存范圍的效率。
英偉達(dá)已經(jīng)為其企業(yè)服務(wù)器合作伙伴設(shè)計(jì)了一個(gè)架構(gòu),用于向致力于機(jī)器學(xué)習(xí)的企業(yè)銷售服務(wù)器產(chǎn)品。這是一個(gè)特殊業(yè)務(wù),因?yàn)槠髽I(yè)需要四種特性:大量的培訓(xùn)數(shù)據(jù),高技能的數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)專家,機(jī)器學(xué)習(xí)可以解決的一個(gè)戰(zhàn)略問題,以及不使用云服務(wù)的理由。