數(shù)據(jù)中心增長(zhǎng)放緩 英偉達(dá)的輝煌即將成為過去式?

責(zé)任編輯:zsheng

2019-02-19 10:19:04

摘自:新浪新聞

NVIDIA 已成為科技行業(yè)最熱門的公司之一。其圖形處理單元(GPU)使計(jì)算效率更高,導(dǎo)致其庫存在過去三年中飆升超過500%。

NVIDIA 已成為科技行業(yè)最熱門的公司之一。其圖形處理單元(GPU)使計(jì)算效率更高,導(dǎo)致其庫存在過去三年中飆升超過500%。

我一直是NVIDIA的粉絲。我在2015年訪問了公司總部,多年來一直是股東,賺了不少錢。

但最近幾個(gè)月NVIDIA遭到抨擊,分析師們對(duì)其增長(zhǎng)的來源存在分歧。該公司已經(jīng)在消費(fèi)者游戲領(lǐng)域占據(jù)主導(dǎo)地位,因此它現(xiàn)在將數(shù)據(jù)中心視為擴(kuò)大收入的關(guān)鍵市場(chǎng)??春糜ミ_(dá)的人士把英偉達(dá)58%的數(shù)據(jù)中心收入增長(zhǎng)視為一個(gè)跡象,表明該公司正在穩(wěn)步前進(jìn)。

我對(duì)此仍然持懷疑態(tài)度。我不同意,數(shù)據(jù)中心真正的問題,特別是那些最大的云供應(yīng)商像 Amazon.com,其亞馬遜(1607.95, -14.70, -0.91%)網(wǎng)絡(luò)服務(wù)(AWS)的企業(yè),或 谷歌(1113.65, -8.02, -0.71%) 與 Google云端平臺(tái)。

但我越來越清楚GPU 并不適合數(shù)據(jù)中心。我相信NVIDIA的未來將與過去看起來大不相同,這對(duì)投資者來說并不是一個(gè)好消息。

“望著云端”

為了設(shè)置場(chǎng)景,大型云計(jì)算供應(yīng)商的龐大數(shù)據(jù)中心 確實(shí)是硬件供應(yīng)商的圣杯。世界各地有許多地方,每個(gè)地點(diǎn)都在管理大量的數(shù)據(jù)。NVIDIA的勝利可能會(huì)帶來巨大的未來GPU銷售。

但云端巨頭對(duì)其工作流程有著獨(dú)特的需求。而這些需求往往與GPU的優(yōu)勢(shì)并不完全一致。

例如,亞馬遜正在設(shè)計(jì)自己的芯片,以使其Echo設(shè)備 對(duì)聲音提示更具響應(yīng)性。對(duì)于此應(yīng)用程序,延遲(Alexa理解和響應(yīng)所需的速度)非常重要。谷歌也正在設(shè)計(jì)自己的芯片,以降低其數(shù)據(jù)中心的功耗。這里,每瓦功耗所執(zhí)行的操作次數(shù)非常重要。這些應(yīng)用程序都不需要圖像或視頻識(shí)別。

軟件應(yīng)用程序的底層代碼也在不斷變化,機(jī)器學(xué)習(xí)算法不斷被重新訓(xùn)練。Alexa可能最初根據(jù)牛津英語詞典教英語 ,但最終接受再培訓(xùn)以認(rèn)識(shí)到“殺死那次采訪”是一件好事而不是殺人罪。

現(xiàn)在,將每個(gè)軟件的特定需求和不斷變化的代碼相乘,成千上萬的其他客戶,每個(gè)客戶都從Amazon Web Services和Google Cloud Platform等云提供商那里租用存儲(chǔ),處理和“機(jī)器學(xué)習(xí)即服務(wù)”。事情很快變得非常復(fù)雜。

值得稱道的是,NVIDIA已盡其所能為客戶的問題找到解決方案。它采用優(yōu)化器將其客戶試圖完成的邏輯與最能夠?qū)崿F(xiàn)這些目標(biāo)的GPU硬件產(chǎn)品相匹配。 TensorRT 就是一個(gè)例子,它可以配置NVIDIA的GPU來運(yùn)行某些數(shù)據(jù)中心應(yīng)用程序。

但合身永遠(yuǎn)不會(huì)完美。

公司不得不接受他們的軟件在某種程度上強(qiáng)制適應(yīng)NVIDIA的可用硬件模型及其相關(guān)功能。最終用戶不知道NVIDIA的優(yōu)化器在幕后實(shí)際抽象了什么架構(gòu)。他們只知道GPU 在處理他們的需求方面明顯 優(yōu)于CPU。這正是我們近年來看到GPU大幅增長(zhǎng)的原因。

這就是NVIDIA的問題所在。GPU不是可以處理所有數(shù)據(jù)中心復(fù)雜性的神奇解決方案。每次將應(yīng)用程序強(qiáng)制擬合到GPU時(shí)都會(huì)產(chǎn)生效率低下的問題。事情變得越來越復(fù)雜。

擁有雄厚資金的大公司已經(jīng)在設(shè)計(jì)自己的專用集成電路來優(yōu)化個(gè)別任務(wù)。但即使是那些沒有數(shù)十億美元和專門研究團(tuán)隊(duì)的人,也開始出現(xiàn)解決方案。

如果有可以編程然后重新編程的芯片,總能完美匹配你想要的軟件做什么呢?

FPGA

這些芯片確實(shí)存在,它們被稱為現(xiàn)場(chǎng)可編程門陣列(FPGA)?,F(xiàn)場(chǎng)可編程芯片可以不斷改變其邏輯,這意味著它們可以適應(yīng)不斷變化的軟件需求。

這使得它們與其他基于指令的芯片(如CPU或GPU)區(qū)別開來,但這種區(qū)別在歷史上并沒有真正重要。傳統(tǒng)上,計(jì)算只是使用CPU完成的,無論如何,每18個(gè)月的性能效率提高一倍。然后GPU發(fā)現(xiàn)了一種更有效的改進(jìn)CPU的方法。

但是,這一點(diǎn)差異化在今天非常重要。人工智能(AI)是一種變幻無常的野獸,它對(duì)AI算法的不斷訓(xùn)練使得CPU和GPU難以跟上。就像Alexa一樣,延遲對(duì)于任何需要瞬間響應(yīng)時(shí)間的應(yīng)用程序變得越來越重要 。低效率正變得越來越不容忍。

FPGA的可編程方面可以完全消除這些低效率。通過在軟件模型和硬件之間抽象層 - 技術(shù)人員的“模型優(yōu)化器庫” - 理論上,使用FPGA的生態(tài)系統(tǒng)可以完美地運(yùn)行每個(gè)應(yīng)用程序 。 FPGA即服務(wù) 可能就像 類固醇上的 CUDA一樣 :經(jīng)過微調(diào)以匹配特定算法的硬件,而不是使用NVIDIA的GPU中最接近的匹配。FPGA可以進(jìn)行優(yōu)化,然后隨著時(shí)間的推移重新優(yōu)化,這在代碼和邏輯發(fā)生變化時(shí)很方便。

FPGA并不是每個(gè)人的答案。它們的前期成本高于CPU和GPU。他們需要花費(fèi)大量時(shí)間進(jìn)行編程,這需要由經(jīng)驗(yàn)豐富的工程師完成。

但這些因素并不像云供應(yīng)商那樣令人擔(dān)憂。他們可以使用IT人才,并可以承擔(dān)高額的前期成本。他們獲得的好處是降低了數(shù)據(jù)中心的總體電力成本,他們可以將這些成本作為更具競(jìng)爭(zhēng)力的價(jià)格傳遞給租用處理和存儲(chǔ)的客戶。

對(duì)于FPGA來說,這是正確的市場(chǎng),現(xiàn)在正是適當(dāng)?shù)臅r(shí)機(jī)。而這正是最大的云服務(wù)提供商,包括AWS,微軟(108.22, 1.32, 1.23%) , 阿里巴巴(166.15, -2.23, -1.32%) 和 百度(170.06, -4.02, -2.31%) ,正在全球快速部署它們的原因。我相信英偉達(dá)在數(shù)據(jù)中心的增長(zhǎng)速度將會(huì)放緩,它最輝煌的日子可能已經(jīng)過去了。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)