AMD公司即將制造新型微處理器,旨在將其現(xiàn)有CPU及GPU組件以前所未有的智能化方式連接在一起。
即將面世的新型芯片將采用AMD公司名為“異構(gòu)隊(duì)列(hQ,Heterogeneous Queuing)”的技術(shù)。這種全新方案將GPU放在與CPU對(duì)等的地位之上——換言之,圖形引擎將不再需要坐等中央處理器為其下達(dá)執(zhí)行指示。
目前,CPU正單獨(dú)負(fù)責(zé)應(yīng)用程序任務(wù),將處理工作由作業(yè)調(diào)度隊(duì)列分配至用戶內(nèi)存當(dāng)中。它甚至可以為自身分配處理任務(wù)——例如由一個(gè)計(jì)算核心將工作調(diào)配至另一個(gè)核心處。
GPU則不具備這樣的能力。通常情況下,它只能作為一種外圍資源受到操作系統(tǒng)以及驅(qū)動(dòng)程序的管理,這樣的方式大大增加了GPU訪問(wèn)時(shí)所產(chǎn)生的延遲。
這種處理機(jī)制主要屬于歷史遺留問(wèn)題:GPU最初是一塊通過(guò)附加板接入主系統(tǒng)總線的獨(dú)立芯片。這種模式直到今天也沒(méi)有改變——即使將GPU集成到CPU之中甚至與CPU處于同一晶圓模塊之內(nèi),其基本原理仍然如故。
AMD的新方案,同時(shí)也是其最新工作成果“異構(gòu)系統(tǒng)架構(gòu)”(HSA,Heterogenous System Architecture)則為GPU帶來(lái)與CPU完全一致的內(nèi)存訪問(wèn)與工作管理能力。
如此一來(lái),一塊hQ GPU就能夠監(jiān)控任務(wù)隊(duì)列從而接受并調(diào)度任務(wù)——其作用對(duì)象同樣涵蓋自身與CPU。與GPU相協(xié)作的應(yīng)用程序只需將工作細(xì)節(jié)加以整理,然后將結(jié)果添加到GPU處于用戶內(nèi)存當(dāng)中的調(diào)度隊(duì)列即可。內(nèi)核級(jí)別的驅(qū)動(dòng)程序通道將徹底被淘汰,與其一同消亡的還有因此產(chǎn)生的現(xiàn)有延遲狀況。
作為整套系統(tǒng)的心臟,處于用戶內(nèi)存中的AMD異構(gòu)統(tǒng)一內(nèi)存架構(gòu)(hUMA, Heterogenous Unified Memory Architecture)將由CPU與GPU實(shí)現(xiàn)共享。但為了實(shí)現(xiàn)設(shè)計(jì)目的,AMD特地打造了一種能夠被全部HSA兼容硬件所識(shí)別的標(biāo)準(zhǔn)化任務(wù)調(diào)度數(shù)據(jù)包格式,類似于一種標(biāo)準(zhǔn)隊(duì)列格式。應(yīng)用程序能夠直接根據(jù)這種新型數(shù)據(jù)包格式生成任務(wù),而且不必將數(shù)據(jù)包再度轉(zhuǎn)換為中間形式或者符合特定供應(yīng)商要求的形式。值得一提的是,目前的驅(qū)動(dòng)程序仍然需要執(zhí)行這一流程。
轉(zhuǎn)譯過(guò)程與副本制作任務(wù)的離去將提高性能表現(xiàn)。此外,直接訪問(wèn)用戶內(nèi)存中的任務(wù)也將迎來(lái)性能改進(jìn),這是因?yàn)轵?qū)動(dòng)程序?qū)⒉辉俦痪窒拊谑鼙Wo(hù)的內(nèi)存空間當(dāng)中,由相應(yīng)內(nèi)核模式變化所帶來(lái)的延遲亦不復(fù)存在。
讓hQ GPU脫離CPU而獨(dú)立運(yùn)行還能夠幫助后者在GPU執(zhí)行像素及多邊形渲染任務(wù)的同時(shí)進(jìn)入休眠狀態(tài),或者作為一塊大規(guī)模并行數(shù)據(jù)處理器做點(diǎn)其它工作。根據(jù)AMD公司的說(shuō)法,這樣一來(lái)hQ的優(yōu)勢(shì)將一舉從智能手機(jī)處理器領(lǐng)域躍升至數(shù)據(jù)中心芯片層面。
當(dāng)然,只有更多供應(yīng)商的支持與加盟,這套方案才真正有可能迎來(lái)發(fā)展。有鑒于此,AMD不失時(shí)機(jī)地指出,HSA數(shù)據(jù)包格式已經(jīng)受到其HSA基金會(huì)成員的支持——其中包括ARM、高通、三星、聯(lián)發(fā)科以及德州儀器等公司。
如此看來(lái),HSA兼容硬件應(yīng)該不至于發(fā)生短缺了。但應(yīng)用程序又是否會(huì)選擇這套前途未卜的新方案呢?AMD希望能夠努力將HSA嵌入至標(biāo)準(zhǔn)API當(dāng)中,例如OpenCL以及OpenCV,從而幫助開(kāi)發(fā)人員輕松從這套新方案中受益。
AMD公司高級(jí)研究員Ben Sander表示:“我們還計(jì)劃將HSA與其它主流編程模式相對(duì)接,例如Java以及Python……這將帶來(lái)更多回報(bào)。不過(guò)大家也可以直接使用此方案。雖然程序員需要為此投入一些精力與成本,但最終大家將能夠?qū)Πl(fā)送至GPU的數(shù)據(jù)包進(jìn)行全面掌控。”
AMD公司目前尚未透露hQ方案正式登陸處理器產(chǎn)品的具體時(shí)間。