天河一號(hào)A三種形式CPU的分工

責(zé)任編輯:editor003

2013-01-23 16:56:05

摘自:pconline

前不久,筆者在國(guó)家超級(jí)計(jì)算天津中心參觀了天河一號(hào)A,異構(gòu)融合結(jié)構(gòu)、自主知識(shí)產(chǎn)權(quán)CPU等產(chǎn)品、高新尖應(yīng)用等都給筆者留下了深刻的印象。

前不久,筆者在國(guó)家超級(jí)計(jì)算天津中心參觀了天河一號(hào)A,異構(gòu)融合結(jié)構(gòu)、自主知識(shí)產(chǎn)權(quán)CPU等產(chǎn)品、高新尖應(yīng)用等都給筆者留下了深刻的印象。在參觀之后,筆者與國(guó)家超級(jí)計(jì)算天津中心劉光明主任和NVIDIA(英偉達(dá))公司PSG全球副總裁Shanker Trivedi等進(jìn)行了深入的交流,不僅了解了我們國(guó)家在超級(jí)計(jì)算機(jī)領(lǐng)域的最新動(dòng)向,對(duì)CPU和GPU異構(gòu)融合結(jié)構(gòu)也有了更深的理解。

專訪
國(guó)家超級(jí)計(jì)算天津中心劉光明主任
與NVIDIA公司PSG全球副總裁Shanker Trivedi先生接受專訪

天河一號(hào)A三種形式CPU的分工

相對(duì)于傳統(tǒng)的超級(jí)計(jì)算機(jī),天河一號(hào)A采用了三種形式的CPU,分別是Intel處理器,還有NVIDIA(英偉達(dá))Tesla,還有自主研發(fā)的飛騰1000,那么這三種不同架構(gòu)的CPU又是如何進(jìn)行分工協(xié)作的呢?

對(duì)此國(guó)家超級(jí)計(jì)算天津中心劉光明主任解釋道,國(guó)際上千萬(wàn)億級(jí)計(jì)算機(jī),或者更高級(jí)別的計(jì)算機(jī),用通用CPU計(jì)算機(jī)去做的話因?yàn)橐?guī)模大,功耗大,而且使用起來(lái)不一定很好。包括IBM曾承擔(dān)了一個(gè)美國(guó)計(jì)算機(jī)的研究項(xiàng)目,完全都是通用CPU的方法去構(gòu)建最快計(jì)算機(jī),結(jié)果這個(gè)項(xiàng)目流產(chǎn)了,就是因?yàn)檠兄瀑M(fèi)用很高,做出的機(jī)器占地規(guī)模大,功耗也比較大。

天河一號(hào)


中國(guó)“天河一號(hào)A”

在2005年到2007年間,國(guó)防科技大學(xué)便在研究通用CPU和GPU加速器的結(jié)合,來(lái)提高超級(jí)計(jì)算機(jī)的計(jì)算性能,比如流體力學(xué)、氣動(dòng)力學(xué)、FFT、CFD的東西,包括還有很多算法都適合這種結(jié)構(gòu),解決很多復(fù)雜的數(shù)學(xué)問(wèn)題,這種結(jié)構(gòu)是適用的。在2009年做天河一號(hào)第一期的時(shí)候,選用了AMD的GPU來(lái)替代當(dāng)時(shí)國(guó)防科技大學(xué)自己研究的流處理器,這樣就誕生了當(dāng)時(shí)的天河一號(hào)。后來(lái)英偉達(dá)推出了Tesla 2050,因?yàn)锳MD的GPU沒(méi)有ECC校驗(yàn),而Tesla有ECC校驗(yàn),所以在2010年的時(shí)候,天河一號(hào)A進(jìn)行了升級(jí),GPU換成了NVIDIA的。同時(shí)高速互聯(lián)系統(tǒng)換成自主研發(fā)的產(chǎn)品。

在目前天河一號(hào)A中,整體系統(tǒng)分為兩部分,一部分是Intel CPU和NVIDIA GPU構(gòu)成的新系統(tǒng),這個(gè)系統(tǒng)在整個(gè)所有天河系統(tǒng)的7/8,另外1/8的部分用的是自主研發(fā)的CPU 飛騰1000。天河一號(hào)A的系統(tǒng)是經(jīng)過(guò)實(shí)驗(yàn)優(yōu)化的環(huán)境,有很多科技計(jì)算的程序、應(yīng)用都在此做測(cè)試實(shí)驗(yàn),還有一些應(yīng)用在不斷的調(diào)試,測(cè)試,完善。

英偉達(dá)在HPC方面的規(guī)劃

其實(shí)不光天河一號(hào)A,目前全世界500強(qiáng)的計(jì)算機(jī)大概有十分之一采用了NVIDIA(英偉達(dá))的加速卡,那么未來(lái)NVIDIA(英偉達(dá))在這方面有什么計(jì)劃?

GPU運(yùn)算結(jié)點(diǎn)


GPU運(yùn)算結(jié)點(diǎn)

對(duì)此NVIDIA(英偉達(dá))公司PSG全球副總裁Shanker Trivedi先生介紹到,天河一號(hào)A已經(jīng)向全世界證明了異構(gòu)超級(jí)計(jì)算是一個(gè)非常好的科學(xué)計(jì)算。未來(lái)比如美國(guó)的高性能超算中心、德國(guó)的超算中心等均將采用GPU加速并行計(jì)算的體系結(jié)構(gòu)。在傳統(tǒng)超級(jí)計(jì)算機(jī)中,CPU只貢獻(xiàn)了整個(gè)高性能計(jì)算的10%甚至更少的份額,GPU貢獻(xiàn)80%,90%的份額,很多計(jì)算性能是從GPU貢獻(xiàn)出來(lái)的。

另外,NVIDIA(英偉達(dá))已經(jīng)有了300個(gè)以上應(yīng)用軟件,大量的應(yīng)用軟件,解決科學(xué)問(wèn)題的工具已經(jīng)可以在CPU+GPU這樣的異構(gòu)體系上運(yùn)行。通過(guò)新的異構(gòu)計(jì)算加速的方式,為未來(lái)大大的節(jié)省超算中心構(gòu)建的成本,同時(shí)節(jié)省功耗,降低能源功耗,節(jié)省費(fèi)用。

NVIDIA表示了未來(lái)會(huì)把基于Kepler方面的應(yīng)用推到成千上萬(wàn)個(gè)應(yīng)用,那么NVIDIA在推動(dòng)異構(gòu)編程方面未來(lái)重點(diǎn)的方向是什么呢?天津超算中心又有哪些關(guān)于異構(gòu)編程和應(yīng)用這方面的經(jīng)驗(yàn)?zāi)兀?/p>

對(duì)此NVIDIA公司PSG全球副總裁Shanker Trivedi介紹到一般是三種方法來(lái)做這種異構(gòu)上的編程:第一類是存在了很多年的,甚至幾十年的應(yīng)用,對(duì)于這樣一類應(yīng)用,我們建議采用一種直接編程的方法,編程的標(biāo)準(zhǔn)在OpenACC。OpenACC是一個(gè)國(guó)際標(biāo)準(zhǔn),這是開(kāi)放的,很多人都可以采用的標(biāo)準(zhǔn)的編譯的方法,這種方法可以使得傳統(tǒng)的,存在這么久的軟件可以最小的改動(dòng),因?yàn)閷?xiě)這個(gè)程序的人有可能都不在了,可以以最快的方法編到GPU和CPU上,異構(gòu)的平臺(tái)上進(jìn)行計(jì)算,同時(shí)加速。舉一個(gè)例子,在美國(guó)的能源實(shí)驗(yàn)室里,他們有一個(gè)很大的應(yīng)用,這個(gè)軟件應(yīng)用叫S3D,類似像核聚變這樣的應(yīng)用,這個(gè)程序有100萬(wàn)行的程序,只改了400行,只改了非常非常小的程序量,大約只有萬(wàn)分之四,通過(guò)編譯器編譯,得到了六倍速度的提升。

第二種類是新的應(yīng)用,建議用CUDA GPU并行編程的方法,這個(gè)架構(gòu)模型可能大家都熟悉,CUDA可能大家都熟悉,實(shí)際上就是把傳統(tǒng)的C語(yǔ)言,類似其他的高性能通用編程語(yǔ)言進(jìn)行一點(diǎn)點(diǎn)擴(kuò)展,只是稍微做了一些語(yǔ)法方法的擴(kuò)展,大家寫(xiě)程序的方法不變,這樣重新寫(xiě)出來(lái)的程序效率可以大大的提升,可以在這個(gè)程序上跑。什么樣的程序多了呢?像信號(hào)處理,圖象處理,還有一些科技計(jì)算,用這樣的方法來(lái)提升計(jì)算的效率。

最后一種方法是用一些很多科研機(jī)構(gòu)庫(kù)函數(shù)的方法,NVIDIA提供了很多系統(tǒng)級(jí)的庫(kù)函數(shù),還有很多是大學(xué)、科研機(jī)構(gòu),還有網(wǎng)上做了很到的庫(kù)函數(shù)。舉一個(gè)例子,一些很傳統(tǒng)的中間件,你調(diào)他的庫(kù)函數(shù)的話,用這樣的方法來(lái)提升,他們那些函數(shù)已經(jīng)是GPU上的,寫(xiě)程序的人并不用關(guān)心他們是怎么實(shí)現(xiàn)的,只是調(diào)用這些名稱和函數(shù)來(lái)做就好了。

總而言之,就是對(duì)于長(zhǎng)期存在已有的程序,NVIDIA推薦用OpenACC,但是對(duì)于新程序,或者對(duì)性能有追求,一定要求特別高性能的可以用CUDA來(lái)進(jìn)行改寫(xiě),對(duì)于其他一些傳統(tǒng)的,比較規(guī)范的程序,調(diào)用大量函數(shù)的,可以用調(diào)用庫(kù)函數(shù)的方法來(lái)做。

國(guó)家超級(jí)計(jì)算天津中心劉光明主任則道,天河一號(hào)A這種異構(gòu)結(jié)構(gòu)幾個(gè)典型的應(yīng)用還是應(yīng)用得不錯(cuò)的。比如在典型的石油勘探數(shù)據(jù)處理,經(jīng)過(guò)天河一號(hào)A,已經(jīng)完成了具有自主知識(shí)產(chǎn)權(quán)的石油三維歷史偏移。這個(gè)軟件過(guò)去是掌握在國(guó)外人手上,國(guó)外公司手上,對(duì)于我們來(lái)講是高價(jià)政策。我們現(xiàn)在通過(guò)天河一號(hào)A,從2011年年初開(kāi)始,跟東方物探進(jìn)行合作,持續(xù)做了兩年的時(shí)間,整體性能從通用CPU的版本上升到CPU+GPU的版本,整體性能提升了大概六倍。同時(shí)我們?cè)谶@個(gè)基礎(chǔ)上又做了一個(gè)基于計(jì)算系統(tǒng)做的優(yōu)化,磁盤(pán)的數(shù)據(jù)處理系統(tǒng)變成一個(gè)基于內(nèi)存的。另外包括現(xiàn)在的氣動(dòng)力學(xué),大飛機(jī)的仿真,說(shuō)得更通俗一點(diǎn)就是數(shù)字風(fēng)洞的處理,還包括一些典型的應(yīng)用,包括還有一些源的分析等等這些,現(xiàn)在應(yīng)用都不錯(cuò)。

總結(jié):天河一號(hào)獲得世界第一之后,引起了高度關(guān)注,關(guān)于其背后的技術(shù)也吸引了大量人士的關(guān)注。國(guó)家超級(jí)計(jì)算天津中心通過(guò)和NVIDIA成立一個(gè)聯(lián)合實(shí)驗(yàn)室,對(duì)異構(gòu)在超級(jí)計(jì)算方面的發(fā)展有著重大的意義,NVIDIA也能在軟硬件方面同時(shí)提供支持。從筆者的觀察來(lái)看,在未來(lái)的超級(jí)計(jì)算機(jī)發(fā)展中,因?yàn)槟芎?、成本等方面的?yōu)勢(shì),異構(gòu)結(jié)構(gòu)將會(huì)成為未來(lái)的主流趨勢(shì),在越來(lái)越多的超算中得到應(yīng)用。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)