在剛剛結(jié)束的2011全國高性能計(jì)算學(xué)術(shù)年會(huì)(HPC China 2011)上,中國軟件行業(yè)協(xié)會(huì)數(shù)學(xué)軟件分會(huì)、國家863高性能計(jì)算機(jī)評(píng)測(cè)中心和中國計(jì)算機(jī)學(xué)會(huì)高性能計(jì)算專業(yè)委員會(huì)公布了最新一期“2011中國高性能計(jì)算機(jī)性能Top100排行榜”。我們首先來看一下排行榜今年的主要變化。
與去年相比,前十名中由國防科大研制、落戶在國家超級(jí)計(jì)算天津中心的天河一號(hào)A繼續(xù)保持第一的位置;由國家并行計(jì)算機(jī)工程技術(shù)研究中心研制,落戶在國家超級(jí)計(jì)算濟(jì)南中心的“神威藍(lán)光”超算系統(tǒng)取代了去年曙光星云的位置排名第二。第三位也是國防科大研制,安裝在國家超級(jí)計(jì)算長沙中心的天河一號(hào)A-HN。去年由曙光公司研制,落戶國家超級(jí)計(jì)算深圳中心的曙光星云系統(tǒng)排名第四。第五名之后的情形與去年相仿,變化不大。以下是Top10的排名:
雖然本次“神威藍(lán)光”沒有取得排名第一的成績,但對(duì)于國內(nèi)高性能計(jì)算領(lǐng)域來說具有非比尋常的意義:這是首臺(tái)全部采用國產(chǎn)CPU構(gòu)建的千萬億次超級(jí)計(jì)算系統(tǒng)。
中國計(jì)劃在天津、深圳、濟(jì)南建設(shè)3個(gè)國內(nèi)領(lǐng)先的超級(jí)計(jì)算系統(tǒng)研發(fā)、應(yīng)用中心。其中天津超算中心已經(jīng)裝備了排名第一的天河一號(hào),而深圳超算中心也在去年裝備了曙光研制的星云超算系統(tǒng)。如今,濟(jì)南超算中心正式掛牌,而這套由浪潮幫助山東信息通信技術(shù)研究院打造的“神威藍(lán)光”系統(tǒng)采用了MPP萬萬億次體系架構(gòu),全水冷散熱方式,并且處理器全部采用了江南計(jì)算所研發(fā)的“神威1600A”多核處理器。
中科院軟件所張?jiān)迫淌趯?duì)記者表示,中國超級(jí)計(jì)算機(jī)全自主研發(fā)具有重大意義,不論從高速網(wǎng)絡(luò)還是從國產(chǎn)化處理器在安全性和通用計(jì)算性方面已經(jīng)達(dá)到世界先進(jìn)水平。另一方面,全國產(chǎn)化的獨(dú)立自主也標(biāo)志著我國高性能計(jì)算系統(tǒng)已經(jīng)可以走出國門,向其他國家出口。
全國產(chǎn)處理器顯“神威”
“神威藍(lán)光”超算系統(tǒng)是由國家并行計(jì)算機(jī)工程技術(shù)研究中心研制,獲得科技部863計(jì)劃支持,于2010年9月開始由浪潮集團(tuán)承接該項(xiàng)目一同設(shè)計(jì)和建造而成的。該計(jì)算系統(tǒng)共計(jì)投資約6個(gè)億,建設(shè)周期2年,本次揭牌進(jìn)入Top100榜單的屬于該系統(tǒng)的第一期工程。
從公布的數(shù)據(jù)上來看,“神威藍(lán)光”超算系統(tǒng)全部采用自主設(shè)計(jì)生產(chǎn)的處理器(ShenWei processor SW1600),系統(tǒng)共8704個(gè)CPU,峰值計(jì)算性能1.07016PFlops,持續(xù)性能795.9TFlops,Linpack效率74.37%,總功耗1074KW。
該系統(tǒng)采用了8700個(gè)神威SW1600微處理器,該處理器擁有16個(gè)計(jì)算核心,主頻在975~1100MHz之間——也得益于其流水線的減少,每個(gè)處理器的計(jì)算性能可以達(dá)到124.8~140.8Gflops。據(jù)介紹,該處理器的穩(wěn)定性遠(yuǎn)勝于一般的x86集群,在Linpack測(cè)試中穩(wěn)定的跑了近9個(gè)小時(shí),一次錯(cuò)誤也沒有發(fā)生。
網(wǎng)絡(luò)方面,“神威藍(lán)光”采用了胖樹結(jié)構(gòu),節(jié)點(diǎn)間采用了來自Mellanox的QDR Infiniband網(wǎng)絡(luò),其傳輸速度高達(dá)40Gbps,MPI消息延遲則小于2us。其存儲(chǔ)系統(tǒng)的設(shè)計(jì)容量則達(dá)到了2PB,I/O理論帶寬是200GB/s,適用于可續(xù)計(jì)算、MPICC、UPC、Fortran、C++和SWCC等常規(guī)科研環(huán)境和通用編程語言的程序。
此外,由于神威SW1600處理器的低功耗,該系統(tǒng)每個(gè)機(jī)柜擁有1024顆CPU,結(jié)合多種節(jié)能技術(shù)和水冷技術(shù)其能效比達(dá)到了741.06MFlops/W。據(jù)了解,“神威藍(lán)光”的冷卻用水是內(nèi)部封閉循環(huán),并且是來自礦泉水廠處理過的純水。該技術(shù)與以往的水冷技術(shù)相比,由于是內(nèi)部循環(huán),因此節(jié)約了大量的水消耗和風(fēng)冷消耗。
另一個(gè)亮點(diǎn)在于“神威藍(lán)光”基于預(yù)警和數(shù)據(jù)挖掘的前瞻式主動(dòng)容錯(cuò)技術(shù),該技術(shù)大大提升了該系統(tǒng)的穩(wěn)定性和可靠性。而基于虛擬化的資源池結(jié)構(gòu)支持在線遷移功能,也大大方便了作業(yè)任務(wù)調(diào)度。
以下是“神威藍(lán)光”和“天河一號(hào)”以及“星云”系統(tǒng)的比較