一周前美國能源部下屬的橡樹嶺國家實驗室宣布了Summit超算,20億億次的性能力壓中國神威·太湖之光,預(yù)計會成為新的TOP500冠軍。為了提升性能,Summit超算使用的是IBM Power 9處理器及NVIDIA Tesla V100加速卡,都是高性能芯片。而在另一方面,美國也沒忘了嘗試新的超算架構(gòu),能源部下屬的桑迪亞國家實驗室宣布建造ARM處理器的超算Astra,浮點性能2.3PFLOPS,比TOP500靠前的超算性能差很遠,但ARM陣營來說意義重大。
這幾年ARM處理器一直想在高性能計算市場分一杯羹,不過進展并不大,高通投入研發(fā)了10nm 24核/48核ARM處理器,主攻服務(wù)器市場,不過今年已經(jīng)裁撤大部分員工,不再大規(guī)模投資該領(lǐng)域了。但是其他陣營嘗試ARM高性能計算的努力并沒有放棄,美國能源部就推出了Vanguard(先鋒盾)計劃,主要就是評估新興的高性能計算架構(gòu)作為生產(chǎn)力平臺的可能性,Astra超算就是這個計劃中的一部分。
Astra超算將使用凱為半導(dǎo)體(Cavium )前不久才推出的ThunderX2處理器,后者基于64位ARMv8架構(gòu),根據(jù)官網(wǎng)介紹,ThunderX2處理器支持單路32核、雙路64核配置,支持每核4線程,標(biāo)準(zhǔn)頻率2.5GHz,加速頻率3GHz,支持8通道DDR4,56條PCIe通道,使用臺積電16nm工藝制造,規(guī)格很強悍。
根據(jù)桑迪亞國家實驗室的資料,Astra超算將由2592個節(jié)點組成,每個節(jié)點配備28核處理器,雙路配置,,是智能手機芯片性能的100倍。
Astra超算峰值速率將達到2.3 PFLOPS,也就是2300千萬億次,這個性能相比Summit超算的200 PFLOPS性能不過1%的水平,但在TOP500中也能排進前200位了。
使用ARM處理器做超算,一種重要目的就是降低能耗,提升能效比,桑迪亞實驗室沒有公布Astra超算的功耗數(shù)據(jù),不過比起Summit超算的13MW顯然會低得多的多。