從去年底開始,ARM處理器一直是一個非?;馃岬脑~匯,因為根據(jù)ARM的宣傳,下一代Cortex A50處理器將不僅僅局限于移動終端領(lǐng)域布局,還要涉足服務(wù)器市場。即便是Cortex A50目前十分遙遠(yuǎn),一些基于現(xiàn)有ARM架構(gòu)的服務(wù)器似乎也呼之欲出。ARM在服務(wù)器市場能做什么?又能做到什么程度?關(guān)于ARM不但有太多內(nèi)容未公開,就算是公開的部分也還有許多疑點。本文針對ARM在服務(wù)器領(lǐng)域幾個令人看不懂的指標(biāo)進(jìn)行解讀,看看ARM是否真的有那么好。
Calxeda:測試數(shù)據(jù)不能細(xì)說
去年7月,Boston Server發(fā)布了一款A(yù)RM服務(wù)器Viridis,應(yīng)該算是行業(yè)內(nèi)比較領(lǐng)先的ARM服務(wù)器產(chǎn)品,根據(jù)資料介紹,這款服務(wù)器的功耗與X86服務(wù)器相比有巨大優(yōu)勢,同時性能也非常優(yōu)秀,作為開篇,這次就先對Viridis以及相關(guān)的一些指標(biāo)進(jìn)行解讀。
Viridis是一款基于Calxeda公司研發(fā)的ARM處理器的服務(wù)器。Calxeda公司目前推出的ARM處理器產(chǎn)品為ECX-1000,該處理器主頻為1.1GHz或者1.4GHz,基于ARMv7架構(gòu),芯片工藝為TSMC 40nm。由于是一款SoC芯片,因此處理器本身集成了DDR3內(nèi)存控制器、4條PCIE 2.0通道以及SATA3控制器。
可以說Calxeda的ECX-1000是一款比較典型的服務(wù)器SoC了,不僅是Viridis,包括惠普在內(nèi)的許多ARM服務(wù)器研發(fā)項目,都和Calxeda有合作。根據(jù)Calxeda的宣稱,這款處理器在某些性能上與X86相比有絕對優(yōu)勢,下圖就是Calxeda發(fā)布的測試數(shù)據(jù)。
根據(jù)官方的介紹,ECX-1000在AB(ApacheBench)與Xeon E3-1240相比,每瓦特性能上有高達(dá)15倍的驚人優(yōu)勢。不過拋開用AB測試CPU性能是否合適的疑點不說,單純測試本身也有一些問題沒有交代清楚。Apache是一個綜合能力比較強的web工具,綜合能力較強就意味著不同的測試環(huán)境對結(jié)果會有很大影響。比如在測試環(huán)境中使用的是靜態(tài)頁面還是動態(tài)頁面,對于ARM和XEON這種架構(gòu)差距極大的處理器來說極有可能產(chǎn)生完全相反的結(jié)果。
其他沒有介紹清楚的細(xì)節(jié)還包括Time taken for tests和Time per request兩個重要的參考數(shù)據(jù)并沒有公開;對XEON平臺的功耗存在虛標(biāo)(E3-1240的TDP為80W,跑AB這種偏重吞吐量測試根本不會出現(xiàn)滿載);相反Calxeda在公開的數(shù)據(jù)中比較強調(diào)兩者的主頻差異,但主頻的巨大差異對AB測試結(jié)果的影響并沒有特別大??傊?,在Calxeda的測試數(shù)據(jù)中,對關(guān)鍵指標(biāo)的隱瞞和夸大完全削弱了測試的可信度。
Viridis:說不清的性能和低效率的模擬器
解讀完Calxeda的ARM處理器,再回過頭來看基于該處理器的Viridis。根據(jù)已知的資料,憑借和Calxeda的合作,這款服務(wù)器實現(xiàn)了非常高的節(jié)點密度,在2U機箱內(nèi)可以部署48個處理器共計192個運算核心,而如果以機柜來算,一個42U標(biāo)準(zhǔn)機柜的處理器數(shù)量達(dá)到1008個,共有4032個運算核心。
憑借SoC芯片在面積和功耗上的優(yōu)勢,目前所有即將上市的ARM服務(wù)器都有驚人的節(jié)點密度,一個機柜內(nèi)有幾千個運算核心聽起來十分令人震驚。然而在運算性能方面,類似Linpack成績這樣的關(guān)鍵指標(biāo)卻全都只字不提,也就是說目前完全無法知道這樣的產(chǎn)品性能如何。
另一方面,Viridis的應(yīng)用也十分稀少,在宣稱支持(僅是支持,還有待優(yōu)化)Canonical Ubuntu 12.10、Red Hat Fedora 17操作系統(tǒng),以及Perl、Python、MySQL等軟件之后,Boston Server公布了一個十分令人匪夷所思的應(yīng)用方案:X86軟件模擬器!根據(jù)該公司首席開發(fā)官安納托利·康努科霍夫介紹,與運行原生ARM代碼相比,模擬器運行X86代碼的效率約為40%。Elbrus Technologies計劃明年發(fā)布模擬器公測版,2014年底模擬器運行X86代碼的效率將提高到80%。
也就是說,這款標(biāo)志性的ARM服務(wù)器最終選擇了以模擬X86的方式運行,但目前僅能發(fā)揮出它實際性能的40%,到2014年才有可能達(dá)到80%。看到這里不禁要問一問了,這還是一臺能和X86競爭ARM服務(wù)器么?