日前,“SEMICON China 2017國際半導(dǎo)體展”在上海盛大開幕,“SEMICON China 2017國際半導(dǎo)體展”由國際半導(dǎo)體設(shè)備與材料協(xié)會(SEMI)和中國電子商會(CECC)共同舉辦,多家公司參加了本次盛會。
上海兆芯集成電路有限公司副總裁傅城博士在會議上公布繼開先ZX-C系列處理器之后,兆芯最新一代ZX-D系列4核和8核通用處理器目前已經(jīng)成功流片。此外,媒體還報道:在展會上業(yè)內(nèi)人士還向我們透露,兆芯將在明年(2018年)推出16nm的ZX-E 8核CPU,并公開了Fritz Chess Benchmark國際象棋性能測試的成績。而且在測試成績的圖片上還有“兆芯處理器媲美國際主流水準”的字樣。
其實,這并不是兆芯第一次宣稱其處理器媲美國際主流/國際整體水平。在“十二五”科技成果展上,兆芯官方資料宣稱:國產(chǎn)X86通用處理器的成功自主研發(fā)和量產(chǎn),令國產(chǎn)處理器在性能方面完成了一次跨越式的提升,從“十二五”初期的不足國際整體水準的10%提升到了目前的80%。
但實際上,兆芯在“十二五”科技成果展上的宣傳,和這次Fritz Chess Benchmark測試成績,以及所謂的“兆芯處理器媲美國際主流水準”是有較大水分的。
Fritz Chess Benchmark測試成績存在的問題
根據(jù)公布的Fritz Chess Benchmark國際象棋性能測試的成績,一些媒體在報道中宣稱:運行在3.0GHz頻率下的ZX-E8核心處理器性能已經(jīng)超過了AMD的FX-8370處理器,非常接近采用Skylake核心的英特爾Core i5-6600處理器,意味著國產(chǎn)處理器的性能提升了一大步。
而根據(jù)圖片中顯示,ZX-D的測試分數(shù)與Intel I3 6300相當(dāng)。圖片中的這種表達方式,很容易讓人認為ZX-D(8核版)性能與Intel I3 6300處理器相當(dāng),ZX-E與Intel i5 6600處理器性能相當(dāng),超越了AMD的FX 8370,并使宣傳圖片上所謂的“兆芯處理器媲美國際主流水準”實至名歸。
然而,這個圖表中的測試成績其實是存在一些問題的,經(jīng)不起推敲。舉例來說,Intel I5 7500的測試成績就很有問題。
眾所周知,這些年Intel雖然在降低能耗,提升核顯性能上下了不少功夫,但在CPU性能提升上就非常吝嗇了,每一代產(chǎn)品更新近乎是一點一點擠牙膏,以至于Intel被廣大網(wǎng)友冠以“牙膏廠”的美譽,而I5 6600和I5 7500理論上提高不大。Spec測試定點成績的話,CPU性能大約提高5%。而在這個兆芯公布的測試中性能提高了將近3000分。
但實際上,14000分的測試成績,即便是Intel I5 7600K也達不到這個分數(shù)。根據(jù)第三方測試,Intel I5 7600K的測試成績?yōu)?2000+分,而主頻更低的Intel I5 7500測試成績根本不可能比Intel I5 7600K的分數(shù)更高。
拔高國外廠商產(chǎn)品也就罷了,但發(fā)布錯誤的測試成績,壓低國外廠商的產(chǎn)品測試分數(shù),來抬高自己,這種做法就非常值得商榷了。
Intel I3 6300的測試成績存在略顯偏低的情況,實測I3 6100都有將近7800分,與圖表中公布的Intel I3 6300的測試結(jié)果相當(dāng),而Intel I3 6300比Intel I3 6100主頻更高一些,測試的成績也應(yīng)當(dāng)會高一些。如果說I3 6300的分數(shù)偏差還可以用測試誤差來解釋,那FX 8370的成績就有點匪夷所思了。
AMD FX 8370的測試成績有很大問題,兆芯提供的圖表中,F(xiàn)X8370的成績只有9000多分,但這個分數(shù)大約只和FX 6350差不多。FX 8370的分數(shù)要比兆芯公布的成績高很多。
根據(jù)網(wǎng)絡(luò)公布的測試,F(xiàn)X 8350的國際象棋分數(shù)就已經(jīng)達到12000分左右了,F(xiàn)X 8370的測試成績只會比FX 8350分數(shù)高,有的測試中跑出了12751,還的測試甚至跑出了13546分的成績(這個成績可能是超頻下取得的)。而在兆芯提供的圖表中,F(xiàn)X8370的成績只有9300多分,明顯少了3000多分。由于偏差幅度實在是太大,這已經(jīng)不能用測試誤差來自圓其說了。
必須要說的是,這里給ZX-D和ZX-E作為參照的CPU中,還有并未在中國大陸開售的。比如AMD的Zen,圖表中的四核的Zen中國大陸目前還買不到,也就無法去證實其實際性能。在圖表中一些測試數(shù)據(jù)存在明顯問題的情況下,挑出一些跑象棋測試明顯吃虧的CPU(比如雙核的G4500,原因下文會介紹),或者目前中國大陸還買不到的CPU(四核Zen),或者故意大幅壓低作為直接對比的fx 8370的測試成績來做參照,很容易使人產(chǎn)生一些聯(lián)想。
特別是一些媒體根據(jù)圖表報道的結(jié)論,“運行在3.0GHz頻率下的ZX-E8核心處理器性能已經(jīng)超過了AMD的FX-8370處理器”,這完全是將FX 8370處理器的測試成績壓低3000多分的前提下,得出的結(jié)論。
Fritz Chess Benchmark測試并不能說明全面問題
首先要說明的是,F(xiàn)ritz Chess Benchmark測試并不說明全面問題。Fritz Chess Benchmark測試的是多線程,核心數(shù)越高,測試成績就越好。象棋剛出現(xiàn)的時候確實是重要的cpu測試軟件,主要考驗cpu分支預(yù)測效率的高低,缺點就是流水線流不起來,不體現(xiàn)cpu絕對性能的好壞。但隨著技術(shù)的進步,分支預(yù)測效率都達到了頂峰,Intel、IBM、AMD這些國際大廠在分支預(yù)測上大多不相伯仲。所以只要核數(shù)主頻類似,緩存性能差不多,哪怕微結(jié)構(gòu)和制程有差距,象棋分數(shù)也都差不多,衡量價值就變小了。
據(jù)多位有十年以上工作資歷的工程師表示:這個測試程序?qū)儆诜种芗统绦?,源代碼是不斷地判斷,全是if else嵌套多達5-6層,碰到分支密集型程序,分支預(yù)測器猜不準的情況下,流水線就會不斷中斷,再好的設(shè)計都沒有用了。
換言之,就是碰到分支密集型程序基本上哪個處理器都做不好,也就是說,這個測試中流水線會流不起來,在用強弱CPU做對比的時候,會縮小不同CPU之間的性能差距,抹殺部分Intel、AMD這樣國際大廠產(chǎn)品的性能優(yōu)勢。
所以性能比較要全面,拿各種各樣的測試程序來綜合測試,反應(yīng)各種模塊的性能。SPEC2000/2006要測試20多個程序,而且覆蓋廣泛,代表性強,是比較權(quán)威的測試。像spec cpu2006測試的26個程序就基本上能說明問題。不僅Intel、ARM這樣的國際巨頭會有SPEC測試成績,國內(nèi)龍芯、申威、飛騰都會公開CPU的SPEC2000/2006測試成績,并說明使用的編譯器、操作系統(tǒng)等測試環(huán)境。
比如之前被認為裸CPU性能可以匹敵Intel E5的飛騰2000,即便飛騰有國防科大這樣的特殊背景,但也不避諱公布SPEC測試成績,其SPEC測試成績也非常亮眼:
在2GHz主頻下,采用GCC4.8編譯器,SPEC2000和SPEC2006的測試成績分別為:
SPECint_base2000:1610 SPECint_base2006:12.4
SPECfp_base2000:1589 SPECfp_base2006:11.3
SPECint_rate2000:690 SPECint_rate2006:570
SPECfp_rate2000:615 SPECfp_rate2006:482
正是如此亮眼的成績,使得飛騰2000贏得了谷歌、百度等大公司的青睞,飛騰也成為國內(nèi)ARM服務(wù)器出貨量的領(lǐng)頭羊。
而在SPEC測試成績上,兆芯的官方網(wǎng)站上一直對此諱莫如深,因而外人也很難去評估其實際裸CPU性能。目前,比較罕見的公開資料是《面向C4350AL處理器的GCC移植與優(yōu)化》。
在該論文中,中國科學(xué)院軟件研究所對兆芯C4350AL做的SPEC2006測試,測試結(jié)果為:
SPECint_base2006:8.4
SPECfp_base2006:5.5。
下圖附帶了《面向C4350AL處理器的GCC移植與優(yōu)化》論文中所有子項的測試成績。
不過,C4350AL是兆芯早些時候的產(chǎn)品,其實就是VIA Nano的馬甲。由于在核心微結(jié)構(gòu)上一直穿馬甲——兆芯過去的做法一直是拿VIA的技術(shù)改制造工藝堆核心數(shù)量。ZX-D核心微結(jié)構(gòu)到底有多少修改還是未知數(shù)(核心微結(jié)構(gòu)到底是否改得動,有多少源代碼是VIA的陳舊代碼,有多少是國內(nèi)工程師自己新寫的,有多少是向第三方購買的?),加上沒有其他中立權(quán)威機構(gòu)做SEPC測試,并給予公開成績的情況下,也就只能用中國科學(xué)院軟件研究所測試的C4350AL的成績作為借鑒了。
作為參照,Intel I5 4460的SPECint_base2006和SPECfp_base2006的成績都在30以上,即便是Intel多年擠牙膏,性能也是有提升的,Intel最新CPU的SPEC2006測試成績只會更高。
單線程性能非常有限
而本次公布的Fritz Chess Benchmark測試,這里其實玩了一個小手段,網(wǎng)絡(luò)上公布的兆芯Fritz Chess Benchmark國際象棋性能測試成績其實是有貓膩的。Fritz Chess Benchmark顯示的是多線程性能,也就是說,如果測試的CPU核心數(shù)越多,那么,測試結(jié)果會越高。
覆蓋的指令集老舊也是Fritz Chess Benchmark測試的一個問題,而且這個測試成績僅僅測試定點成績,并不測試浮點性能。測試對核心數(shù)、主頻、緩存等因素比較敏感,比如E5 2650 v2有8核16線程和20m緩存,即便默認頻率只有2.6G,跑分依舊高達兩萬多。
但Fritz Chess Benchmark測試對很多方面的考察不足,特別是對一些單線程性能強勁,但核心數(shù)較少,或者是閹割了緩存的CPU就會存在測試成績和該CPU在實際使用中的表現(xiàn)不匹配的情況。比如圖表中作為參照,只有雙核的Intel G4500、Intel I3 6300處理器,以及圖表中緩存相對小一些的AMD A10 7890。
具體來說,ZX-E是8核CPU,而ZX-E與Intel i5 6600測試分數(shù)差距大約為10%,本質(zhì)上是8核對比4核的結(jié)果,換言之,如果就以單線程(單個CPU核)性能來說,按照網(wǎng)絡(luò)上公布的Fritz Chess Benchmark測試成績,目前還處于PPT狀態(tài)的ZX-E連Intel i5 6600的一半都不如。
同樣,8核版的ZX-D在圖表中能的數(shù)據(jù)能夠媲美Intel I3 6300處理器也是8核對比雙核的結(jié)果,雖然Intel I3 6300處理器的超線程特性會給測試帶來一定加成,但本質(zhì)上來說Intel I3 6300依舊是雙核,等于是用ZX-D 8核的成績對比Intel I3 6300雙核的成績。換言之,就是ZX-D 8核綁在一起的性能約等于Intel I3 6300雙核的性能。如果以這個象棋測試為基準,換算為單線程性能的話,ZX-D的單線程性能可謂慘不忍睹。
也許有人會說,多線程性能過得去不是也挺好?為何要執(zhí)著于單線程性能?
其實,作為桌面CPU,最重要的就是單線程性能,因為桌面平臺程序都是串行的,如果單線程性能上不去,用戶體驗會很糟糕,即便是8核、16核CPU,在單線程性能不足的情況下,實際用戶體驗很可能會反而不如雙核CPU——在使用中很有可能出現(xiàn)網(wǎng)絡(luò)上調(diào)侃的“1核有難,7核(15核)圍觀”的情況。
此外,很多應(yīng)用往往做不到8核/16核優(yōu)化,不少都是雙核優(yōu)化的,比如大量國產(chǎn)網(wǎng)絡(luò)游戲。而恰恰國產(chǎn)網(wǎng)絡(luò)游戲的用戶數(shù)量還真不少,換言之,就是面對國產(chǎn)網(wǎng)絡(luò)游戲的CPU非常有市場。如果用單線程性能有限,但卻有8個核心的CPU,比如8核版的ZX-D來運行這些雙核優(yōu)化的網(wǎng)絡(luò)游戲,用戶體驗會非常差,實際的游戲體驗反而不如之前圖表中,測試成績不如ZX-D的Intel G4500。
這也是玩國產(chǎn)網(wǎng)絡(luò)游戲,Intel I3系列CPU雖然只有雙核,但實際游戲體驗卻勝過AMD一系列6核、8核CPU的原因——這些年,AMD雖然開發(fā)出了一系列6核、8核CPU,但無論在用戶體驗上,還是在商業(yè)上,都不是Intel的雙核、四核CPU的對手,而且近乎處于被碾壓的狀態(tài)。甚至有網(wǎng)友調(diào)侃“I3默秒全”,這種說法的根源也在于Intel的CPU在單線程性能上遠遠強于其他公司的X86 CPU。
就商業(yè)上來說,AMD這些年這一大票單線程性能不行的6核、8核CPU顯然是失敗的,而兆芯CPU的單線程性能比AMD都有不小差距,ZX-D和ZX-E將來在商業(yè)市場上的前景就可想而知了,只能仰仗兆芯強悍的背景,向黨政軍推廣采購了。事實上,某地方政府一直在不遺余力推廣兆芯,下圖來自其政府采購網(wǎng)。
而AMD最新的Zen顯然是AMD總結(jié)經(jīng)驗后嘔心瀝血之作,其最大的特點就是大幅提升了單線程性能,Zen的微結(jié)構(gòu)性能已經(jīng)與Intel的Haswell相當(dāng),雖然Haswell是數(shù)年前的產(chǎn)品,但考慮到Intel這些年一直擠牙膏,Zen的性能還是很不錯的,而這也是AMD對Zen寄予厚望的原因。
因此,對于桌面CPU,單線程性能才是最重要的,單純堆核心數(shù),然后用某一個特定的、以偏概全的、非權(quán)威測試說明多線程性能接近Intel的某些CPU,而非像飛騰那樣公開SPEC2000/2006測試數(shù)據(jù),就宣稱“兆芯處理器媲美國際主流水準”,這絕非科學(xué)客觀的態(tài)度。