亚洲天堂网在线播放,狼色精品人妻在线视频免费

回顧AMD模塊化架構這6年走過的路

責任編輯：editor006

2017-01-21 17:32:00

摘自：OFweek電子工程網

武林高手修煉的一定境界往往會覺得高處不勝寒，因為能跟他匹敵的對手越來越少，哪怕雙方正反立場不同，英雄豪杰也會惺惺相惜。

武林高手修煉的一定境界往往會覺得高處不勝寒，因為能跟他匹敵的對手越來越少，哪怕雙方正反立場不同，英雄豪杰也會惺惺相惜。Intel現(xiàn)在高端處理器市場上少了AMD這個對手，他們會懷念雙方你爭我奪的“美好時光”嗎？這個就只有Intel自己知道了，過去的幾年中AMD的“推土機”模塊化架構高喊著革命口號出生，但并沒有把Intel拉下馬，反倒濺了自己一身血，AMD在高性能處理器市場沉淪了將近5年了。

如果往前數(shù)10多年，AMD憑借K8“大錘”處理器也是闊過的，Intel當年在奔騰4時代被AMD“教做人”，充分體驗到了“高分低能”的感覺。但是Intel對AMD來說是巨無霸一般的存在，即便是AMD處理器叫好又叫座，Intel公司CPU一哥的地位依然無人動搖，而且他們有足夠的實力翻盤，Core處理器橫空出世之后，Intel重新逆轉了對AMD處理器的性能優(yōu)勢，在K8之后AMD推出的K10處理器遭遇了bug及制程的雙重困擾，整體表現(xiàn)要比K8平庸多了，眼睜睜看著Intel華麗轉身。

作為一家營收不足Intel公司1/10的“小公司”，AMD公司的斗志以及創(chuàng)新精神讓人敬佩，在HT總線、DDR內存、多核處理器等技術上敢為人先，而在64位X86指令集上更是讓Intel低頭認輸，直到現(xiàn)在這個勝利都是AMD最為驕傲的成績之一。因此在K10架構之后，AMD嘔心瀝血研發(fā)的”推土機“模塊化架構讓玩家產生了極大的期待，筆者當年在推土機架構前瞻一文中希望AMD能借該架構實現(xiàn)對Intel的復仇，重現(xiàn)K8的輝煌。

但是，最后的結果大家現(xiàn)在都知道了，推土機架構處理器就像是跳水運動員一樣，起點很完美，但入水時浪花太大而撲街，實際表現(xiàn)不盡如人意。這次高開低走也讓AMD心灰意冷，推土機架構在桌面市場小幅升級到第二代Piledriver打樁機架構之后就草草結束FX處理器更新，后面兩代架構只在Kaveri及Carrizo兩代APU上出現(xiàn)，桌面版到現(xiàn)在為止差不多5年沒升級了。

AMD模塊化架構推出了四代，后面兩代只用于APU

從2011年FX-8150發(fā)布到2015年Carrizo APU問世，AMD的模塊化架構一共出了Bulldozer推土機、Piledriver打樁機、Steamroller壓路機及Excavator挖掘機四代，其中前兩代用于FX及APU處理器，2012年之后AMD就不再升級FX系列的架構了（產品型號倒是有升級），Steamroller壓路機及Excavator挖掘機只有APU上才有用，制程工藝也只從32nm升級到28nm，而Intel在這幾年中一直升級了SNB、IVB、Haswell、Broadwell及Skylake等處理器，制程工藝也從32nm一路升級到22nm、14nm及最新的14nm Plus。

今天我們來回顧下AMD模塊化架構6年來走過的路，無論大家對它以往的評價如何，現(xiàn)在都不重要了，因為我們都知道它已經是過去時了，AMD即將在Q1季度推出Ryzen處理器，全新的Zen架構、14nm LPP工藝以及AM4平臺使得Ryzen更有吸引力，它身上也沒了“推土機”架構的影子，從內核到緩存都重新設計了。

Bulldozer推土機：模塊化架構之始，AMD不走尋常路

AMD推的第一代模塊化架構就是Bulldozer推土機，以至于“推土機”都成了AMD整個模塊化架構的代名詞。在推土機問世之時，其架構確實有很多革命之處，包括全新的SSE5指令集、模塊化多核、彈性浮點單元等設計有其獨到之處，也有讓人耳目一新的感覺。

推土機開始使用模塊化多核架構設計

筆者在之前的分析文章中有過推土機架構的詳細分析，這里不再贅述架構設計，當時AMD對多核多線程的設計走的是物理多核，不同于傳統(tǒng)的SMT同步多線程，推土機的模塊化多核被稱為CMT物理多核，其設計意圖就是希望通過2個整數(shù)單元、1個共享浮點單元解決實際使用中整數(shù)多于浮點的過程，理論上這種設計要比SMT多線程更有效率。

推土機架構產品中，旗艦型號是FX-8150，號稱首款桌面8核處理器，頻率3.6-4.2GHz，支持DDR3-1866，8MB L3緩存，規(guī)格比Intel當年的SNB旗艦Core i7-2600K還要高，只不過125W TDP功耗高于后者的95W，畢竟核心數(shù)比SNB還是多了一倍。

但是在最終的性能表現(xiàn)上，推土機并沒有實現(xiàn)AMD的期待——2011年早些時候Intel推出了SNB處理器，在與SNB的對比中8核推土機除了在多線程上憑借核心多一倍略有優(yōu)勢之外，單線程性能上被SNB處理器完勝，在延遲、內存帶寬等方面也不如Intel處理器。

更重要的是，AMD的推土機使用的是GlobalFoundries的32nm SOI工藝，雖然同期Intel SNB處理器也是32nm工藝，但8核推土機核心面積高達315mm2，晶體管數(shù)量才12億，Intel 4核SNB處理器核心面積216mm2，晶體管數(shù)量11.6億，而且后者還是包含GPU核心在內的。

最終的結果就是8核推土機架構在技不如人的情況下，發(fā)熱、功耗控制更是不如SNB處理器，而GF的32nm工藝產能、良率當時也不給力，多重因素制約下，推土機首發(fā)表現(xiàn)很難讓市場認可，消費者并不買賬，唯一值得“炫耀”的就是AMD FX-8150處理器價格只要200美元左右，比Intel 4核Core i7便宜50%左右，性價比是AMD僅存的優(yōu)勢了。

Piledriver打樁機：AMD修補推土機，創(chuàng)高頻記錄

第一代模塊化架構推土機并沒有一鳴驚人，AMD在第二代模塊化架構“Piledriver”中對推土機架構做了修補，2012年10月份正式推出了Vishera平臺，AMD在此基礎上不僅推出了FX-8150的繼任者FX-8350，還衍生出世界首款5GHz處理器FX-9590，還有TDP降至95W的FX-8370E/8320E處理器。

AMD第二代模塊化架構Piledriver

相比第一代的Bulldorzer架構，Piledriver打樁機硬件單元變化不大，主要提升了一倍的L1 TLB單元、新增HW Divider硬件分配器、改善了S/L操作效率、提升了L2緩存效率及預測精度、優(yōu)化了整數(shù)及浮點單元調度，增加了FMA4、BMI、CVT16、TBM等指令，整體上是對推土機架構小修小補，目的是提高架構效率，降低能耗。

從AMD資料來看，Piledriver相比Bulldozer架構減少了10%的動態(tài)功耗，同樣的電壓下大幅提升了CPU頻率空間，以FX-8350為例，同樣是在125W TDP下，其基礎頻率從FX-8150的3.6GHz增加到了4GHz，加速頻率4.2GHz。

Piledriver這一代中AMD同時在高頻率及低功耗上出擊

Piledriver架構效率的提升使得AMD在擴展新品上有了更多靈活性，TDP增至220W的情況下，他們推出了號稱世界首款5GHz頻率的FX-9590處理器，而同樣是8核配置下又推出了TDP降至95W的FX-8370E/8320E處理器。遺憾的是，AMD這兩波產品都沒有獲得市場認可，消費者并不買賬，AMD后面索性不再折騰FX系列處理器了，從Piledriver架構之后事實上放棄了FX產品線，新品升級都沒了。

除了略顯悲催的FX系列處理器之外，Piledriver還用在了Trinity APU上，第一代Llano APU因為時間關系沒趕上推土機架構，使用的還是K10架構CPU核心，Trinity直接上了第二代模塊化架構。用于APU的Piledriver架構砍掉了L3緩存，核心數(shù)也從8核降至4核，還增加了GPU核心，TDP功耗也降至100W以內。

AMD的第二代模塊架構Piledriver改善了推土機架構的效率、功耗，但并沒有根本性變化，并不足以扭轉AMD的困境，相反Intel當年推出了22nm工藝的IVB處理器，而且用上了FinFET工藝，GlobalFoundries的32nm SOI工藝即便成熟起來了，AMD跟Intel之間的性能、功耗差距實際上越來越大了。

Steamroller壓路機：AMD棄守高性能平臺，工藝升級28nm

Piledriver在FX系列處理器上的失利讓AMD放棄了高性能平臺，高端市場已經無力再跟Intel對干，8核打4核、定價更低的情況下依然無法獲得玩家青睞，AMD第三代模塊化架構Steamroller索性只用在了Kaveri APU上。

Kaveri APU上使用了Steamroller架構CPU核心

早前AMD官方路線圖中表示Piledriver的重點是優(yōu)化效率，Steamroller才被視作性能增強版，發(fā)布之前官方及小道消息都在強調Steamroller架構性能有明顯提升，比前代提升至少30%，甚至可以對標Intel的Haswell架構，這才是模塊化架構本來應該有的樣子，之前的架構名不副實。

Kaveri的最終成品是我們之前已經熟悉的A10-7850K及后續(xù)衍生出來的A10-7870K等，其CPU使用了4個Steamroller核心，AMD增加了L1數(shù)據(jù)緩存到96KB，整數(shù)單元擁有獨立的解碼單元，分支預測更有效率，增強了指令的數(shù)據(jù)預取性能，核心思路還是提高單核執(zhí)行能力，推動每瓦性能比進一步提升。

具體到產品上來看，Kaveri APU除了CPU、GPU架構升級之外，內存頻率也提升到DDR3-2133MHz，支持了PCI-E 3.0，而且制程工藝也從之前的32nm SOI升級到了28nm SHP，AMD從這一代節(jié)點開始放棄SOI工藝，而28nm雖然也不是最適合CPU的高性能工藝，但AMD已經顧不了這么多了，現(xiàn)在的重點是APU產品線，F(xiàn)X系列已經不聞不問了。

Kaveri在AMD APU產品線表現(xiàn)算是很不錯的了，CPU、GPU架構及工藝升級使之具備更好的性能、功耗表現(xiàn)，雖然CPU性能依然不能跟Intel同代相提并論，但憑借GPU的優(yōu)勢，Kaveri戰(zhàn)戰(zhàn)Core i3或者部分Core i5處理器還是可以的，能滿足一般家庭使用。

不過AMD最大的問題還是出在自己身上，Kaveri自身進度一拖再拖，發(fā)布時間從2013年推到了2014年初，真正鋪貨時間更晚，而后續(xù)產品又出現(xiàn)了脫節(jié)，導致了AMD在2015年又用Kaveri Refresh硬撐一年，這就到了Carrizo一代了。

Excavator挖掘機：模塊化架構最終體，DDR4/AM4又晚了

時間到了2015年，AMD在臺北電腦展上正式發(fā)布了Carrizo APU，相比Kaveri升級到了第四代模塊化架構Excavator挖掘機，制程工藝還是28nm SHP不變，但這一次AMD繼續(xù)挖掘工藝潛力，在核心面積從245mm2僅僅增加到250mm2的情況下提高了晶體管密度，31億晶體管要比Kaveri APU的24億多了29%。

Excavator架構重點是優(yōu)化工藝密度、降低功耗

在Excavator架構上，AMD的重點還是繼續(xù)優(yōu)化效率，降低功耗，從Steamroller壓路機的高性能庫轉向高密度庫設計，換來的好處就是同樣的28nm工藝下，CPU內核面積可以減少23%，功耗更低，自適應電壓技術的加入減少了10%的電壓波動，泄露減少了18%，同樣的功率下頻率可提升10%，或者同樣的頻率下減少20%的功耗。

另一方面，Excavator架構還增加了新技術、新規(guī)范支持，支持AVX2指令集，還有DDR4內存，其中Carrizo桌面版中的A12-9800頻率從之前的3.7-4.0GHz提升到了3.8-4.2GHz，TDP功耗反而從95W降低到了65W。

可惜的是，Carrizo的Excavator架構雖然日趨成熟，但AMD在進度上一直不盡如人意，Carrizo 2015年推出了移動版，桌面版本該稍后，但還是各種延期，直到2016年9月份才算是正式發(fā)布桌面版，支持DDR4和AM4平臺還是挺有新意的，但是AMD的AM4平臺又因為Zen處理器延期，Carrizo桌面版發(fā)布了也沒啥存在感，直到現(xiàn)在你也無法在零售渠道買到A12-9800處理器，更沒有AM4平臺主板可用。

考慮到Ryzen處理器即將在Q1季度問世，恐怕AM4平臺解決了，大家對Carrizo桌面版APU也沒啥興趣了，因為Ryzen處理器更值得期待。

總結

從Bulldozer推土機開始，AMD的模塊化多核架構先后衍生出Piledriver打樁機、Steamroller壓路機和Excavator挖掘機四代，制程工藝從32nm SOI升級到28nm SHP，功耗、發(fā)熱及性能也越來越成熟。但是回頭來看，AMD模塊多核的理念最終是鏡中花水中月，并沒有如最初期待的那樣對X86架構進行革命，反倒是讓AMD在這5年中徹底敗走高性能處理器市場，徒留Intel寂寞沙洲冷。

AMD的模塊化架構失利有多方面因素，制程工藝上AMD還要受到GlobalFoundries的掣肘，后者在32nm SOI、28nm及FinFET工藝上磕磕絆絆不斷，直到全盤使用三星的14nm FinFET工藝之后才算穩(wěn)定下來。

不過AMD自身原因才是根源，四代模塊架構即便性能打不過Intel，但也不至于混到這般下場，公平地說推土機等架構在多線程性能上還是值得一戰(zhàn)的，但AMD各種進度延期導致它們并不能在合適的機會問世，就算是玩田忌賽馬策略，好歹也要幾匹馬上場才行??！

只是這些話都沒意義了，過去5年中推土機架構不論是有功還是有過，現(xiàn)在它們都走到了生命盡頭了，同樣拖延很久的Zen架構很快就要來了，AMD完全放棄了推土機架構中的物理多核思路，重新回歸SMT多線程，CPU內核、緩存系統(tǒng)也重新設計，模塊多核已經沒多少存在感了。

AMD處理器架構處理器