針對刀片服務器和機架服務器的爭論從數(shù)據(jù)中心出現(xiàn)開始一直延續(xù)到了現(xiàn)在。每種平臺在密度、電源、溫控和可用性方面都有自己的優(yōu)勢,而這些方面也已經(jīng)討論了很多年。許多爭論都是圍繞傳統(tǒng)的服務器操作系統(tǒng)和應用程序。而對于現(xiàn)在的環(huán)境來說,人們最為關注的不再是應用程序和硬件之間的依賴關系,而是運行hypervisor的硬件平臺?,F(xiàn)在,許多人都將硬件作為基礎組成部分,而軟件才是數(shù)據(jù)中心的關鍵。這是否意味著我們終于可以結(jié)束對于刀片服務器和機架服務器的爭論?答案是否定的。事實上,這使得爭論更加激烈。
這種爭論并非沒有解決方式,在遵從一些基本原則的情況下,可能總結(jié)出明確的解決方案。應該選擇刀片服務器、機架服務器或者兩者都使用的一個核心原則是虛擬化是一種整合技術。這聽起來像是我們?nèi)剂私獾奶摂M化基礎知識,但當設計基礎設施時,卻是最容易被遺忘的底層基礎。我們已經(jīng)明確刀片服務器是一種整合技術,所以如果我們使用其來運行虛擬機,就變成了從硬件和軟件兩個方面進行了整合。如果我們更近一步,在虛擬環(huán)境之上部署Docker或者Citrix,數(shù)據(jù)中心看起來就會像一堆俄羅斯嵌套娃娃。
故障轉(zhuǎn)移計劃
雖然刀片服務器可以提供一套緊湊的基礎設施系統(tǒng),但是在設計基礎設施過程中還需要注意故障轉(zhuǎn)移計劃。對于管理員來說,都不愿意同時聽到整合和故障這兩個詞,這也是為什么出現(xiàn)很多關于刀片服務器和機架服務器的爭論。
幾年之前,我目睹了數(shù)據(jù)中心里一臺核心交換機發(fā)生局部故障,影響了很多下層交換機,甚至導致幾臺交換機失去連接。幾臺機架交換機和兩臺刀片交換機出現(xiàn)問題,需要進行重啟。但是機架交換機位于數(shù)據(jù)中心的不同位置,而刀片交換機恰巧位于同一個機箱當中。因為機架服務器具有備用連接,所以業(yè)務沒有受到影響。但是,受到影響的刀片服務器機箱卻出現(xiàn)了連接中斷的情況,更為糟糕的是上面運行了大規(guī)模的Citrix環(huán)境。
雖然這是一種偶然狀況,但是如果刀片機箱中運行的是hypervisor,情況會更加糟糕,受影響的將不只是16臺服務器,而可能是數(shù)百臺。這是否是一個獨立的事故?是的,但是硬件整合風險仍然存在。就像軟件整合一樣,我們必須學習如何避免這些風險。刀片和虛擬化技術在節(jié)省電力和整合方面具有很大價值,所有我們需要確保在設計時考慮這些方面,而不能仍舊使用傳統(tǒng)機架和應用程序服務器的設計流程。
將機架服務器放在不同的機架上,連接到不同的交換機來避免可能的硬件故障是一種更為簡單的方式。使用這種方式,配合高可用性(HA)機制,可以極大地提升環(huán)境的彈性。我們可以在刀片數(shù)據(jù)中心使用HA機制來防止所有關鍵虛擬機運行在同一臺刀片服務器上,但是通常它們還是會在同一個機箱當中。你可能會爭論機架服務器也依賴于數(shù)據(jù)中心的其他基礎設施,就像刀片服務器依賴于機箱一樣。確實,這是正確的,但是不要忘記刀片機箱也依賴于數(shù)據(jù)中心。事實上,機箱是俄羅斯嵌套模型中的另外一層。解決這個問題的方式之一就是將虛擬機部署在多個刀片機箱當中,將一臺機箱故障導致所有虛擬機停機的風險減至最低。
刀片技術的發(fā)展前景
表面上,增加機箱數(shù)量看起來是解決刀片問題的一種可行方案,但是仍然存在一些顧慮。機箱自身就是硬件中價格非常昂貴的部分。這種機箱結(jié)構(gòu)可能是“被動的”,雙控制器、網(wǎng)絡和光纖上行鏈路都可能為機箱增加很大開銷。安裝這些備用部件將會大幅提升每臺服務器的平均開銷。當然,如果不需要光纖交換機或者更高速的網(wǎng)絡連接等這些hypervisor主機所需的組件,也可以在機箱中安裝非虛擬化服務器,但是刀片機箱是否得到了充分利用?
表面上,刀片并不適用于虛擬化環(huán)境。但是,如果減少每個機箱中的刀片服務器數(shù)量會怎樣?傳統(tǒng)來說,刀片服務器都是大規(guī)模和高密度的,但是現(xiàn)在的刀片服務器密度已經(jīng)降至4到16臺物理服務器。雖然高密度的情況仍然存在,但是中型或者大型企業(yè)也擁有靈活性來減少刀片數(shù)量并降低每個機箱開銷。這允許業(yè)務部門利用刀片提供的優(yōu)勢,但是需要避免關于密度的問題,以及一直存在的“將所有雞蛋都放在一個籃子里”的擔心。
相比于密度更高的機箱來說,這種方式節(jié)省的電力和空間更少,但是這種方式為企業(yè)提供了一個平衡點,既想要享受刀片的優(yōu)勢,由不想要面對高風險。因為機箱的體積在不斷縮小,使得管理以及外部連接相關的開銷同樣會減少,所以使用更小型化的機箱是一種更為經(jīng)濟的解決方案。當然,這并不意味這刀片已經(jīng)獲得了勝利,機架服務器在短時間內(nèi)不會消失。但是,如果刀片服務器制造商更多地思考需求和風險,而不是速度和體積,那么刀片可能會成為未來的趨勢。