企業(yè)架構(gòu)高級經(jīng)理Brenden Bryan稱,在政府雇員健康協(xié)會(GEHA)徹底調(diào)整數(shù)據(jù)中心并部署Fabric網(wǎng)絡(luò)架構(gòu)基礎(chǔ)設(shè)施后,程序變得“真的是相當簡單”,再也不像許多其它的IT項目那樣復(fù)雜了。“在回顧整個過程并且說‘我希望做出不同的決定’時,我們沒有遇到任何問題或麻煩。”
位于密蘇里州堪薩斯城的GEHA作為全美第二大的健康計劃與牙齒健康計劃正在處理著100多萬名聯(lián)邦政府雇員、退休職員和他們的家庭成員的醫(yī)療費用報銷工作。Bryan稱,轉(zhuǎn)向Fabric網(wǎng)絡(luò)架構(gòu)的主要原因是簡化、鞏固和移除遺留的光纖通道SAN環(huán)境。
Bryan在2010年8月份開始為GEHA工作。他稱,當時他接手的是一個相當?shù)湫偷幕A(chǔ)設(shè)施:由眾多廠商生產(chǎn)并且?guī)в性S多故障的部件拼湊而成。該協(xié)會還希望虛擬化其大型機環(huán)境,讓其變成一個分布式架構(gòu)。Bryan 稱:“我需要的是一個擁有冗余性和高可獲得性的基礎(chǔ)設(shè)施。”一旦新的基礎(chǔ)設(shè)施就位并穩(wěn)定運行,下一步計劃就是將所有的GEHA Tier 2和Tier 3應(yīng)用轉(zhuǎn)移到這上面,最終將Tier 1報銷處理系統(tǒng)也轉(zhuǎn)移到這上面。
GEHA部署了由博科生產(chǎn)的以太網(wǎng)交換機和路由器。目前距這個為期六個月的項目結(jié)束日期已經(jīng)過了一年多時間。他稱,它們提供了一個高速環(huán)境和一個20比1的虛擬機與刀片服務(wù)器硬件的比例。
Bryan 稱:“我能夠保持最低限度的物理服務(wù)器數(shù)量,盡可有的利用它們。它們讓我能夠提高存儲效率和計算效率。”
部署數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)需要一些規(guī)劃。ZK Research 的首席分析師Zeus Kerravala稱,這意味著必須要用新的交換機設(shè)備升級和替代老式的交換機,因為在光纖通道網(wǎng)絡(luò)中使用了不同的流量配置。“你必須要重新搭建你的網(wǎng)絡(luò),以及重新連接服務(wù)器。”
實現(xiàn)扁平化
數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)是一個針對橫向信息流優(yōu)化過網(wǎng)絡(luò),相對于傳統(tǒng)網(wǎng)絡(luò)來說,其更為扁平,更為簡單。Kerravala解釋稱,其更多的是針對客戶端/服務(wù)器設(shè)置進行設(shè)計的,為的是實現(xiàn)服務(wù)器與網(wǎng)絡(luò)核心實現(xiàn)信息往來。
Fabric網(wǎng)絡(luò)模式中,流量在網(wǎng)絡(luò)和虛擬機之間橫向流通。“因此其更多的是一種服務(wù)器對服務(wù)器的連接。”fabric網(wǎng)絡(luò)更為扁平,并且不超過兩層。相比之下,遺留的網(wǎng)絡(luò)至少擁有三層或甚至更多的層。Kerravala稱,這些年來,存儲網(wǎng)絡(luò)也采用了這種設(shè)計方式,如今數(shù)據(jù)網(wǎng)絡(luò)也需要采用這種設(shè)計方式。
推動向fabric網(wǎng)絡(luò)轉(zhuǎn)型的一個因素是,在財富2000排行榜上的公司,有半數(shù)的企業(yè)數(shù)據(jù)中心工作負載被進行了虛擬化。當實現(xiàn)了數(shù)據(jù)中心負載實現(xiàn)了虛擬化后,他們開始關(guān)注如何讓他們的服務(wù)器與其它的服務(wù)器以及網(wǎng)絡(luò)進行通信。
企業(yè)存儲集團高級分析師Bob Laliberte 稱:“我們將這視為數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)方面的發(fā)展。推動因素是越來越多的服務(wù)器對服務(wù)器連接。這些不同的服務(wù)器需要彼此對話,與網(wǎng)絡(luò)核心進行通信。這些都增加了處理負載和延時。”
虛擬化增加了復(fù)雜性,因為這意味著動態(tài)移動許多東西,“因此網(wǎng)絡(luò)廠商正在努力簡化這些復(fù)雜環(huán)境。”
當數(shù)據(jù)中心無法擴展
隨著房屋止贖事件在2006年達到頂峰,Walz集團發(fā)現(xiàn)他們的數(shù)據(jù)中心無法擴展以有效應(yīng)對額外的服務(wù)增長需求。該公司負責(zé)為多個行業(yè)提供文檔管理、履約和合規(guī)服務(wù)。公司的首席信息安全官Bart Falzarano稱:“這妨礙了業(yè)務(wù)的增長。”
Falzarano稱,公司招聘了額外的IT員工以應(yīng)對這些不同的系統(tǒng)和管理措施,建立新的服務(wù)器,擴展網(wǎng)絡(luò),增加災(zāi)難恢復(fù)服務(wù)。“但是管理這些技術(shù)問題非常困難,尤其是隨著我們開始嘗試向虛擬環(huán)境轉(zhuǎn)移。”他稱。公司還有許多無法被虛擬化的應(yīng)用,這些必須要被分別管理。“這些系統(tǒng)、存儲和網(wǎng)絡(luò)都有著不同的切入點。我們已經(jīng)變得無法實現(xiàn)預(yù)期的目標了。”
為了減少復(fù)雜性,Walz集團在2009年部署了思科的統(tǒng)一數(shù)據(jù)中心平臺,這是一個統(tǒng)一的數(shù)據(jù)中心Fabric架構(gòu),其將計算、存儲、網(wǎng)絡(luò)和管理綜合到了一個平臺中,以實現(xiàn)IT自動化,讓其成為一個跨越物理和虛擬環(huán)境的服務(wù)。目前這一平臺在公司中已經(jīng)與NetApp SAN Storage Flexpod平臺連接在了一起。
Falzarano回憶稱,此前他們使用的是惠普的技術(shù),當數(shù)據(jù)庫的一個節(jié)點出現(xiàn)故障,就需要給廠商打電話,最終需要取出四個CPU中的三個,并且需要花上四個小時才能排除故障。直到恢復(fù)正常運行,14個小時已經(jīng)過去了。
“現(xiàn)在,對于同樣的故障,如果我們發(fā)現(xiàn)了出問題的刀片服務(wù)器節(jié)點,我們在4分鐘內(nèi)就可以斷開這一SQL應(yīng)用并重新連接SQL應(yīng)用。在虛擬管理層也可以這樣做。”他稱。
IT一直在追蹤數(shù)據(jù)中心性能,記錄一些關(guān)鍵的指標。Falzarano稱,他們發(fā)現(xiàn)密集度變成了8比1,這意味著更少的纜線復(fù)雜度和更低的纜線需求量。老技術(shù)的虛擬化效率為4比1,新技術(shù)具有更高的效率,達到了15比1。團隊能夠虛擬化以前他們所無法虛擬化的應(yīng)用。
其它的優(yōu)勢還包括機架減少了50%,系統(tǒng)管理更為集中化——目前一個IT工程師可以管理50個系統(tǒng)。。
“在使用老技術(shù)時,我們遇到了大量的硬件故障問題。在我們的多數(shù)據(jù)中心中,每隔30天就會出現(xiàn)一個故障?,F(xiàn)在一年都可能不會出現(xiàn)一個故障。”他稱。
容易部署
與Walz集團的IT執(zhí)行官一樣,GEHA 的IT團隊領(lǐng)導(dǎo)人認為部署fabric網(wǎng)絡(luò)模式不僅能夠滿足業(yè)務(wù)需求,還降低了復(fù)雜性、成本和管理數(shù)據(jù)中心所需要的人員數(shù)量。Bryan稱協(xié)會還獲得了規(guī)模效益,兩個人即可管理所有的以太網(wǎng)環(huán)境,這與以往需要熟悉fabric的額外人員截然不同。
“在我們的團隊中,沒有任何一個人是光纖通道的專家。讓報銷程序系統(tǒng)具有冗余性與高可獲得性的唯一辦法是依靠以太網(wǎng)fabric網(wǎng)絡(luò)架構(gòu)技術(shù)。我們的員工熟悉這種技術(shù)。”他稱。
Bryan稱,自從無需購買任何光纖通道交換機,協(xié)會能夠省下了近50多萬美元的資金預(yù)算,由于不需要人員管理光纖通道,協(xié)會運營開銷減少了約25萬美元。“自從改用fabric網(wǎng)絡(luò)架構(gòu),我們能夠取消成堆的設(shè)備。” Bryan稱。
GEHA使用了一個本地托管服務(wù)提供商以幫助安裝架構(gòu)中一些更為復(fù)雜的部分。“但是從我們打開設(shè)備包裝箱到整個環(huán)境運行起來,只需要兩天的時間。過程非常簡單。” Bryan稱。
他補充道,新架構(gòu)的性能讓人感到十分震驚。他們做了一個測試,通過網(wǎng)絡(luò)將一個4G的ISO文件從一個刀片服務(wù)器拷貝到另一個刀片服務(wù)器上。在網(wǎng)絡(luò)和存儲都通過相同的光纖通道網(wǎng)絡(luò)架構(gòu)的情況下,耗時低于1秒鐘。他稱:“我們沒有看到遷移,我不認為它們被真正拷貝了。”
IT正在使用這一架構(gòu)通過CommVault的軟件備份他們的環(huán)境。Bryan,協(xié)會正在關(guān)注網(wǎng)絡(luò)吞吐量能在1小時內(nèi)達到1太字節(jié)這一性能。“與以前的架構(gòu)相比,吞吐量提升了8至10倍。”
今天,GEHA所有的產(chǎn)品流量正在fabric網(wǎng)絡(luò)架構(gòu)上。Bryan稱,他對這一基礎(chǔ)設(shè)施已經(jīng)非常滿意了。他稱,基礎(chǔ)設(shè)施的擴展已經(jīng)不再是一個問題,通過聚合架構(gòu)與速度,已經(jīng)成為了一大重要優(yōu)勢。GEHA也能夠在單一刀片服務(wù)器上運行繁重的虛擬機工作負載,他稱。“不用在大量的刀片服務(wù)器上花大量的資金,取而代之的是你無需犧牲性能就能夠增加這些刀片服務(wù)器的投資回報率。”Bryan稱。
Laliberte稱,他觀察了數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的未來,發(fā)現(xiàn)這類架構(gòu)僅僅剛剛起步。如果你考慮的是復(fù)雜性和規(guī)模,并且在你的環(huán)境中擁有數(shù)千臺服務(wù)器和交換機,那么任何類型的架構(gòu)調(diào)整都耗時耗力。
僅僅是花時間對三層架構(gòu)進行改良,就需要花上三個階段。“這些情況已經(jīng)變成了現(xiàn)實并得到了宣傳,但是要被大規(guī)模部署還需要幾年時間。”
案例研究:正在使用中的Fabric網(wǎng)絡(luò)架構(gòu)
Dan Shipley以往巡視數(shù)據(jù)中心時,他所看到的全部是一堆雜亂無章的線纜和交換機。它們管理起來即費錢又容易出錯。Shipley為一家名為供應(yīng)網(wǎng)絡(luò)公司的架構(gòu)師。該公司總部位于圣路易斯市,是一家總資產(chǎn)達6億美元的辦公用品批發(fā)商。Shipley稱,公司遇到的所有典型問題都與傳統(tǒng)的基礎(chǔ)設(shè)施有關(guān):300臺服務(wù)器消耗掉了大量的電力,占用了大量的空間,在硬件維護時必須要停止運行。
“我們主要使用的是惠普的產(chǎn)品。我們從惠普那里訂購了這些服務(wù)器。由于這些服務(wù)器的研發(fā)時代都不盡相同,因此如果一臺服務(wù)器的主要出現(xiàn)了故障,那么我們的員工就要為此忙上一晚上,這非常痛苦。所以我們說,‘看啊,我們終于擺脫了這種痛苦。’虛擬化已經(jīng)成為了主流,我們需要從這個傳統(tǒng)游戲中跳出來。”
目前,供應(yīng)網(wǎng)絡(luò)在他們的數(shù)據(jù)中心中所創(chuàng)建的東西與傳統(tǒng)方式有著很大的不同。公司沒有部署以太網(wǎng)和架構(gòu)交換機,而是選擇了Xsigo的I/O Director,其位于服務(wù)器機架頂層,負責(zé)定向流量。機架上的所有服務(wù)器都被插入到一個盒子里,這個盒子能夠動態(tài)地建立與其它所有數(shù)據(jù)中心資源的連接。與其它的數(shù)據(jù)中心架構(gòu)不同,I/O Director提供了InfiniBand架構(gòu)。InfiniBand為一種基于開源標準,用于高速通信的交換式光纖通信鏈路。
Shipley稱:“在你的所有服務(wù)器上,你可以去除所有的線纜、以太網(wǎng)和架構(gòu)交換機,將其與一個InfiniBand線纜連接,出于冗余考慮你可以連接兩個,這就是我們所做的工作。”這些線纜將被插入I/O Director中。“我希望將所有的這些都連接至一個外部光纖通道存儲,創(chuàng)建一個虛擬化fabric存儲網(wǎng)絡(luò)。實際上,這些都通過InfiniBand架構(gòu)運行,而服務(wù)器……我認為它們?nèi)匀辉谕ㄟ^fabric進行連接。”
這一配置意味著他們現(xiàn)在僅僅使用兩條線纜,而不是多條線纜,同時擁有大量的帶寬。
供應(yīng)網(wǎng)絡(luò)公司實現(xiàn)了徹底的虛擬化,他們的數(shù)據(jù)中心數(shù)量由大約20個架構(gòu)縮減到了4個。電力消耗和冷卻能耗也得到了降低。
Shipley稱,InfiniBand已經(jīng)在超級計算機領(lǐng)域被應(yīng)用了十年時間,其具有低成本和開放性。然而相反的是,其它的廠商都在對以太網(wǎng)進行投資,因為他們不希望看到InfiniBand勝出。目前I/O Director傳輸速度為每秒56G,而最快的以太網(wǎng)連接也不過每秒10G。
在成本方面,Shipley稱一個端口的10G以太網(wǎng)網(wǎng)卡的價格約為600美元,同時在另一端還需要一個以太網(wǎng)交換機端口,其成本為每個端口大約為1000美元。“因此對于每一個以太網(wǎng)連接來說,你需要1600美元。”一個40G單個端口InfiniBand適配器價格大約為450至500美元。他稱,36端口的InfiniBand交換機為6000美元,平均下來每個端口的價格為167美元。
Shipley稱,公司已經(jīng)取消了所有的核心以太網(wǎng)交換機,以支持InfiniBand技術(shù)。
他承認:“我首先擔心的是……怕我自己不了解InfiniBand。”當時大多數(shù)企業(yè)架構(gòu)為fabric和以太網(wǎng)。他稱:“我們帶來了I/O Director,并且與思科的統(tǒng)一數(shù)據(jù)中心進行了對比。前者不僅成本低,速度快,而且簡單易用。同時Xsigo的支持也非常的不錯。”
Shipley稱,此前的大型數(shù)據(jù)中心工作需要花上12個小時。自從部署了I/O Director,同樣的工作所需要時間不超過3個小時?,F(xiàn)在將虛擬機從一個托管主機遷移至另一個上只需要幾秒鐘時間,而以往要花上數(shù)分鐘才行。
他稱,他最初擔憂的是,由于Xsigo是一家規(guī)模較小的廠商,擔心它們用不了多長時間就會倒閉。但是,他們發(fā)現(xiàn)連VMware都是Xsigo的客戶。
企業(yè)戰(zhàn)略集團高級分析師Bob Laliberte 稱:“Xsigo宣稱,你還可以使用他們的產(chǎn)品替代使用以太網(wǎng)和fabric,并創(chuàng)建一個fabric網(wǎng)絡(luò)架構(gòu)。他們的說法是對的。當你談?wù)摂?shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心架構(gòu)時,Xsigo正在幫助創(chuàng)建一個兩層的架構(gòu)。不過,瞻博、思科和博科正在嘗試創(chuàng)建更為扁平的網(wǎng)絡(luò)架構(gòu)。”
Laliberte 稱,InfiniBand是一個優(yōu)秀的協(xié)議,但是這一協(xié)議未必會被大規(guī)模使用。“它們目前主要還是應(yīng)用在需要進行極快計算的超級計算領(lǐng)域。”