摘要:數(shù)據(jù)中心遷移并不是個輕松的任務(wù),但是卻是企業(yè)必須面臨的問題,因為數(shù)據(jù)中心需要進行合并、轉(zhuǎn)移、整合、構(gòu)建以及其他更新。
數(shù)據(jù)中心遷移并不是個輕松的任務(wù),但是卻是企業(yè)必須面臨的問題,因為數(shù)據(jù)中心需要進行合并、轉(zhuǎn)移、整合、構(gòu)建以及其他更新。毫無疑問,這樣一項任務(wù)會很快成為數(shù)據(jù)中心管理員的新挑戰(zhàn),特別是當(dāng)需要進行地面布局和有其他物理需求時。
除了一部分很明確的規(guī)劃,如設(shè)置機器的修養(yǎng)期、安排舊設(shè)備淘汰和進行服務(wù)器整合,管理員也必須考慮應(yīng)用軟件的停工期。幸運的是,由于可進行數(shù)據(jù)中心托管并且硬件價格低廉,因此徹底停止數(shù)據(jù)中心的服務(wù)在當(dāng)前是可以避免的。
然而,應(yīng)用軟件托管需要充分的預(yù)先計劃,任何階段和產(chǎn)品需求都不能出差錯。盡管當(dāng)前將核心系統(tǒng)轉(zhuǎn)換到外部環(huán)境的情況已大大減少,有時管理員還是不得不咬緊牙關(guān)選擇托管的方式以確保應(yīng)用軟件的持續(xù)運行。
恰當(dāng)?shù)挠媱澥鞘狗?wù)和設(shè)備轉(zhuǎn)換平穩(wěn)進行的關(guān)鍵,只有這樣才能使用戶的工作不受到任何影響。最終管理員結(jié)束這一艱巨的任務(wù),這需要不同IT小組(包括工程師和技師)之間良好的溝通,可以使這一重新部署任務(wù)圓滿完成。
最近,CMP通路檢測中心實驗室(CMP Channel Test Center lab)需要進行遷移。為了圓滿完成這一遷移,必須創(chuàng)建一個小型計劃,這樣就可以保證只有兩到三天時間基礎(chǔ)設(shè)施無法達到最大利用率。在整個計劃完成了一半時,地面設(shè)計、動力資源供給、USP服務(wù)和網(wǎng)絡(luò)設(shè)計等都發(fā)生了改變。為了將轉(zhuǎn)移期間停工時間最小化,我們迅速制定出了行動計劃。如下是計劃的實施步驟,解決方案提供者可以制訂相似的轉(zhuǎn)移計劃,這樣就可以盡量避免轉(zhuǎn)移過程中問題的發(fā)生。
1、將設(shè)備、電工和IT員工相協(xié)調(diào):從一開始,我們就很明確地告訴每個小組我們需要轉(zhuǎn)移基礎(chǔ)設(shè)施設(shè)備和機架的最小量。遷入的新服務(wù)器機房比以前小,因此我們面臨著潛在的所需機架和架子的空間安排問題。我們計算出所需機架和架子的最小量——既可滿足需要,又可放入新機房內(nèi)。
2、停機但是保證數(shù)據(jù)中心持續(xù)運行:在轉(zhuǎn)移的當(dāng)天我們提出一個普通但是很卻很有效的行動計劃。員工在轉(zhuǎn)移設(shè)備和部件時不斷開關(guān)鍵的網(wǎng)絡(luò)通路。
3、冷卻系統(tǒng)和其他系統(tǒng):此處有一個被忽略的內(nèi)容。由于設(shè)計原因,CMP Channel Test Center新服務(wù)器機房需要更少的冷卻設(shè)施,但是數(shù)據(jù)中心總的工作量卻沒發(fā)生變化。我們需要仔細觀察并進行測量。轉(zhuǎn)移一個數(shù)據(jù)中心時,你也需要與電工討論相關(guān)問題,例如新機房可獲得的最大電力負荷,以確保未來的機器數(shù)目增長可與之相適應(yīng),同時也使CIO和CEO們了解機房的電力承載力。
4、維持數(shù)據(jù)中心運行:數(shù)據(jù)遷移和保證核心應(yīng)用軟件運行從來不是什么大問題。然而,根據(jù)我們的經(jīng)驗,成本最少的行動方案是將工作分解。換句話說,在遷移期間實際存在兩個數(shù)據(jù)中心。維護小型數(shù)據(jù)中心的VAR應(yīng)該推薦采用這一方式以保證數(shù)據(jù)中心的持續(xù)運行。這可實現(xiàn)在遷移過程中不需要進行基礎(chǔ)設(shè)施托管。
5、開始運行:不在萬不得已的情況下,不要斷開機架和網(wǎng)絡(luò)的線路連接。斷開的連接越少,花費越少,同時一個客戶機可以更加迅速地恢復(fù)運行。為了加快CMP Channel Test Center的遷移速度,員工盡量保證線路連接,同時在斷開的網(wǎng)絡(luò)連接上貼上標(biāo)簽。結(jié)果顯示我們節(jié)約了大量時間。
6、測試,測試再測試:不要對任何一個小的環(huán)節(jié)掉以輕心。檢測網(wǎng)絡(luò)連接,外部服務(wù)和服務(wù)器,和其他參與遷移的人員保持聯(lián)系,并讓其對任何損壞負責(zé)。
對實驗室的重新部署點醒了我們大家。很多工作中和設(shè)備測試中經(jīng)常被忽略的小細節(jié)都顯示出其重要性,需要在遷移中引起重視。
生產(chǎn)量計劃也是一個需要引起我們重視的核心環(huán)節(jié)。這次是二十年來實驗室的第四次遷移。盡管中間出現(xiàn)了一些小的卡殼,但是工作順利進行,我們感到很有信心,因為遷移過程中潛在的無法預(yù)料的電力供給和需求增長以及其他網(wǎng)絡(luò)限制問題都沒有對整個遷移過程構(gòu)成影響。