硬盤驅(qū)動器更換看起來簡單,其實正好相反,IT部門必須深入到服務(wù)器的核心才能真正提供解決方案。
數(shù)據(jù)中心有一臺服務(wù)器閃爍著琥珀色的燈光,這個警告意味著硬盤驅(qū)動器有潛在的問題。通常,當(dāng)一個燈在這里和那里開始閃爍時,人們呼吁更換驅(qū)動器,希望熱插拔驅(qū)動器,并采取一種快樂的方式。但一次經(jīng)歷卻大不相同。
在那一天,有兩個驅(qū)動器在忙碌的時候開始閃爍。并已列入工作人員的待辦事項列表好幾天了,當(dāng)另一個IT員工Bob詢問是否需要注意這種狀況,所以將這個任務(wù)交給Bob處理,他要求在第二天交付新硬盤。
幾天后,Bob表示硬盤驅(qū)動器已經(jīng)更換,一個已經(jīng)重建,另一個要花費一段時間恢復(fù)。
不祥的預(yù)兆
然而不久,一名員工報告說無法訪問公司的共享驅(qū)動器。技術(shù)人員開始研究它,當(dāng)技術(shù)人員與另一個用戶接觸時,表示也遇到了同樣的問題。工作人員開始意識到,所有的跡象都表明這些明顯的新問題與最近更換的硬盤驅(qū)動器有關(guān)。
工作人員遠(yuǎn)程訪問發(fā)生問題的服務(wù)器,這臺服務(wù)器托管了五個虛擬服務(wù)器。在這一點是公司的心臟和靈魂,也就是企業(yè)的主要數(shù)據(jù)庫,被托管在不同的物理服務(wù)器上。
當(dāng)工作人員在遠(yuǎn)程登錄時,看到一個警告,虛擬磁盤不再存在,意識到Bob已交換的兩個硬盤驅(qū)動器被同時從同一個陣列拔出。服務(wù)器在RAID5+0中的原始設(shè)置比較早,并沒有得到破壞。
更深層次的問題
在初始的拒絕和希望服務(wù)器可以正確啟動后,工作人員轉(zhuǎn)向備份,據(jù)說是設(shè)置為通過iSCSI提供NAS。工作人員已經(jīng)檢查了隨著時間推移的日志,直到工作成功完成。但是無法驗證這一點,因為一些虛擬服務(wù)器還包括這家公司的備份軟件。
最終,工作人員意識到備份已經(jīng)消失了。似乎服務(wù)器已經(jīng)復(fù)制并存儲在與原始虛擬服務(wù)器相同的主機上,在這種情況下顯然沒有什么好處。
工作人員對此感到恐慌,他們希望可以做些什么,以便恢復(fù)和運行,至少讓用戶可以登錄(因為域控制器被擦除),并能夠訪問幾個月前遷移到NAS的公司數(shù)據(jù)。
Bob在報告問題后很快與同事從頭開始重建域控制器,Office365控件,打印服務(wù)器和許多其他功能。終于能夠及時地解決了問題。在接下來的幾個星期,工作人員開始恢復(fù)在服務(wù)器丟失缺少的信息,并最終從虛擬磁盤損壞時創(chuàng)建的大量數(shù)據(jù)中挖掘出來。
現(xiàn)在是人們重新審視核心IT流程和提醒關(guān)鍵要點的好時機:
·始終檢查備份的物理位置,以驗證其是否存在,而不是單獨的備份日志。
·了解企業(yè)的RAID陣列以及公司或客戶的具體情況,并在進(jìn)行更改時小心謹(jǐn)慎。
·執(zhí)行任務(wù),如在數(shù)據(jù)災(zāi)難發(fā)生后,硬盤驅(qū)動器交換等。
·再次檢查備份。
·IT工作更加仔細(xì)小心,以防萬一。
·不要將所有雞蛋(或虛擬服務(wù)器)放在一個籃子中。
·為了更好的實施,請再次檢查這些備份。