據(jù)理力爭 讓你的服務(wù)器“休息”一下

責(zé)任編輯:vivian

2012-01-19 09:17:18

摘自:51CTO

適當(dāng)時間的計劃停機(jī)其實可以讓你免遭損失。最后但可能也是最重要的一點是,計劃停機(jī)讓廣大用戶多多少少體會了萬一真的發(fā)生災(zāi)難,會出現(xiàn)什么樣的情況。

適當(dāng)時間的計劃停機(jī)其實可以讓你免遭損失。除非你絕對少不了,否則別信需要7*24、隨時可用的服務(wù)這套論調(diào)。

問一下自己:當(dāng)你宣布(或請求)停機(jī)窗口,以便完成升級或進(jìn)行維護(hù)時,你那些用戶會有啥反應(yīng)?我想情況恐怕不妙。

多年前,在除了超大型IT部門外的所有環(huán)境,計劃停機(jī)還是一件很平常的事;而如今,很少有企業(yè)輕易讓你申請到很長的停機(jī)窗口。哪怕在凌晨時分這樣的時間段,連明顯不需要7*24服務(wù)的一些部門(比如三班倒的制造工廠或者設(shè)有急診室的醫(yī)院)都很難拒絕自己的用戶訪問數(shù)據(jù)。

其中的原因有多方面,但是說穿了還是日常業(yè)務(wù)過于依賴IT系統(tǒng)——而服務(wù)器虛擬化技術(shù)的出現(xiàn),在很大程度上大大改進(jìn)了規(guī)避災(zāi)難的能力。公司企業(yè)對數(shù)據(jù)入了迷、上了癮;而技術(shù)取得了長足進(jìn)展,以至于我們IT人士輕易就能滿足他們這個“癮”。

遺憾的是,這種情況帶來了雙重影響:它造就了一種氛圍,即連針對計劃停機(jī)再小的請求都常常被拒絕或被推遲;當(dāng)災(zāi)難發(fā)生時,用戶們毫無準(zhǔn)備、束手無策。

停機(jī)的三個好處

首先,停機(jī)對于確保系統(tǒng)的穩(wěn)健性和可靠性大有幫助。如果你得等上數(shù)周、乃至數(shù)月才能為基礎(chǔ)架構(gòu)打上重要補(bǔ)丁,這無異于自招麻煩。雖然現(xiàn)代化IT基礎(chǔ)架構(gòu)中的系統(tǒng)大多基本上不用停機(jī)就可以打上補(bǔ)丁,但是對于另一些系統(tǒng)而言,要打上最新版本,你就得關(guān)掉電源,因而給至少幾個用戶帶來不便。

就拿你那些普通的交換機(jī)和路由器來說吧。它們常常一放就是好多年,順暢無阻地運(yùn)行。實際上,我在上一周碰到的一只桌面級匯聚交換機(jī)其正常運(yùn)行時間超過了2000天。這足以那家廠商的產(chǎn)品確實很可靠,但是我可以打賭:這個設(shè)備的固件里面存在很大的安全漏洞——大得好幾輛小車都能通過,很容易被人鉆空子。

其次,如果能充分利用計劃停機(jī)窗口,你就能檢驗高可用性功能、演練災(zāi)難恢復(fù)計劃。要是你很少檢驗自己的高可用性或災(zāi)難恢復(fù)功能,那么當(dāng)你真正需要這些功能時,它們失靈的可能性就要大得多。我在去年寫過一篇博文,當(dāng)時有位讀者的留言可謂是一針見血:“任何功能要是每天使用不到一次,那么每當(dāng)你使用它時,別指望它每次都行。你使用它的次數(shù)越少,當(dāng)你實際使用時,它失靈的可能性就越大。”憑本人的經(jīng)驗,這句話再對不過了。

你知道自己的高可用性系統(tǒng)應(yīng)該如何工作,但是你確信它們會正常工作嗎?你有沒有使用冗余交換機(jī)的光纖通道存儲區(qū)域網(wǎng)(SAN)?有沒有使用冗余的核心網(wǎng)絡(luò)交換機(jī)或數(shù)據(jù)庫集群?你是否讓我可以不用提醒廣大用戶,就在工作時間段關(guān)閉其中一個系統(tǒng)呢?

如果你反對,這表明你根本就不夠確信。只有在計劃停機(jī)窗口期間有意關(guān)掉基礎(chǔ)架構(gòu)的冗余部分,你才能夠確信自己的高可用性系統(tǒng)會按原本的方式正常工作。要不然,你就會搞清楚:要是自己有時間或預(yù)算,應(yīng)該把精力主要投入在哪個環(huán)節(jié),以求改進(jìn)。

最后但可能也是最重要的一點是,計劃停機(jī)讓廣大用戶多多少少體會了萬一真的發(fā)生災(zāi)難,會出現(xiàn)什么樣的情況。在我親眼目睹的幾起非常嚴(yán)重的基礎(chǔ)架構(gòu)停運(yùn)事件中,最糟糕的情況莫過于用戶們一片茫然、不知所措。是的,關(guān)鍵業(yè)務(wù)系統(tǒng)的停運(yùn)會影響生產(chǎn)力,這是完全可以料到的;但你會驚訝地發(fā)現(xiàn),只要采取異常簡單的措施,其實原本可以避免許多最嚴(yán)重的影響。要是你不偶爾關(guān)閉系統(tǒng),看看會發(fā)生什么情況,也許永遠(yuǎn)也不知道那些措施。

據(jù)理力爭

雖然給廣大用戶帶來不必要的麻煩看起來像是沒事找事,但是如果有充足的理由,關(guān)掉基礎(chǔ)架構(gòu)的一部分還是能給企業(yè)帶來實實在在的好處。嚴(yán)酷的現(xiàn)實是,對計劃停機(jī)請求堅決說不的企業(yè)終究會發(fā)現(xiàn)自己遭到非計劃停機(jī),由于災(zāi)難恢復(fù)機(jī)制未經(jīng)考驗,結(jié)果蒙受的損失要大得多,而廣大用戶對無法訪問數(shù)據(jù)的日子又毫無準(zhǔn)備。盡管據(jù)理力爭讓人不悅,但是下一次你的停機(jī)請求遭到反對時,你還是要竭力搬出這個理由。這么做也許不招人待見,但是總比不這么做要強(qiáng)得多。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號