摘要:本文介紹數(shù)據(jù)中心管理存在的16個常見誤區(qū),這些誤區(qū)因為各種各樣的原因會存在于數(shù)據(jù)中心的日常管理和運行維護中,可能人們還沒有重視它們。所以數(shù)據(jù)中心的管理人員應(yīng)該重視它們并做好安全防范的工作。
在數(shù)據(jù)中心的正常運行中,一個微小的錯誤就可能導(dǎo)致災(zāi)難性的后果。不僅會對客戶造成經(jīng)濟損失,對自身的商業(yè)形象和發(fā)展也會產(chǎn)生不良的影響。所以作為數(shù)據(jù)中心的管理人員一定要保持良好的心態(tài),以避免錯誤的發(fā)生。如果錯誤發(fā)生了,就從這些錯誤中吸取教訓(xùn),來防止以后再次發(fā)生這些錯誤。
以下是16個常見的數(shù)據(jù)中心管理存在的誤區(qū),這些誤區(qū)因為各種各樣的原因會存在于數(shù)據(jù)中心的日常管理和運行維護中,可能人們還沒有重視它們。所以數(shù)據(jù)中心的管理人員應(yīng)該重視它們并做好安全防范的工作。
16個最常見的數(shù)據(jù)中心管理誤區(qū)
這些誤區(qū)是沒有先后順序的,而且可能它也不是很詳盡的,但是它會提醒數(shù)據(jù)中心的管理人員,做好安全防范的工作。萬一錯誤出現(xiàn)了,后悔是來不及的。
錯誤一:沒有一個良好的電力使用規(guī)劃忘記了電力成本的巨額支出
數(shù)據(jù)中心的電力費用是整個數(shù)據(jù)中心日常開銷中最大的一部分,如果沒有一個良好的電力使用規(guī)劃,那么數(shù)據(jù)中心的財政支出就被浪費了不少。對于數(shù)據(jù)中心創(chuàng)造的業(yè)務(wù)價值來講,保持低成本的運行才是企業(yè)所樂意看到的。
錯誤二:沒有設(shè)計模塊化
如果你擁有一個現(xiàn)在最先進的數(shù)據(jù)中心,但是卻沒有部署模塊化的環(huán)節(jié),那么用不了幾年,這個數(shù)據(jù)中心就會被更先進的技術(shù)淘汰。所以為了適應(yīng)數(shù)據(jù)中心將來的發(fā)展,必須要部署模塊化。
錯誤三:沒有利用數(shù)據(jù)中心的設(shè)計和設(shè)施的優(yōu)勢,來幫助數(shù)據(jù)中心降低成本并更有效地運行。
有些數(shù)據(jù)中心不會利用自身的優(yōu)勢來降低成本并提高效率,例如,在冬天的時候可以利用室外的低溫改善制冷技術(shù),來達到節(jié)省冷卻成本的效果。
錯誤四:認為只有一個方法來設(shè)計或維護一個數(shù)據(jù)中心。
標準化的管理方案并非是最好的,最具成本效益的解決方案。雖然數(shù)據(jù)中心通常是相似的,但使用一個能夠適合企業(yè)理念和需要的管理方案才能使該數(shù)據(jù)中心發(fā)揮出最大的作用。所以,每個數(shù)據(jù)中心都應(yīng)該的定制一個屬于自己的管理方案。
錯誤5:工作人員的任用不當
數(shù)據(jù)中心必須要保證每個工作人員都能適合并勝任他們的工作,而且必須明確每個人所扮演的角色和應(yīng)該承擔的責任,并保證整個工作團隊的協(xié)作。
錯誤6:工作人員沒有得到適當?shù)呐嘤?xùn)和指導(dǎo)
如果數(shù)據(jù)中心的工作人員不能夠得到一些培訓(xùn)和指導(dǎo)的情況下,他們在面臨一些問題的時候會很難做出迅速的反應(yīng)。同時也可能不可避免的犯一些錯誤。所以,對員工做一些專業(yè)的培訓(xùn)和指導(dǎo)對于處理一些突發(fā)事件是一件很有必要的事情。
錯誤7:沒有關(guān)鍵環(huán)境工作許可
每個數(shù)據(jù)中心都必須對它的員工說明,哪些工作是具有危險性的。并且在進行那些具有危險性的操作時,為了為了防止以外的發(fā)生,工作人員必須要通過一個關(guān)鍵環(huán)境工作許可(CEWA)的認證。CEWA有不同的等級,對應(yīng)不同的風險水平,在高危險的水平下工作甚至需要行政授權(quán)。。每個外勤工作人員都應(yīng)該詳細地了解這些,來避免危險的發(fā)生。
錯誤8:沒有提醒數(shù)據(jù)中心的客戶會存在一些不可預(yù)見的狀況
在跟客戶的溝通上,一定要提醒客戶可能會存在一些不可預(yù)見的狀況,如自然災(zāi)害,停電等等。這樣可以使客戶能夠做好更充分的準備,并保證他們的業(yè)務(wù)不會因為這些突發(fā)狀況而受到影響。
錯誤9:沒有考慮氣候的因素
不管什么時候,數(shù)據(jù)中心的管理者都應(yīng)該注意氣候的變化,并做出相應(yīng)的舉措。例如,在夏季高溫的條件下,數(shù)據(jù)中心必須加強制冷系統(tǒng)的監(jiān)管,必要的情況下必須要擴大制冷系統(tǒng)來防止因為數(shù)據(jù)中心宕機而引起更大的損失。而在低溫的冬季,有些地區(qū)晚上甚至可以關(guān)閉精密空調(diào)冷卻系統(tǒng)而讓數(shù)據(jù)中心進入自由冷卻狀態(tài)。
錯誤10:數(shù)據(jù)中心和企業(yè)在發(fā)展目標上缺乏協(xié)調(diào)和溝通
數(shù)據(jù)中心的建設(shè)本身是為企業(yè)服務(wù)的,所以數(shù)據(jù)中心必須要和企業(yè)在長遠規(guī)劃上相一致。例如,引入綠色IT的戰(zhàn)略,建立綠色數(shù)據(jù)中心不單單是為了數(shù)據(jù)中心本身的考慮,更多的是考慮企業(yè)的社會形象。
錯誤11:一些關(guān)鍵性的重要設(shè)施上沒有標志
雖然這是一件小事,歐洲專利局的數(shù)據(jù)中心曾經(jīng)發(fā)生一起事故,其關(guān)鍵性的電力設(shè)施上沒有標志導(dǎo)致一位清潔工以外關(guān)閉了電源,結(jié)果使整個數(shù)據(jù)中心失去電力供應(yīng)。
錯誤12:沒有對數(shù)據(jù)中心進行升級和維護
如果數(shù)據(jù)中心缺少必要的升級和維護,不但工作效率上會降低,有時候也會因為設(shè)備陳舊而導(dǎo)致一些問題的產(chǎn)生,例如短路造成的停電。
錯誤13:沒有認識到網(wǎng)絡(luò)延遲和應(yīng)用延遲的不一致性
如果服務(wù)器的延遲增加了50毫秒,并不是意味著應(yīng)用程序的延遲也是增加了50毫秒。很多數(shù)據(jù)中心的管理人員并沒有意識到這一點。
錯誤14:忽視了一些安全問題
有些安全問題經(jīng)常被忽視,例如接地,靜電等等,不要把任何事情都視為理所當然。不要因為有了UPS,就忽視了防雷電路的監(jiān)測。所有的安全問題都必須要得到重視,不重視的后果往往是災(zāi)難性的。
錯誤15:過度依賴于環(huán)境監(jiān)測程序
不能只依賴于顯示器,如果事情不對勁,靠人來確定顯得更為可靠。如果UPS發(fā)出了一個奇怪的聲音,監(jiān)視器上是什么也看不到的,但這個問題很可能會導(dǎo)致一個致命的錯誤。所以,數(shù)據(jù)中心的管理工作必須要一絲不茍,一點都不能疏忽。
錯誤16:認為所有的網(wǎng)絡(luò)連接是平等的。
并不是所有的服務(wù)提供商提供的網(wǎng)絡(luò)都是一樣的。所以數(shù)據(jù)中心的管理者必須要確保他們的網(wǎng)絡(luò)服務(wù)提供商提供給他們的網(wǎng)絡(luò)是高效的,可以確保用戶獲得他們想要取得的數(shù)據(jù)和信息。
如何避免這16個最常見的數(shù)據(jù)中心管理的誤區(qū)
現(xiàn)在技術(shù)已經(jīng)發(fā)展到了這個地步,連汽車都有了自動導(dǎo)航防撞系統(tǒng)。那么,數(shù)據(jù)中心為什么不能避免錯誤的發(fā)生呢。其實許多很小的問題都是可以避免的,但就是因為這些小的問題,導(dǎo)致了數(shù)據(jù)中心的宕機,停電,甚至企業(yè)的癱瘓。
有一些數(shù)據(jù)中心曾經(jīng)發(fā)生過一些錯誤,導(dǎo)致了一些事故的發(fā)生。所以,每一個數(shù)據(jù)中心的管理人員很有必要去吸取這些經(jīng)驗教訓(xùn),來找出自己的不足,并加以改善。對于這些,有以下五個步驟,可以幫助數(shù)據(jù)中心的管理人員來更好的避免這些事故。
第1步:敢于承認自己的錯誤
用于承認自己的錯誤,并不意味著失敗。相反,它意味著對錯誤深刻的認識,以及改正這些錯誤的決心。所以,對于數(shù)據(jù)中心的管理人員來講,承認錯誤對于更好的管理數(shù)據(jù)中心是很有幫助的。
第2步:進行“災(zāi)難演習(xí)”
因為數(shù)據(jù)中心的事情一般不會發(fā)生,所以在安全的情況下,應(yīng)該進行突發(fā)事故的演習(xí)。只有經(jīng)歷的這些,工作人員才能夠突發(fā)事故出現(xiàn)的時候做出迅速的反應(yīng),來避免不必要的損失。
第3步:做出詳細的解決方案
這個解決方案包括使用的設(shè)備,解決的過程說明以及那些可能會發(fā)生故障的設(shè)施。這個解決方案可以作為工作人員的參考指南,并為每個新員工提供指導(dǎo)。
第4步:聽取第三方顧問的意見
在建設(shè)一個新的數(shù)據(jù)中心的時候,一定要仔細聽取第三方顧問的意見。這樣做,可以最大程度上了解潛在的問題。在建設(shè)的時候,可以通過第三方顧問了解到比承包商更多的設(shè)備來源并選取適當?shù)脑O(shè)備。在數(shù)據(jù)中心建成的時候,還可以通過第三方顧問來測試數(shù)據(jù)中心的安全性,并制定一個相應(yīng)的使用計劃。
第5步:勇敢的去改變。
雖然做出一些改變往往涉及到一些費用和時間,當如果發(fā)生了事故,損失往往會更大。