怪異的數據中心故障

責任編輯:cres

作者:harbor

2016-10-08 10:25:42

來源:企業(yè)網D1Net

原創(chuàng)

巨響、撞擊、颶風、太陽耀斑等都給數據中心帶來了災難,平時我們很少聽到這類故障,主要是這些故障發(fā)生的概率極低,甚至讓人覺得發(fā)生這些故障非常怪異。不過小概率并不等于不會發(fā)生。

數據中心里包含有大量的IT設備,運轉系統(tǒng)非常復雜,經常會出現這樣那樣的故障,就算一些著名的互聯網巨頭的數據中心也無法幸免。當然,數據中心可以通過部署很多備份技術,保證在出現故障時不至于影響運行的業(yè)務。數據中心故障產生的原因多種多樣,絕大多數故障讓人很容易理解,也可以通過采取一些補救措施,避免日后再出現,而有些數據中心故障產生的原因就非常怪異,讓人二丈和尚摸不到頭腦,故障的原因都有些無厘頭,本文就來講述幾例怪異的數據中心故障。聽到導致數據中心故障的這些原因,腦洞大開,只能感嘆數據中心故障防不勝防?。?
 
一聲巨響,數據中心應聲倒下
 
就在9月,一家羅馬尼亞銀行數據中心業(yè)務中斷了大約10個小時。數據中心在對消防系統(tǒng)進行測試時,打開了儲存有“煙烙盡”的鋼瓶,“煙烙盡”通過軟管和噴嘴均勻地噴灑在狹小空間,從而達到滅火功效。當氣體通過噴嘴釋放時,壓力過大,在釋放“煙烙盡”,最后發(fā)出了異常大的巨響,巨響超過了130分貝。這樣巨響引起了振動,結果聲音傳遞到存儲在數據中心硬盤的外殼,服務器和數據存儲設備都受到了影響,破壞了設備內部部件。這導致銀行的信用卡交易、ATM業(yè)務活動、在線銀行、電子郵件和銀行的官方網站都癱瘓掉了。我們經常抱怨數據中心機房內的噪聲太大,對人來說太吵了,對里面的設備又何嘗不是,這些設備長期忍受各種設備運行產生噪聲的影響。實際上,這些設備本身對噪聲也是比較敏感,尤其是這種突然的巨響,很容易造成內部電子元器件的失效,所以有必要在數據中心增加一些消聲設施,人長期處在嘈雜的環(huán)境中都會煩躁,電子設備也一樣,提供一個相對安靜的環(huán)境,有利于延長設備的使用壽命。
 
一輛SUV汽車引發(fā)的數據中心慘劇
 
2007年11月位于美國達拉斯的Rackspace公司數據中心遇到了一場無妄之災,故障使其業(yè)務在數小時內陷入了癱瘓。一位大型四驅車司機,由于糖尿病病發(fā)而出現短暫昏迷,當時他正在開車,汽車一路向前直沖,并從丁字路口處撞向路邊外側的護堤。護提被撞擊后,沖向空中,并落在了Rackspace公司的數據中心建筑物上,恰好砸在了供電裝置上,一陣火光帶閃電之后,數據中心電力供應中斷了。此類極為罕見的外來因素所導致的停機事故,Rackspace公司為此次事故向客戶支付了350萬美元賠償金,同時還增加了客戶流失的風險。數據中心建筑物可抗擊八級地震,卻沒有抵住一輛SUV汽車的誤撞,確切地說還不是直接撞擊。數據中心有很多的內外通道,這些管道也一定要保護好,具有一定的抗震、抗撞、防火能力,避免遇到這樣的意外故障。
 
颶風吹停了數據中心發(fā)電機
 
2012年10月位于美國紐約曼哈頓地區(qū)的一處數據中心整套供電系統(tǒng)失效,原因是肆虐一時的颶風桑迪襲擊了曼哈頓。在數據中心的十八層擺放有用于持續(xù)提供電力且不至于受到洪水影響的多臺備用發(fā)電機,但風暴來襲時直接灌滿了該數據中心建筑的地下室,并且摧毀了應急發(fā)電機的燃油泵送系統(tǒng),遭到海水浸泡的整套電路立刻失去了作用,備用發(fā)電系統(tǒng)失效,而十八層電力采用的是市電,當颶風來襲造成整個曼哈頓市電系統(tǒng)故障,數據中心主備供電均故障,造成數據中心斷電,所有應用系統(tǒng)無法運行。
 
太陽耀斑事件
 
在1989年太陽耀斑定向瞄準了加拿大魁北克水電電網,導致電網電壓振蕩,造成跳閘保護設備啟用,幾乎造成東北地區(qū)電力協(xié)調委員會(NPCC)和中大西洋區(qū)議會(MAAC)崩潰。Public Service Gas & Electric旗下新澤西州的一個核電站,造成發(fā)電機升壓變壓器的永久性損壞,無法提供服務。雖然強烈的太陽耀斑/日冕物質拋射比較罕見,但不可否認它對于數據中心和電網是一個毀滅性的災難。太陽耀斑是一種最劇烈的太陽活動,周期約為11年,通過高速度產生強磁場的過程中發(fā)出的帶電粒子,如果擊中地球,就會產生令人驚嘆的現象,同時肆虐電力系統(tǒng),如果擊中數據中心的供電系統(tǒng),數據中心一定吃不消了,這屬于小概率事件,但一旦發(fā)生就是致命的。早在1859年,曾經發(fā)生過一次太陽耀斑故障,即所謂卡林頓事件,這次太陽耀斑讓全球的電報系統(tǒng)都失控。太陽耀斑拋射定期發(fā)生,如果從這些太陽系列活動沖擊數據中心磁場,數據中心可能會遇到大范圍的電涌和停電。
 
巨響、撞擊、颶風、太陽耀斑等都給數據中心帶來了災難,平時我們很少聽到這類故障,主要是這些故障發(fā)生的概率極低,甚至讓人覺得發(fā)生這些故障非常怪異。不過小概率并不等于不會發(fā)生。我們知道,按照發(fā)生概率來講,飛機是非常安全的一種交通工具,但是每年還是會發(fā)生墜機事故,和每年數千萬次的航班數量相比,發(fā)生概率不到萬分之一,可一旦發(fā)生就是造成嚴重的人員傷亡,這讓我們不得不對這些小概率事件非常謹慎。一旦這樣的故障發(fā)生到某一個數據中心身上,也許這個數據中心就會從地球上消失。這些導致故障的根源很多時候還是可以通過優(yōu)化加以避免,比如:對于撞擊,我們可以對數據中心外圍和建筑組樓頂進行加固,避免撞擊給數據中心帶來傷害;對于巨響,我們可以在數據中心機房外部增加消聲裝置,增加建筑物墻體厚度,這樣不僅可以防止噪聲進入數據中心機房內部,對設備造成傷害,還可以避免內部設備運行產生的噪聲向外傳遞,以免擾民。所以,針對這些怪異的數據中心故障原因,通過采用一些常規(guī)的防護措施,就可以避免。

鏈接已復制,快去分享吧

企業(yè)網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號