數(shù)據(jù)中心出了故障,到底該怪誰(shuí)?

責(zé)任編輯:vivian

2012-04-01 08:46:13

摘自:51CTO

數(shù)據(jù)中心里面的系統(tǒng)出現(xiàn)故障總是有其理由的,而掌權(quán)者們通常能找到背黑鍋的對(duì)象——無(wú)論這個(gè)人是IT操作工作人員、原始設(shè)備制造商(OEM)廠商、系統(tǒng)集成商,還是第三方服務(wù)提供商。

分析導(dǎo)致數(shù)據(jù)中心事件的故障可能會(huì)讓內(nèi)部的IT操作人員與承包商和供應(yīng)商互掐。

數(shù)據(jù)中心里面的系統(tǒng)出現(xiàn)故障總是有其理由的,而掌權(quán)者們通常能找到背黑鍋的對(duì)象——無(wú)論這個(gè)人是IT操作工作人員、原始設(shè)備制造商(OEM)廠商、系統(tǒng)集成商,還是第三方服務(wù)提供商。

犯事者常常會(huì)留下清晰可見(jiàn)的指紋,比如給部件貼錯(cuò)標(biāo)簽,或者沒(méi)有更新流程。一些事件顯然是由于多個(gè)有關(guān)方的疏忽大意。

Uptime Institute是一家專業(yè)組織,其成員包括來(lái)自多個(gè)行業(yè)的數(shù)據(jù)中心管理人員。近20年來(lái),它一直在收集和研究數(shù)據(jù)中心事件方面的數(shù)據(jù),現(xiàn)得出了這個(gè)結(jié)論:絕大多數(shù)問(wèn)題是由外面的有關(guān)方引起的,比如承包商或供應(yīng)商;比較少但仍相當(dāng)多的一部分歸咎于內(nèi)部的IT工作人員。

自1994年以來(lái),Uptime收集了關(guān)于大約5000起異常事件的數(shù)據(jù);按它的定義,異常事件是指,某一個(gè)設(shè)備或基礎(chǔ)架構(gòu)部件沒(méi)有按預(yù)計(jì)的方式正常運(yùn)行。事件報(bào)告由Uptime的成員們主動(dòng)上報(bào)。

Uptime表示,它在分析后發(fā)現(xiàn),歸因于操作人員的異常事件所占的百分比在2009年是34%,2010年是41%,去年是40%。

在2009年到2011年報(bào)告的事件中,50%至60%歸咎于處理客戶數(shù)據(jù)中心或?yàn)榭蛻魯?shù)據(jù)中心供應(yīng)設(shè)備的第三方操作人員,比如制造商、供應(yīng)商、廠方代表、安裝人員和集成人員。

這一分析可能面臨遭到各方的抨擊,因?yàn)閮?nèi)部的IT操作人員或數(shù)據(jù)中心供應(yīng)商都不容易背黑鍋,除非故障事件影響了企業(yè)收入。

比如說(shuō),艾默生網(wǎng)絡(luò)能源公司Liebert服務(wù)部門(mén)的電力技術(shù)支持主管Ahmad Moshiri表示,在一些情況下,供應(yīng)商的確因他們覺(jué)得是內(nèi)部IT操作人員疏忽引起的問(wèn)題而背黑鍋。

他說(shuō):“供應(yīng)商處在敏感的位置。它不想讓客戶(數(shù)據(jù)中心管理人員)處于難堪的境地。這非常棘手。”

Uptime表示,它還發(fā)現(xiàn),在最糟糕的異常事件中——導(dǎo)致系統(tǒng)或數(shù)據(jù)中心停運(yùn)的事件,絕大多數(shù)(60%)歸因于內(nèi)部的IT操作人員。

Uptime的研究和教育執(zhí)行負(fù)責(zé)人Hank Seader表示,那些結(jié)果同樣可能具有誤導(dǎo)性。Seader說(shuō):“扔香蕉皮的常常是設(shè)計(jì)、制造和安裝方面的流程,而在香蕉皮上摔倒的是操作人員。”

David Filas是總部設(shè)在密歇根州諾維的醫(yī)療服務(wù)機(jī)構(gòu)Trinity Health的數(shù)據(jù)中心工程師,他補(bǔ)充說(shuō):“工程師、架構(gòu)師和安裝承包商的設(shè)計(jì)和行動(dòng)對(duì)數(shù)據(jù)中心的操作可能會(huì)有潛伏的影響,哪怕數(shù)據(jù)中心興建后已過(guò)了很久。外部因素完全如同內(nèi)部因素一樣很容易事關(guān)數(shù)據(jù)中心的成敗。”

他特別指出,Trinity Health挨過(guò)了一次數(shù)據(jù)中心停運(yùn)事件;之所以會(huì)出現(xiàn)那次停運(yùn)事件,是由于早幾年在興建數(shù)據(jù)中心,緊急斷電旁路電路并沒(méi)有嚴(yán)格按規(guī)格來(lái)制造。

Filas表示,IT部門(mén)更依賴承包商來(lái)制造或更新數(shù)據(jù)中心,這加大了出現(xiàn)問(wèn)題的風(fēng)險(xiǎn)。

他表示,比如說(shuō),電氣承包商可能不了解某個(gè)數(shù)據(jù)中心的具體要求。他補(bǔ)充說(shuō):“有人經(jīng)常問(wèn)我們,我們?yōu)槭裁匆獮閿?shù)據(jù)中心機(jī)架提供冗余電源。”

艾默生公司的Moshiri提到流程和程序方面的問(wèn)題是導(dǎo)致數(shù)據(jù)中心出現(xiàn)問(wèn)題的主要根源,如果涉及多家供應(yīng)商、需要高度協(xié)調(diào)時(shí)更是如此。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)