改進(jìn)數(shù)據(jù)中心風(fēng)險(xiǎn)管理的三個(gè)步驟

責(zé)任編輯:cres

作者:Dipti Parmar

2021-12-15 13:52:02

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

由于新的應(yīng)用程序以及終端用戶計(jì)算和移動(dòng)解決方案中的新興需求,數(shù)據(jù)中心的運(yùn)營變得越來越復(fù)雜,導(dǎo)致出現(xiàn)更多的內(nèi)部和外部風(fēng)險(xiǎn),因此企業(yè)需要識(shí)別和降低數(shù)據(jù)中心運(yùn)營風(fēng)險(xiǎn)的方法。

數(shù)據(jù)中心在現(xiàn)代企業(yè)運(yùn)營的業(yè)務(wù)中仍然至關(guān)重要,因此企業(yè)需要識(shí)別和降低數(shù)據(jù)中心運(yùn)營風(fēng)險(xiǎn)的方法。
 
隨著云計(jì)算的興起,一些IT傳道者、首席信息官和大型技術(shù)研究公司在5年前預(yù)言數(shù)據(jù)中心即將消亡。行業(yè)專家Mark Settle當(dāng)時(shí)提出建議,企業(yè)關(guān)閉內(nèi)部部署數(shù)據(jù)中心需要深思熟慮,并預(yù)測數(shù)據(jù)中心的業(yè)務(wù)將隨著數(shù)據(jù)量的增長而繼續(xù)增長。
 
如今,數(shù)據(jù)中心不僅繼續(xù)存在,而且在與混合云和多云的市場競爭中蓬勃發(fā)展。不僅如此,數(shù)據(jù)中心還可以滿足與邊緣計(jì)算、物聯(lián)網(wǎng)和5G等新興技術(shù)相關(guān)的服務(wù)需求。
 
由于這些新的應(yīng)用程序以及終端用戶計(jì)算(EUC)和移動(dòng)解決方案中的新興需求,數(shù)據(jù)中心的運(yùn)營變得越來越復(fù)雜,導(dǎo)致出現(xiàn)更多的內(nèi)部和外部風(fēng)險(xiǎn)。停機(jī)是一種持續(xù)性風(fēng)險(xiǎn),每次停機(jī)事件的平均損失高達(dá)每分鐘11000美元。
 
以下是企業(yè)識(shí)別和降低數(shù)據(jù)中心運(yùn)營風(fēng)險(xiǎn)的三個(gè)步驟。
 
1.采用綜合方法進(jìn)行風(fēng)險(xiǎn)管理
 
2021年2月,德克薩斯州遭遇的冬季風(fēng)暴以及隨后導(dǎo)致的大面積停電,對(duì)該州的數(shù)據(jù)中心來說是一次嚴(yán)峻的考驗(yàn)。雖然沒有發(fā)生大規(guī)模故障,但電氣故障切換系統(tǒng)存在重大問題。
 
從功能的角度來看,數(shù)據(jù)中心是運(yùn)行業(yè)務(wù)關(guān)鍵型應(yīng)用程序的物理設(shè)施;而從業(yè)務(wù)的角度來看,它們是需要進(jìn)行預(yù)算和管理的不動(dòng)產(chǎn)或資本資產(chǎn)。
 
關(guān)鍵是,單點(diǎn)故障可能(而且經(jīng)常會(huì))導(dǎo)致數(shù)據(jù)中心的運(yùn)營中斷,從而導(dǎo)致收入損失。這就是需要一個(gè)適用于整個(gè)企業(yè)的普遍風(fēng)險(xiǎn)管理計(jì)劃和政策的原因。
 
這也是綜合風(fēng)險(xiǎn)管理(IRM)發(fā)揮重要作用的地方。調(diào)研機(jī)構(gòu)Gartner公司將綜合風(fēng)險(xiǎn)管理(IRM)定義為“由風(fēng)險(xiǎn)意識(shí)文化和支持技術(shù)支持的一組實(shí)踐和流程,通過對(duì)企業(yè)如何管理其獨(dú)特風(fēng)險(xiǎn)的綜合視圖來改進(jìn)決策制定和性能。”
 
在后疫情時(shí)代,實(shí)施遠(yuǎn)程工作、BYOD、CYOD和其他工作場所實(shí)踐變革的企業(yè)正在將其數(shù)字化轉(zhuǎn)型戰(zhàn)略與IT基礎(chǔ)設(shè)施升級(jí)相結(jié)合,以識(shí)別和緩解自然災(zāi)害、供應(yīng)鏈、數(shù)據(jù)處理以及商業(yè)模式所固有的風(fēng)險(xiǎn)。
 
如果企業(yè)正在實(shí)施數(shù)字化轉(zhuǎn)型,則需要監(jiān)控可能影響數(shù)據(jù)中心的每個(gè)流程和因素(外部或內(nèi)部),并準(zhǔn)備好應(yīng)對(duì)由一個(gè)或多個(gè)事件同時(shí)發(fā)生的多重風(fēng)險(xiǎn)。
 
數(shù)字化轉(zhuǎn)型不僅適用于嚴(yán)重依賴數(shù)據(jù)或技術(shù)的企業(yè)——它同樣適用于疫情之后開展遠(yuǎn)程工作的中小企業(yè),包括那些開始使用公有云替代數(shù)據(jù)中心的企業(yè)。
 
甚至政府部門也在認(rèn)真對(duì)待數(shù)字化轉(zhuǎn)型——利用云計(jì)算技術(shù)改造數(shù)據(jù)中心基礎(chǔ)設(shè)施是他們的兩個(gè)中心目標(biāo)之一(改善在線用戶體驗(yàn)是另一個(gè)目標(biāo))。
 
Jeff Shupack說:“數(shù)據(jù)中心優(yōu)化是《美國聯(lián)邦信息技術(shù)收購改革法案》中記分卡的一個(gè)關(guān)鍵衡量指標(biāo)。該衡量指標(biāo)部分反映了政府機(jī)構(gòu)基礎(chǔ)設(shè)施利用云計(jì)算的程度。” Jeff Shupack是一名數(shù)字化轉(zhuǎn)型專家,在通過精益敏捷實(shí)施降低全球資本計(jì)劃風(fēng)險(xiǎn)方面具有15年的實(shí)踐經(jīng)驗(yàn)。
 
很多企業(yè)正在認(rèn)識(shí)到,敏捷方法、大數(shù)據(jù)分析、移動(dòng)解決方案和DevOps與可靠的、升級(jí)的數(shù)據(jù)中心協(xié)同工作,可以有效地預(yù)防風(fēng)險(xiǎn)、充分地應(yīng)對(duì)風(fēng)險(xiǎn)和快速地恢復(fù)災(zāi)難。因此,他們正在轉(zhuǎn)向能夠在混合IT基礎(chǔ)設(shè)施中實(shí)施這些最佳實(shí)踐的框架,以確保業(yè)務(wù)連續(xù)性、減少運(yùn)營成本,并改善數(shù)字客戶體驗(yàn)。
 
2.了解風(fēng)險(xiǎn)
 
無論企業(yè)的風(fēng)險(xiǎn)管理計(jì)劃多么全面,其發(fā)展速度永遠(yuǎn)不會(huì)超過技術(shù)進(jìn)步。新技術(shù)和新的工作方式正在創(chuàng)造前所未有的復(fù)雜性。以下是數(shù)據(jù)中心面臨的不同類型的風(fēng)險(xiǎn)。
 
(1)IT安全性不足
 
可以說,如今數(shù)據(jù)中心面臨的最大風(fēng)險(xiǎn)是網(wǎng)絡(luò)安全漏洞,從DoS攻擊、社交工程到數(shù)據(jù)盜竊,都有可能發(fā)生。2021年,每個(gè)數(shù)據(jù)泄露事件造成的平均損失為424萬美元,這是17年來最高的記錄。
 
應(yīng)用程序和系統(tǒng)故障也會(huì)對(duì)物理安全方面產(chǎn)生影響,導(dǎo)致身份無法驗(yàn)證、網(wǎng)絡(luò)連接中斷、授權(quán)人員無法進(jìn)入特定區(qū)域等情況。
 
(2)系統(tǒng)故障
 
沒有彈性架構(gòu)以及沒有連續(xù)的、冗余的、高帶寬的網(wǎng)絡(luò)連接,數(shù)據(jù)中心的運(yùn)營注定要失敗。服務(wù)器、網(wǎng)絡(luò)設(shè)備和相關(guān)設(shè)備都需要集群、鏡像和復(fù)制等功能,以減少停機(jī)的機(jī)會(huì)。
 
應(yīng)用程序或軟件(如管理程序) 有時(shí)會(huì)發(fā)生故障,導(dǎo)致服務(wù)器或網(wǎng)絡(luò)癱瘓。因此需要確保所有應(yīng)用程序在混合基礎(chǔ)設(shè)施上無縫工作,并與云原生應(yīng)用程序進(jìn)行對(duì)話。
 
(3)電源故障
 
盡管這種情況極其罕見,但電力故障確實(shí)會(huì)發(fā)生——主要是自然災(zāi)害帶來的后果。需要為數(shù)據(jù)中心的所有機(jī)架和冷卻系統(tǒng)配備UPS電源或備用發(fā)電機(jī)路。數(shù)據(jù)中心與多個(gè)變電站的直接連接有助于防止受到本地變電站停電的影響。
 
(4)漏水
 
洪水或滲水可能會(huì)給數(shù)據(jù)中心帶來災(zāi)難。然而,維護(hù)良好的管路和排水系統(tǒng)對(duì)消防控制和冷卻系統(tǒng)至關(guān)重要。
 
(5)噪音
 
數(shù)據(jù)中心面臨的一個(gè)鮮為人知但卻十分嚴(yán)重的風(fēng)險(xiǎn)是長期暴露在高頻噪音中,這會(huì)降低存儲(chǔ)系統(tǒng)的效率,降低讀/寫性能,并最終影響數(shù)據(jù)完整性。數(shù)據(jù)中心應(yīng)該建在遠(yuǎn)離運(yùn)動(dòng)場、消防站、機(jī)場等地方,并部署在使用聲學(xué)抑制技術(shù)的建筑物內(nèi)。
 
(6)火災(zāi)
 
電源尖峰和電氣短路是數(shù)據(jù)中心火災(zāi)的常見原因。如果不迅速控制,火災(zāi)可以在幾分鐘內(nèi)摧毀數(shù)據(jù)中心IT硬件。具有諷刺意味的是,空調(diào)和冷卻系統(tǒng)將會(huì)消散火災(zāi)產(chǎn)生的煙霧,使火災(zāi)早期探測變得更加困難。因此需要使用帶有光電傳感器的煙霧探測系統(tǒng),以持續(xù)監(jiān)測數(shù)據(jù)中心的空氣中是否有煙霧。
 
(7)糟糕的災(zāi)難恢復(fù)規(guī)劃
 
雖然數(shù)據(jù)備份目前是一個(gè)非常簡單的過程,但出于安全性和性能的綜合考慮,數(shù)據(jù)中心比公有云更受歡迎——希望在系統(tǒng)故障時(shí)能夠立即恢復(fù)事務(wù)性數(shù)據(jù)。
 
當(dāng)然,這取決于業(yè)務(wù)的性質(zhì)和監(jiān)管框架等因素。所以更有理由為每個(gè)不同的故障事件制定明確的恢復(fù)計(jì)劃;計(jì)算、存儲(chǔ)或網(wǎng)絡(luò)資源也是如此。
 
大多數(shù)先進(jìn)的災(zāi)難恢復(fù)計(jì)劃都有監(jiān)控系統(tǒng),可以跟蹤影響數(shù)據(jù)中心的風(fēng)險(xiǎn)因素,并在超過關(guān)鍵閾值時(shí)發(fā)出警報(bào)。
 
3.在管理風(fēng)險(xiǎn)之前評(píng)估風(fēng)險(xiǎn)
 
所有的風(fēng)險(xiǎn)并不都是相同的。雖然數(shù)據(jù)中心面臨著各種風(fēng)險(xiǎn),特別是不同的垂直領(lǐng)域,但最終使用的風(fēng)險(xiǎn)緩解技術(shù)不一定需要針對(duì)數(shù)據(jù)中心環(huán)境進(jìn)行定制。
 
因此,數(shù)據(jù)中心運(yùn)營商需要制定風(fēng)險(xiǎn)管理計(jì)劃,列出數(shù)據(jù)中心可能面臨的所有風(fēng)險(xiǎn),并指定對(duì)每種風(fēng)險(xiǎn)事件的響應(yīng)。
 
首先進(jìn)行風(fēng)險(xiǎn)審計(jì)——對(duì)所有擁有和運(yùn)營的數(shù)據(jù)中心設(shè)施進(jìn)行全面評(píng)估。評(píng)估影響設(shè)施設(shè)計(jì)、IT基礎(chǔ)設(shè)施和運(yùn)營流程的因素。
 
如果過去發(fā)生過重大事故或中斷,那么可以進(jìn)行根本原因分析來解決沒有解決的問題??梢宰鲂┦裁磥泶_保在類似的情況下不會(huì)再次出現(xiàn)停機(jī)。
 
此外,如果使用具有多個(gè)數(shù)據(jù)中心和云計(jì)算系統(tǒng)的混合架構(gòu),需要單獨(dú)審核每個(gè)數(shù)據(jù)中心以及它們之間的數(shù)據(jù)路徑和連接。
 
如果在金融和醫(yī)療保健等監(jiān)管嚴(yán)格的行業(yè)中運(yùn)營,則需要將定期數(shù)據(jù)中心風(fēng)險(xiǎn)評(píng)估和災(zāi)難測試作為日常運(yùn)營的一部分。
 
與其他事項(xiàng)一樣,需要?jiǎng)?chuàng)建框架、政策或備忘單提供適用于數(shù)據(jù)中心運(yùn)營商的風(fēng)險(xiǎn)類別、每個(gè)類別影響的系統(tǒng)、估算損壞和恢復(fù)成本,以及發(fā)生事故或?yàn)?zāi)難時(shí)應(yīng)遵循協(xié)議的現(xiàn)成參考。
 
例如,IT咨詢機(jī)構(gòu)凱捷公司采用了一種不斷發(fā)展的風(fēng)險(xiǎn)管理方法,該方法識(shí)別并量化風(fēng)險(xiǎn)及其緩解成本。凱捷公司高級(jí)交付中心經(jīng)理Kevin Read表示:“我們已經(jīng)建立了一個(gè)月度風(fēng)險(xiǎn)管理系統(tǒng),記錄所有風(fēng)險(xiǎn)和問題,并制定行動(dòng)計(jì)劃。如果需要更改,將提供投資預(yù)算。”
 
如何消除停機(jī)時(shí)間
 
數(shù)據(jù)中心(甚至是企業(yè)的整個(gè)IT基礎(chǔ)設(shè)施)永遠(yuǎn)不會(huì)孤立地運(yùn)行,數(shù)據(jù)中心大量組件正在全天候運(yùn)轉(zhuǎn)。
 
IT基礎(chǔ)設(shè)施的風(fēng)險(xiǎn)緩解是一個(gè)共同的責(zé)任,而不僅僅是首席信息官或首席技術(shù)官的責(zé)任。企業(yè)需要有足夠數(shù)量的受過培訓(xùn)的IT人員,他們愿意盡一切可能掌握數(shù)據(jù)中心的運(yùn)營。
 
Tenable公司產(chǎn)品營銷副總裁Gavin Millard給大家的建議是:“沖突的目標(biāo)可能很難解決,最有效的方法之一是建立一個(gè)高效的流程,持續(xù)識(shí)別風(fēng)險(xiǎn)所在。還需要一個(gè)可預(yù)測、可靠的方法來更新系統(tǒng),而不會(huì)影響企業(yè)的總體業(yè)務(wù)目標(biāo)。”
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)