本文作者Dave King是Future Facilities公司的產(chǎn)品經(jīng)理。
據(jù)說,計算流體動力學(CFD,Computational Fluid Dynamics)提供了關于數(shù)據(jù)中心氣流的歷史視圖信息,但到了報告生成時,這些視圖信息可能已經(jīng)過時了。這種將CFD視圖作為過去的快照的方法錯失了技術(預測的)的真正力量;而這一糟糕的思維方式,似乎在行業(yè)內(nèi)還頗有市場。我曾經(jīng)與數(shù)據(jù)中心操作運營人員們在各種不同的會議上進行過無數(shù)次的溝通交流,而這些數(shù)據(jù)中心操作運營人員一直在抱怨說,“為什么我需要有人來進行CFD研究,然后告訴我數(shù)據(jù)中心基礎設施兩個星期前的狀況呢?我通過傳感器就可以及時掌握基礎設施當前的狀況了呀。”產(chǎn)生這種感覺并不是偶然的。
CFD開始進入數(shù)據(jù)中心領域
CFD最初進入數(shù)據(jù)中心領域大約是在10至15年前。彼時,數(shù)據(jù)中心的功率密度才剛剛開始上升。當IT設備由于過熱問題而發(fā)生故障運行失敗時,數(shù)據(jù)中心運營人員們發(fā)現(xiàn)很難理解其中的原因所在,因為他們?nèi)狈ο鄳臄?shù)據(jù)來分析這些問題。而這就是CFD的來源:操作運營人員聘請相關的工程顧問來模擬他們的基礎設施,告訴他們究竟出了什么問題。
大約三個星期后,這些聘請的工程顧問將返回一份報告,該報告顯示了基礎設施中的環(huán)境。不變的是,這些報告將包含溫度面板或顯示周圍環(huán)境的溫度視圖。
對于許多操作運營人員而言,這是他們第一次實現(xiàn)了對于其基礎設施環(huán)境的可視化。通常,這是第一次能夠看到相應的條件在數(shù)據(jù)中心操作空間內(nèi)的變化,提供了巨大的價值。
此外,CFD模擬允許跟蹤問題的來源,深入了解基礎設施的運行情況。工程顧問們將與運營人員合作,以找到解決方案,然后在執(zhí)行該方案之前在模型中進行模擬顯示,充分利用該技術的預測功能。
開發(fā)實時數(shù)據(jù)
隨著時間的推移,市場上開始出現(xiàn)了能夠讓操作運營人員們實時看到數(shù)據(jù)中心中所發(fā)生的情況的監(jiān)控系統(tǒng)。這些系統(tǒng)的制造商們必須找到一種以簡單易懂的方式呈現(xiàn)來自許多(可能至少100個)單個傳感器的數(shù)據(jù)的方式。他們選擇使用一種稱為插值的過程來嘗試加入傳感器之間的點,并創(chuàng)建操作溫度視圖,這看起來非常像操作運營人員們曾經(jīng)看到的CFD模型的輸出。
在這一點上,考慮一下當操作運營人員們在執(zhí)行CFD分析時,所提出的主要問題真正意味著什么是值得的:我企業(yè)的數(shù)據(jù)中心到底發(fā)生了什么?他們可能已經(jīng)獲得了關于為什么會發(fā)生這類情況的答案;以及如果數(shù)據(jù)中心執(zhí)行了從CFD模型中所獲得的益處,會發(fā)生什么情況的答案,但這并不是思維過程的主要推動力。就市場而言,由已經(jīng)使用的監(jiān)測系統(tǒng)所提供的溫度視圖就可以回答這個問題,而不需要專門聘請一名昂貴的顧問。其還有一項額外的好處是,能夠顯示當前發(fā)生的事情,而不是三個星期前的。
我們當前的發(fā)展階段
使用CFD作為工具來獲取其基礎設施中所發(fā)生的情況的快照的數(shù)據(jù)中心操作運營人員得出了一套結論,即:他們可以通過現(xiàn)代監(jiān)測技術實時獲得幾乎相同的信息,而無需花費額外的費用(然而,CFD分析將總是能夠給你比監(jiān)控系統(tǒng)更多的信息)。因此,CFD將被刪除,因為其不再是必要的。
我對此表示贊同。
與監(jiān)控系統(tǒng)相比,如果您用來為您的數(shù)據(jù)中心的操作環(huán)境條件進行快照,那么CFD是昂貴和麻煩的。但有一點需要注意的是:CFD真正的益處在于其能夠回答“為什么”及“如果”的假設場景的能力。
監(jiān)控系統(tǒng)的引入允許數(shù)據(jù)中心的性能得到大幅改進,因為在運營過程中當發(fā)生超出限制的情況時,其能夠向運營人員們顯示出來。并非提供相同的數(shù)據(jù),CFD建模能夠添加新的信息到操作人員的資源庫。使得未來的計劃可以進行壓力測試和優(yōu)化,而這是任何其他技術所無法做到的。這樣做將允許進一 步推進數(shù)據(jù)中心的封裝,能夠利用更多的容量,并充分利用冷卻系統(tǒng)的效率,而不會給IT負載帶來風險。
案例研究:金融機構
為了說明借助其可以實現(xiàn)的目標,我想在接下來分享一個例證。該項目的目標是分離大約150臺舊的直接冷卻的前端為玻璃材質(zhì)的機柜,并將這些機柜更換為更現(xiàn)代的熱通道/冷通道布置,以便能夠更好地利用可用的冷卻。這相當于該處數(shù)據(jù)中心設施中大約50%的服務器機柜。同時,額外的200kW的工作負載將被從其他站點的服務器機房遷移到大廳,使得負載總數(shù)將從900kW增加到1.1MW。工作將在20個周末進行,使得數(shù)據(jù)中心的其余能夠保持功能的完整和彈性。
首先,我們模擬了前20個階段的每一個的終點,以確保計劃是健全的。這項步驟突出了在地板上的許多電纜托盤需要被移除,因為它們將直接位于新的冷通道下方,會影響到氣流。
然而,真正有趣的部分是:一旦工作開始上馬后(而且情況往往總是如此),實際工作進程很快偏離了原來的計劃,因為應用程序必須在計劃移動時保持運行。我們與項目團隊現(xiàn)場合作,利用每個周末實際完成的工作和下周末的新計劃更新CFD模型。之后,我們運行了一個新的模擬,為遷移團隊提供每臺新的機柜的安全負載限制。這些每周的安全限值通常明顯小于每臺機柜的最終設計負載。
該項目在計劃預計的時間內(nèi)完成,沒有發(fā)生一次單一的熱停機(thermal shutdown)。這是因為遷移團隊知道確切的限制在哪里,并且可以放心地接近該限制,因為以前已經(jīng)模擬了每種情況。在不使用模擬的情況下,不會出現(xiàn)這種情況,并且將會超過限制(導致熱停機)或每周安裝的設備更少(延長項目執(zhí)行的時長)。
互補而不競爭
CFD所提供的數(shù)據(jù)可以使數(shù)據(jù)中心性能實現(xiàn)增加監(jiān)控系統(tǒng)在過去十年中所能夠實現(xiàn)的的相同飛躍。雖然市場有良好的理由將CFD和監(jiān)控視為互相競爭的技術,但它們實際上是完全互補的。隨著數(shù)據(jù)中心操作運營人員們被要求以更少的成本做更多的事情,他們將需要這二者的協(xié)調(diào)努力來實現(xiàn)他們的業(yè)務目標。