數(shù)據(jù)中心新技術(shù)遇故障分析陷入無解境地的根因

責任編輯:wendy

作者:harbor

2014-08-15 15:00:15

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

近幾年,數(shù)據(jù)中心領(lǐng)域涌現(xiàn)了不少的新技術(shù)。TRILL、VXLAN、FCOE、EVI、EVB等等,這些技術(shù)讓人看得眼花繚亂,很多數(shù)據(jù)中心也敢于嘗試這些新技術(shù),希望通過這些新技術(shù)增強數(shù)據(jù)中心的競爭力。

企業(yè)網(wǎng)D1Net 8月15日 近幾年,數(shù)據(jù)中心領(lǐng)域涌現(xiàn)了不少的新技術(shù)。TRILL、VXLAN、FCOE、EVI、EVB等等,這些技術(shù)讓人看得眼花繚亂,很多數(shù)據(jù)中心也敢于嘗試這些新技術(shù),希望通過這些新技術(shù)增強數(shù)據(jù)中心的競爭力?,F(xiàn)在國內(nèi)已經(jīng)開始出現(xiàn)了這些新技術(shù)的部署,F(xiàn)COE技術(shù)甚至在很多數(shù)據(jù)中心都已經(jīng)普遍出現(xiàn),TRILL和VXLAN也有一些實際應用。當數(shù)據(jù)中心使用上這些技術(shù)時,才發(fā)現(xiàn)根本不是那么簡單的事兒。很多專家學者紛紛對這些新技術(shù)不惜發(fā)出贊美之詞,也在推動這些新技術(shù)的落地。但是當這些技術(shù)真正落地時,這些專家學者也幫不上忙,還是需要數(shù)據(jù)中心自己去解決面臨的各種實際問題。這就像國家高層機構(gòu)制定的各種政策,出發(fā)點都是好的,但是執(zhí)行起來需要基層的實施,遇到的困難就不少。那么對于這些新技術(shù)在數(shù)據(jù)中心應用面臨著哪些問題呢,本文將一一道來。

這些技術(shù)之所以新就在于提出的時間都比較短,有的協(xié)議甚至還沒有形成標準,只是存在一些草案,標準的不統(tǒng)一使得諸多網(wǎng)絡廠商在協(xié)議實現(xiàn)的時候就會有所差異。網(wǎng)絡領(lǐng)域歷來就是信息技術(shù)里最封閉的一個行業(yè),很多廠商尤其的巨頭廠商都喜歡搞一些個性化的技術(shù),在滿足客戶差異化的需求基礎(chǔ)之上,形成了自己的一套封閉技術(shù)體系,這樣的封閉技術(shù)不利于整個行業(yè)的技術(shù)發(fā)展。這樣的現(xiàn)實情況就導致新的技術(shù)在數(shù)據(jù)中心實施時,各個廠家實現(xiàn)標準有差異,設(shè)備對接會出現(xiàn)各種各樣的問題?,F(xiàn)在的數(shù)據(jù)中心里是很難找到服務器全是一個品牌或者網(wǎng)絡設(shè)備全是一個品牌的,這就讓新技術(shù)面臨著各種對接實現(xiàn)的問題。而且這類問題,雙方設(shè)備廠商都說自己的實現(xiàn)有道理,沒有問題,因為協(xié)議本身還沒有一個行業(yè)標準,就算有標準,具體實現(xiàn)上也可能會有差異。這就讓新技術(shù)在數(shù)據(jù)中心實施時困難特別不好解決,廠商之間互相推諉。一些大型的數(shù)據(jù)中心因采購量大,廠商還能夠積極配合,對于中小型數(shù)據(jù)中心就沒有那么幸運了。遇到這樣的問題,數(shù)據(jù)中心新技術(shù)就無法快速的實施,甚至最終導致項目流產(chǎn)。

除了新技術(shù)標準不一的問題,數(shù)據(jù)中心自己也有不少問題。由于新協(xié)議,數(shù)據(jù)中心運維的人員掌握有限,甚至不知道這些協(xié)議是何物。按照廠商提供的配置指導,勉強部署下去。真的遇到問題時,甚至故障時,根本不知道怎么去分析,根源在于對這些新技術(shù)一點不熟悉。有些老員工對傳統(tǒng)協(xié)議的理解根深蒂固,分析問題的思路和觀念還轉(zhuǎn)變不過來,對新鮮事物的理解不到位,這都導致遇到問題時,解決非常吃力。這些新技術(shù)的初衷是讓網(wǎng)絡更加有效的運行與工作,而實際上,卻起了相反的效果。由于人為的原因,一項好的技術(shù)根本沒有充分發(fā)揮出優(yōu)勢。尤其在故障恢復方面,分析傳統(tǒng)網(wǎng)絡的時間要比分析新網(wǎng)絡的時間要短得多,這樣故障給數(shù)據(jù)中心帶來的損失就小。我們不僅缺少數(shù)據(jù)中心人才,更缺少對新技術(shù)精通的高技術(shù)人才,這樣的現(xiàn)實環(huán)境讓新技術(shù)在數(shù)據(jù)中心部署和運維時,困難重重。

對于新技術(shù)的不熟悉,可以通過持續(xù)的學習來提升。但是對于數(shù)據(jù)中心出現(xiàn)故障時,需要不同設(shè)備之間配合分析就困難了。比如FCOE協(xié)議,這是一個需要在存儲設(shè)備、以太網(wǎng)絡設(shè)備、服務器之間配合運行的融合技術(shù)。我們經(jīng)常會遇到這樣的問題,比如在存儲設(shè)備上看不到服務器了,在以太網(wǎng)絡設(shè)備上只能看到存儲設(shè)備等等這類問題,這些要仔細查看設(shè)備之間的協(xié)議交互。但是網(wǎng)絡設(shè)備的工程師并不會看服務器上的信息,存儲工程師也不會看網(wǎng)絡設(shè)備上的信息,這就使得問題分析進行不下去。實在沒有辦法,只能通過重啟設(shè)備看是否能恢復,重啟還無法恢復,就徹底沒有辦法了,有時數(shù)據(jù)中心會將分屬不同部門的三類工程師聚集在一起去分析同一個問題,由于技術(shù)能力有限往往分析不出結(jié)果來。而要想將存儲、服務器、網(wǎng)絡廠商的技術(shù)人員同時都請來分析,那么不是每個數(shù)據(jù)中心都有能力做到的。這樣故障的時間被大大加長了,給數(shù)據(jù)中心帶來的損失難以衡量。

對于這些新技術(shù),就算是懂行的技術(shù)專家,遇到問題時也可能束手無策。因為是新技術(shù),所以各種設(shè)備在實現(xiàn)協(xié)議時還不完善,很多分析的手段也沒有,各種歷史記錄也不完善,這就導致在分析問題時無手段可以參考的,只能靠猜。由于這些新技術(shù)定義的協(xié)議類型比較新,很多設(shè)備都不支持顯示與查看,所以根本無法查找問題的產(chǎn)生根源。經(jīng)過多年的積攢,網(wǎng)絡運維形成了一系列定位問題的手段,比如流量統(tǒng)計、鏡像等這些手段在新技術(shù)面前無所適從,對于新技術(shù)的問題分析,需要設(shè)備廠商和數(shù)據(jù)中心的技術(shù)人員共同學習與進步。現(xiàn)在不少的網(wǎng)絡設(shè)備廠商已經(jīng)關(guān)注到了這點,通過軟件手段增加一些定位分析的手段。網(wǎng)絡設(shè)備是實現(xiàn)這些新技術(shù)的基礎(chǔ),所有的新技術(shù)都是基于網(wǎng)絡實現(xiàn)的,在網(wǎng)絡設(shè)備上豐富各種監(jiān)控、記錄、查看新協(xié)議的手段,才能在遇到問題時,有章可循。

數(shù)據(jù)中心迎來了發(fā)展的機遇,這是一個充滿變化和進步的時代,新技術(shù)推動了整個數(shù)據(jù)中心行業(yè)的發(fā)展,有著不可替代的作用。不過新技術(shù)在數(shù)據(jù)中心部署和運維時也遇到了不少實際問題,不過不用擔心,數(shù)據(jù)中心從來都是一個充滿矛盾,充滿競爭的行業(yè)。這就需要每一個從業(yè)者不斷學習,一一解決這些實際問題,這需要全行業(yè)的不斷學習與進步才能戰(zhàn)勝這些困難,相信隨著新技術(shù)的標準化、普及,這些問題一定會迎刃而解,新的技術(shù)一定會給數(shù)據(jù)中心帶來新的活力。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號