云監(jiān)控可以收集一系列的性能數(shù)據(jù),但是,網(wǎng)絡(luò)的關(guān)鍵因素往往不能滿足要求。必須借助于第三方網(wǎng)絡(luò)監(jiān)控工具,保證云運(yùn)行能夠符合標(biāo)準(zhǔn)。
云監(jiān)控服務(wù)收集到的服務(wù)器性能數(shù)據(jù)、存儲(chǔ)和其他服務(wù),在提供商的生態(tài)系統(tǒng)內(nèi)部。不幸的是, 這些工具的網(wǎng)絡(luò)監(jiān)控功能往往是有限的,這意味著這些工具可能會(huì)錯(cuò)過云環(huán)境中的主要性能問題。密切關(guān)注網(wǎng)絡(luò),捕捉潛在的問題,使用建立的網(wǎng)絡(luò)監(jiān)控工具來跟蹤和報(bào)告更深入的性能。
網(wǎng)絡(luò)監(jiān)控工具分為三類:基本監(jiān)測(cè),可視化和報(bào)告,以及先進(jìn)的異常檢測(cè)。先進(jìn)的產(chǎn)品具備多個(gè)類別工具的功能。但是,如果擔(dān)心可視化,擔(dān)心先進(jìn)的異常檢測(cè)和安全性,可以專門尋找那些功能在一個(gè)單一的產(chǎn)品。
基本的網(wǎng)絡(luò)監(jiān)控工具完成工作 Nagios是一個(gè)開源網(wǎng)絡(luò)監(jiān)控工具,很難使用,但很全面。它捕獲網(wǎng)絡(luò)協(xié)議、監(jiān)控網(wǎng)絡(luò)服務(wù),通過短信、電子郵件或自定義腳本執(zhí)行生成警報(bào)。報(bào)告的模塊提供了過去的中斷和中斷響應(yīng)相關(guān)的文檔。
對(duì)于那些希望Nagios監(jiān)控功能,沒有管理學(xué)習(xí)曲線,第三方工具基于Nagios也許是正確的選擇。像Opsview有限公司提供的服務(wù),高級(jí)功能,服務(wù)支持和幾種不同的計(jì)劃——從一個(gè)免費(fèi)的開源企業(yè)級(jí)核心選項(xiàng)的選擇。后者包括統(tǒng)一的儀表板,企業(yè)報(bào)告和數(shù)據(jù)聚合,來自多個(gè)分布式主服務(wù)器。
另一個(gè)開源IT基礎(chǔ)設(shè)施選擇,包括網(wǎng)絡(luò)監(jiān)控、來自Zabbix ISA。Zabbix監(jiān)控工具,管理員可以收集服務(wù)器和網(wǎng)絡(luò)設(shè)備的詳細(xì)指標(biāo)。提供了可視化,呈現(xiàn)大量easy-to-evaluate格式的數(shù)據(jù)。代理啟用分布式監(jiān)控,基于主體和無代理監(jiān)控選項(xiàng)都是可用的。
可視化工具能夠接收大量的數(shù)據(jù) 網(wǎng)絡(luò)監(jiān)控服務(wù)所帶來的挑戰(zhàn)之一是:它可以生成大量的數(shù)據(jù)。報(bào)告工具可以過濾和聚合數(shù)據(jù)。可視化可以鞏固大量數(shù)據(jù),將數(shù)據(jù)以顯示顯著關(guān)系的方式呈現(xiàn)出來。
對(duì)于可視化,云管理員可能希望使用開源網(wǎng)絡(luò)監(jiān)控工具,如PRTG,建立在RRDtool基礎(chǔ)之上,用于數(shù)據(jù)日志記錄和圖形應(yīng)用程序。商業(yè)PRTG支持對(duì)Paessler是可用的?;赗RDtool的另一個(gè)可視化的工具,對(duì)AWS JumpBox市場伙伴是可用的。Cacti包括一個(gè)接口,支持圖模板和多種數(shù)據(jù)采集方法。
先進(jìn)網(wǎng)絡(luò)的異常檢測(cè)監(jiān)控
然而,僅僅依靠可視化技術(shù),并不能滿足要求。一些模式的網(wǎng)絡(luò)流量更加微妙。例如,平均流量模式的變化,可以說明一個(gè)問題,但可能不會(huì)出現(xiàn)在典型的管理報(bào)告和可視化。這需要一種異常檢測(cè)技術(shù)。對(duì)于更高級(jí)的先發(fā)制人的監(jiān)控,異常檢測(cè)應(yīng)用程序可以識(shí)別網(wǎng)絡(luò)行為預(yù)期以外的范圍。
異常檢測(cè)是重要的服務(wù)要求一致的應(yīng)用程序和網(wǎng)絡(luò)性能。一個(gè)成功的營銷活動(dòng)可以為網(wǎng)站帶來流量高峰期。即使在負(fù)載平衡,存在的風(fēng)險(xiǎn)增加了客流量的延遲。工具,如Numenta可以識(shí)別峰值和其他異常。
理想情況下,如果啟用了自動(dòng)伸縮,應(yīng)用程序?qū)⒆詣?dòng)將節(jié)點(diǎn)添加到集群來處理負(fù)載的增加。工具,如識(shí)別潛在的性能問題,使系統(tǒng)管理員手動(dòng)添加額外的服務(wù)器或確保伸縮應(yīng)對(duì)增加的工作負(fù)載。