當(dāng)企業(yè)架構(gòu)師考慮移動應(yīng)用集成時,關(guān)注點一般都放在云和消費者之間的鏈接上。新一代移動DevOps集成工具可以幫助改善應(yīng)用基礎(chǔ)架構(gòu),運營人員、QA和開發(fā)人員之間的鏈接??梢詫?yīng)用開發(fā)生命周期流水線化,提高效率,降低嚴重bug和安全漏洞的解決時間,Hav Mustamandy說,他是eHarmony的系統(tǒng)運營總監(jiān)。
業(yè)界領(lǐng)先的移動DevOps集成工具服務(wù)供應(yīng)商包括PagerDuty,BigPanda和VictorOps。這些工具使得在IT環(huán)境中創(chuàng)建自定義監(jiān)控視圖變得更容易,可以從應(yīng)用、團隊、云、客戶、數(shù)據(jù)中心或者其他邏輯組維度來監(jiān)控IT基礎(chǔ)架構(gòu)。因此,企業(yè)可以更為快速地解決嚴重問題。“這就像是IT警告的垃圾過濾器,” Assaf Resnick說,他是BigPanda的CEO。“通過過濾排除掉不相關(guān)的噪音,團隊可以只用以前10%的時間就能發(fā)現(xiàn)并解決問題。”
此外,這些工具可以幫助更容易得維護一個記錄的權(quán)威系統(tǒng),幫助技能欠缺的員工在類似問題再次發(fā)生的時候更容易得解決問題,Todd Vernon說,他是VictorOps的CEO。
這些工具協(xié)助編排開發(fā)信息,因此信息可以更為快速地通過短信,手機,應(yīng)用程序或者Web客戶端傳輸?shù)綋碛刑囟寄艿腎T人員那里。應(yīng)用開發(fā)團隊只會看到和他們自己的應(yīng)用程序相關(guān)的警報。DBA團隊只會處理云平臺和數(shù)據(jù)中心里數(shù)據(jù)庫相關(guān)的警報。
沙里淘金
企業(yè)可能為應(yīng)用程序,服務(wù)器,數(shù)據(jù)庫和網(wǎng)絡(luò)使用多種監(jiān)控工具。這會導(dǎo)致很多混雜在一起的警報。很多類似的工具支持發(fā)送短信到移動設(shè)備,但是無法智能區(qū)分誰是解決這個問題的最佳人選。
因此IT團隊每天可能會收到成千上萬的IT警報,不得不雇用特定的運營人員來做為守門人決定誰是解決特定問題的最佳人選。IT團隊可能會浪費很多時間只是用來確定哪個警報屬于哪個環(huán)境,分析問題的影響程度和需要執(zhí)行的操作。這個流程很費時間,會降低問題定位和發(fā)現(xiàn)的速度。
新的移動DevOps集成工具使用機器學(xué)習(xí),模式分析和知識管理技術(shù)來傳遞合適的信息。它們也可以和其他聊天應(yīng)用程序集成來創(chuàng)建記錄跟蹤移動警報的系統(tǒng)。
約會網(wǎng)站eHarmony正在和PagerDuty一起合作,將其私有云基礎(chǔ)架構(gòu)的報警流程合理化。在12月份到情人節(jié)起價,使用高峰時段,eHarmony和其他數(shù)據(jù)站點活動量增長了25%到30%。
使用PagerDuty報警服務(wù)使得eHarmony的事務(wù)處理時間降低了80%,警報處理平均時間降低了56%,eHarmony的Mustamandy說。“數(shù)百位人一來eHarmony的在線匹配系統(tǒng),任何掉線時間會導(dǎo)致利潤的下降并影響客戶忠誠度。”他補充道。
eHarmony認識到使用外部警報整合服務(wù)性價比更高,可以自動化所有事務(wù)處理流程,減少解決問題的時間。使用PagerDuty的高級分析功能也可以幫助eHarmony更好地理解問題,從而可以重構(gòu)響應(yīng)流程,加強IT人員培訓(xùn)來更高效地解決問題。
架構(gòu)高效警報流程
Mustamandy 也提到使用運營事務(wù)數(shù)據(jù)來提高運營流程和開發(fā)是很有效的方式。eHarmony使用PagerDuty服務(wù)來搭建組,該工具允許他們總結(jié)發(fā)送到每個組的不同類型警報的數(shù)目,以及發(fā)生的事務(wù)類型。他說這使得可以更容易地知道發(fā)到每個組的警報數(shù),這樣eHarmony可以知道DevOps團隊的關(guān)注點應(yīng)該在哪里。
另一個好的方式是尋求email和短信之外的方式,這些方式使得很難實現(xiàn)一致集成。Mustamandy說,“短信服務(wù)的最大問題是我們監(jiān)控的很多應(yīng)用程序沒有直接的SMS集成。另外,如果我們只依賴于SMS,就很難關(guān)注報告以及確定改進的關(guān)鍵要素。”
eHarmony已經(jīng)為了和Shinken的集成,可以和Nagios組合在一起作為主要數(shù)據(jù)收集點來實現(xiàn)分布式監(jiān)控。Shinken是監(jiān)控聚集點,但是沒有內(nèi)建分頁系統(tǒng)。相比而言,eHarmony目前的解決法案會發(fā)送SMS信息,通過應(yīng)用提供更加復(fù)雜的警報信息,然后為了后續(xù)分析將問題存儲下來。專職的移動DevOps集成工具,比如PagerDuty,比Shinken和Nagios更為高效地流水線化IT數(shù)據(jù),Mustamandy 說。
可能的話自動修復(fù)
再進一步,eHarmony想要繼續(xù)自動化問題解決流程。Mustamandy建議企業(yè)考慮利用像OpenStack之類的云平臺來自動生成新的虛擬機。他堅信正確的集成策略會允許像Puppet和Chef這樣的持續(xù)集成服務(wù)器來自動解決問題,而不需要在凌晨三點叫醒某個技術(shù)人員。
“如果這些人無法解決問題,那就不需要警告他們,”Mustamandy說。“但是企業(yè)任然需要記錄這些問題,這樣可以在工作時間解決底層問題。最終會讓程序員和Ops團隊更快樂,也能搭建出更為可靠的企業(yè)架構(gòu)。”