在傳統(tǒng)與現(xiàn)代架構(gòu)共存發(fā)展的混合IT環(huán)境下,IT集成與IT運維都面臨著非常艱巨的挑戰(zhàn)。在此背景下,“企業(yè)承壓 IT怎么干”系列線上研討會以“集成與運維自動化”為主題,邀請來自上汽通用五菱汽車、IBM以及騰訊云的專家們,暢談如何進行容器平臺可觀測性能力建設,如何助力企業(yè)破解混合IT環(huán)境下的運維挑戰(zhàn),如何敏捷集成混合云環(huán)境下的業(yè)務系統(tǒng),以及如何借助云原生DevOps提升應用管理效率。
上汽通用五菱的容器化落地與實踐
上汽通用五菱汽車股份有限公司運營云服務經(jīng)理 梁岸川
上汽通用五菱汽車股份有限公司作為一家“多點制造、商乘并舉、跨洋出海”的學習創(chuàng)新型現(xiàn)代化企業(yè),依托大數(shù)據(jù)、云計算等技術,全面推動汽車制造業(yè)向網(wǎng)絡化、數(shù)字化、智能化的方向發(fā)展,打造了一系列智慧汽車制造產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型升級示范應用。上汽通用五菱汽車股份有限公司運營云服務經(jīng)理梁岸川為線上觀眾分享了“上汽通用五菱的容器化落地與實踐”。
梁岸川提到:近幾年云原生技術和容器技術逐漸成熟,容器可以理解為云時代的應用集裝箱,它重塑了整個軟件供應鏈,改變了軟件交付的方式,現(xiàn)在幾乎在所有運維或架構(gòu)都在用容器進行交付。相比虛擬化技術,容器技術共享操作系統(tǒng)內(nèi)核、輕量級、資源利用率高、秒級啟動、易于移植,有著絕對優(yōu)勢。
2018年容器技術得到快速發(fā)展,上汽通用五菱也于同年開始在一些非關鍵系統(tǒng)中應用Docker,并部署了第一個 Kubernetes集群;2019年,Docker被正式用于生產(chǎn)應用中;2020年開始Docker成為公司新應用部署的標準;2021年,上汽通用五菱正式上線第一個K8S生產(chǎn)集群;2022年,經(jīng)過快速發(fā)展已有10個K8S生產(chǎn)集群,支撐公司財務、物流、制造等生產(chǎn)業(yè)務系統(tǒng)。
上汽通用五菱遵循開源優(yōu)先原則,通過內(nèi)部應用開發(fā)平臺提供標準的開發(fā)框架和敏捷開發(fā)流程,通過容器平臺提供應用運行環(huán)境,并圍繞容器平臺建立CICD和多維監(jiān)控體系,同時基于K8S、多集群管理、服務網(wǎng)格等云原生技術提高技術先進性,持續(xù)進行技術架構(gòu)演進。以CICD為例,上汽通用五菱使用了諸多開源產(chǎn)品,如內(nèi)部搭建了GitLab代碼倉庫,使用Jenkins構(gòu)建項目,鏡像倉庫使用Harbor……
2022年,上汽通用五菱的K8S集群規(guī)模實現(xiàn)快速增長,CICD技術也得到了廣泛使用,流水線任務數(shù)量大幅提升,在提升效率的同時,節(jié)約了時間成本,實現(xiàn)了項目的敏捷開發(fā)以及發(fā)布和配置的標準化。
為了便于運維和管理大規(guī)模分布式系統(tǒng)中的基礎設施,上汽通用五菱進行了容器可觀測性能力的建設工作,以了解分布式系統(tǒng)的狀態(tài),便于作出決策,并為彈性伸縮自動化運維打好基礎。梁岸川先后介紹了上汽通用五菱在性能指標監(jiān)控、日志監(jiān)控和調(diào)用鏈監(jiān)控三個維度用到的主要工具及策略。
最后梁岸川表示未來上汽通用五菱將圍繞三個方向展開:一是完善K8S生態(tài),持續(xù)構(gòu)建容器平臺支撐能力,推動容器技術普及,完善應用商店,增加置備數(shù)據(jù)庫、中間件等PaaS服務的能力;二是持續(xù)提升容器平臺的可觀測性,將監(jiān)控、警報和日志與度量可視化及其分析結(jié)合,探索AIOps;三是加強容器平臺的安全防護,加強漏洞管理、合規(guī)性和運行時保護。
AI賦能的智能運維
IBM車庫創(chuàng)新團隊云工程師 林凱迪
在過去的一年里,IBM大中華區(qū)車庫創(chuàng)新團隊服務了超過21個行業(yè)的140多家客戶,涉及200多個項目,加速各行各業(yè)享受數(shù)字化紅利。IBM車庫創(chuàng)新團隊云工程師林凱迪以“AI賦能的智能運維”為主題,分享了IBM在智能運維領域的解決方案以及最新的部分行業(yè)案例。
林凱迪提到:“伴隨企業(yè)的數(shù)字化轉(zhuǎn)型,未來很長一段時間內(nèi)我們都將處于多架構(gòu)多平臺共存的過渡時期,與此同時運維部門面臨著前所未有的挑戰(zhàn),其中業(yè)務系統(tǒng)穩(wěn)定性變差和客戶滿意度變低是最主要的兩個問題。”有研究表明:關鍵業(yè)務的一秒延遲可能會導致客戶轉(zhuǎn)換率下降7%,滿意度下降16%。除性能問題外,不斷攀升的IT成本成為亟待解決的問題,1/3以上的成本浪費已經(jīng)成為業(yè)界的普遍現(xiàn)象,而這嚴重違背了降本增效的轉(zhuǎn)型方向。
為幫助客戶應對新環(huán)境下的運維難題,IBM推出了一整套AI驅(qū)動的智能運維解決方案,主要包括三款核心產(chǎn)品:一是新一代應用性能管理平臺Instana,可全面提高應用可觀測性;二是應用資源管理平臺Turbonomic,可持續(xù)分析應用資源需求,動態(tài)調(diào)整優(yōu)化;三是智能IT運營平臺IBM Cloud Pak for Watson AIOps,作為分析和決策中心,它可以幫助IT解決問題,發(fā)現(xiàn)隱患,實現(xiàn)主動運維。上述三款產(chǎn)品被稱為IBM智能運維的三架馬車,好比人的觀測之眼、執(zhí)行之手和決策之腦,分別發(fā)揮著重要作用。
IBM Instana具備自動化、上下文關聯(lián)、更智慧的行動三大特點。最近由APM Experts發(fā)表的應用可觀測性解決方案排名中,Instana憑借其在請求追蹤、關聯(lián)性分析、根因定位等能力上的領先優(yōu)勢,排名第一。而Gartner也將Instana評選為2022年度應用性能監(jiān)控和可觀測性魔力象限的領導者。
相較于其他的以定期盤點為主的資源優(yōu)化手段,Turbonomic是完全動態(tài)的資源調(diào)度,會根據(jù)當前不同層級的資源使用情況,結(jié)合歷史數(shù)據(jù)進行分析優(yōu)化,在確保應用程序遵守業(yè)務策略的同時,獲得運行所需要的全部資源,幫助企業(yè)在正確的時間執(zhí)行正確的應用資源決策,持續(xù)確保應用程序性能的合規(guī)性,將成本降到最低。同時,它可以直接對接混合云環(huán)境下的不同技術平臺,獲取應用資源數(shù)據(jù),建立彼此之間的拓撲關系,還可以給出所有資源的優(yōu)化建議,進一步提高資源管理效率。
IBM Watson AIOps這一端到端的智能IT運營平臺,可以對接和分析IT環(huán)境中的日志、指標、鏈路、事件等數(shù)據(jù),進行動態(tài)建模,并持續(xù)訓練,發(fā)現(xiàn)數(shù)據(jù)背后的潛在隱患,通過內(nèi)置的自動化平臺,實現(xiàn)各類問題的自動響應處置,落實最佳行動方案。
會上,林凱迪列舉了IBM智能運維三架馬車的三大典型案例,并對Instana和Turbonomic兩大平臺進行了在線演示。
混合云環(huán)境下的業(yè)務系統(tǒng)現(xiàn)代化集成
IBM科技事業(yè)部自動化專家 張誠
IBM科技事業(yè)部自動化專家張誠分享了“以敏捷的方式迎接混合云環(huán)境下的業(yè)務系統(tǒng)現(xiàn)代化集成”?,F(xiàn)代化集成涵蓋了三部分內(nèi)容:首先是傳統(tǒng)應用的數(shù)據(jù)集成,幫助企業(yè)在不同系統(tǒng)之間方便的同步數(shù)據(jù);其次是基于事件的集成,以異步的方式實現(xiàn)應用系統(tǒng)的交互;最后是基于API的集成,幫助企業(yè)將不同應用系統(tǒng)、不同組件便捷地銜接起來,并提供安全可信的訪問控制。
為了讓企業(yè)業(yè)務上云不流于形式,IBM推出了安全敏捷的現(xiàn)代化集成平臺——Cloud Pak for Integration,它具備API生命周期管理、應用和數(shù)據(jù)集成、企業(yè)消息傳遞、事件流式響應、高速數(shù)據(jù)傳輸以及安全網(wǎng)關六大集成功能。
作為一款iPaaS平臺,Cloud Pak for Integration的集成能力主要包括三部分內(nèi)容:一是以REST、GraphQL、Web Services的方式,幫助企業(yè)客戶快速搭建API管理平臺,實現(xiàn)業(yè)務能力輸出,快速打通上下游構(gòu)建以API為主的業(yè)務生態(tài)系統(tǒng);二是快速構(gòu)建以事件驅(qū)動的異步集成,無論客戶采用傳統(tǒng)消息中間件、Kafka、消息隊列,還是多對多的主題,都能幫助客戶實現(xiàn)面向異步的以及面向消息的集成處理功能;三是面向傳統(tǒng)的應用集成需求,提供輕量的集成引擎,幫助企業(yè)實現(xiàn)傳統(tǒng)應用,快速生成并發(fā)布API,從而讓企業(yè)適應以API為主的集成場景。
張誠認為:真正的API戰(zhàn)略的成功,既包含API 外部體驗,也包含API內(nèi)部實踐。API外部體驗包括API 發(fā)現(xiàn)、文檔、案例,API 交互式測試,自助服務和注冊,App Key/Secret配置,API 使用分析和使用報警等。API 內(nèi)部實踐指企業(yè)內(nèi)部的IT系統(tǒng)建設與規(guī)范,包括API 網(wǎng)關部署、OAuth安全管理、訪問限速和節(jié)流、運行時策略強制、數(shù)據(jù)轉(zhuǎn)換/編輯、后臺服務發(fā)現(xiàn)、版本管理、基于角色的訪問控制、分析支持、環(huán)境管理、多租戶基礎架構(gòu)、監(jiān)控和通知等。
據(jù)介紹,一汽大眾與IBM合作,采用IBM車庫創(chuàng)新方法并實施IBM應用集成平臺來發(fā)掘后臺的業(yè)務能力,通過對服務生態(tài)系統(tǒng)進行整合,為用戶提供無縫便捷的駕駛員體驗。
一汽大眾組建并培訓了一支數(shù)字化創(chuàng)新團隊,包括150多名成員,旨在推動以客戶為中心的轉(zhuǎn)型。憑借增強的客戶體驗,目前已有300余萬新客戶注冊了大眾和捷達品牌的移動應用。
中國充電運營商眾多,有些使用交流電,有些使用直流電,充電速度和充電功率也各不相同。一汽大眾利用IBM的API管理平臺,加速整合充電運營商的準入流程以及新用戶引導流程。更重要的是:簡化的流程使駕駛員獲得了良好的體驗,在一個應用程序中用戶可以看到所有可用的充電選項,并就近篩選符合他們車輛要求的充電樁。據(jù)統(tǒng)計,利用IBM提供的API管理功能,一汽大眾將添加生態(tài)系統(tǒng)合作伙伴的時間從幾個月減少到幾周,將開發(fā)解決方案的時間減少了將近50%左右,提效非常驚人。
云原生DevOps應用管理高效實踐
騰訊云 CODING 高級產(chǎn)品經(jīng)理 馬龍
最后,騰訊云CODING高級產(chǎn)品經(jīng)理馬龍分享了“云原生DevOps應用管理高效實踐”。馬龍一直從事持續(xù)部署產(chǎn)品的研發(fā)工作,隨后主攻云原生可觀測性方向,對研發(fā)效能及云原生領域有著較深理解。他提到:從2017年到2022年的5年間,CNCF項目數(shù)量倍增,由于云原生化意味著向微服務架構(gòu)演進,致使復雜性左移滲透至研發(fā)團隊,大大增加了開發(fā)者的心智負擔。如果缺乏完善的工具支撐,可能導致研發(fā)產(chǎn)能出現(xiàn)斷崖式下降,很難保證應用發(fā)布的效率和可靠性。
由于研發(fā)門檻高,應用交付故障率高,研發(fā)排障時間成本高,導致云原生技術紅利無法被充分釋放,很多企業(yè)的研發(fā)效率并未得到顯著提升。為了更好地服務企業(yè)應用云原生化,賦能開發(fā)者職能轉(zhuǎn)型,騰訊云CODING推出了Orbit云原生應用全生命周期管理平臺,從應用建模、應用交付到應用運維,幫助研發(fā)安全、高效、可靠的將多個微服務組成的應用無縫發(fā)布到云原生環(huán)境,加速軟件的價值交付循環(huán)。
K8S對于研發(fā)側(cè)的復雜性,主要來自于超大規(guī)模的YAML文件管理以及YAML文件本身的復雜度。為了應對這些挑戰(zhàn),Orbit提供了視角分離的解決方案:企業(yè)的云原生專家可通過服務模板封裝K8S的規(guī)范,通過運維插件封裝K8S的生態(tài)擴展能力,規(guī)定生產(chǎn)環(huán)境必須開啟資源限制、探針監(jiān)控等運維插件,落地云原生規(guī)范;研發(fā)人員則基于服務模板和運維插件,以可視化表單的方式填寫少量業(yè)務參數(shù),即可完成服務創(chuàng)建以及云原生應用的改造,大幅降低云原生復雜性左移對研發(fā)的影響。
在交付環(huán)節(jié),Orbit可自動監(jiān)測制品庫和代碼倉庫,自動撿配應用未發(fā)布的制品、配置、SQL變更,隨后原子化、版本化發(fā)布到多個環(huán)境,保障了一致性和可靠性。同時Orbit還支持可視化部署流程編排,可靈活編排多環(huán)境、多地域、串并聯(lián)發(fā)布。此外,基于騰訊云大規(guī)模容器發(fā)布經(jīng)驗,Orbit抽象了產(chǎn)品化的分批部署、灰度、藍綠、金絲雀等發(fā)布策略,企業(yè)只需簡單配置研發(fā)即可實現(xiàn)高級發(fā)布策略,提升發(fā)布可靠性,降低發(fā)布引發(fā)的生產(chǎn)故障。
在運維環(huán)節(jié),Orbit推出以應用為中心,混合云統(tǒng)一觀測平面的能力,覆蓋了監(jiān)控告警、鏈路追蹤、日志等日常排障場景,并通過TraceID打破了不同環(huán)境之間的工具差異,讓運維更輕松便捷。同時 Orbit自研adapter服務統(tǒng)一了各類可觀測工具數(shù)據(jù)標準,實現(xiàn)了可觀測工具的可插拔性以及可擴展性,用戶不僅可以自由選擇Orbit官方支持的可觀測工具,也可以進行自定義擴展。
近年來,新冠疫情、國際環(huán)境等不確定性帶來的風險持續(xù)發(fā)酵,企業(yè)不斷承壓,數(shù)字化成為應對不確定性的有效舉措。“企業(yè)承壓 IT怎么干”系列線上研討會致力于為業(yè)界創(chuàng)造一個溝通與交流的平臺,以數(shù)字化能力助力企業(yè)應對持續(xù)變化的不確定風險。
會上,線上參與者與各位分享嘉賓積極展開交流探討,諸位專家針對線上網(wǎng)友提出的問題給出了詳細解答。至此,由企業(yè)網(wǎng)D1Net、IBM、騰訊云CODING和億聯(lián)網(wǎng)絡聯(lián)合主辦的“企業(yè)承壓 IT怎么干”之“集成與運維自動化”專場線上研討會圓滿結(jié)束。
歡迎觀看“企業(yè)承壓 IT怎么干”之“集成與運維自動化”專場線上研討會回放視頻:
https://page.om.qq.com/page/OlKs-om9_IlnJNgZMYcZujqA0
關于企業(yè)網(wǎng)D1Net(m.r5u5c.cn):
國內(nèi)主流的to B IT門戶,同時在運營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_-信眾智(www.cioall.com)。同時運營18個IT行業(yè)公眾號(微信搜索D1net即可關注)。