人工智能如何解決數(shù)據(jù)中心的工作負載管理難題

責任編輯:cres

作者:John Edwards

2021-06-28 09:53:55

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

隨著數(shù)據(jù)中心工作負載量呈螺旋式增長,越來越多的企業(yè)開始尋求采用人工智能技術(shù)幫助他們減輕IT團隊的管理負擔,同時提高效率,并削減開支。

人工智能如今為實現(xiàn)數(shù)據(jù)中心的基本管理任務(wù)自動化做好了準備。但是,數(shù)據(jù)中心管理人員準備好從人工管理過渡到機器管理了嗎?
 
隨著數(shù)據(jù)中心工作負載量呈螺旋式增長,越來越多的企業(yè)開始尋求采用人工智能技術(shù)幫助他們減輕IT團隊的管理負擔,同時提高效率,并削減開支。
 
人工智能承諾將工作負載自動實時管理功能應(yīng)用在基礎(chǔ)設(shè)施,無論是在內(nèi)部部署數(shù)據(jù)中心還是在由數(shù)據(jù)中心、云平臺和邊緣計算設(shè)備組成的混合云環(huán)境中。隨著人工智能為工作負載管理帶來的轉(zhuǎn)變,未來的數(shù)據(jù)中心將與現(xiàn)在的數(shù)據(jù)中心設(shè)施大不相同。一種可能的方案是由遠程管理員管理的小型互連邊緣數(shù)據(jù)中心的集合。
 
專注于數(shù)據(jù)中心業(yè)務(wù)和技術(shù)趨勢分析的Infosys Knowledge Institute負責人Jeff Kavanaugh表示,由于競爭加劇、通貨膨脹以及疫情導(dǎo)致的預(yù)算削減各種因素,許多企業(yè)正在尋求降低數(shù)據(jù)中心運營成本的方法。人工智能和自動化已經(jīng)被證明是工作量管理中的強大工具,因為它可以將企業(yè)的員工從耗時且乏味的任務(wù)中解放出來,并使他們能夠?qū)W⒂谡嬲枰斯ぬ幚淼墓ぷ鳌?/div>
 
滿足需求
 
大多數(shù)數(shù)據(jù)中心管理人員的首要任務(wù)是優(yōu)化運營以滿足高峰需求。然而,無論他們?nèi)绾巫屑毜赜媱澓蜏蕚?,需求高峰和低谷往往無法控制。商業(yè)咨詢機構(gòu)Capgemini公司北美地區(qū)人工智能工程副總裁Goutham Belliappa說:“人工智能可以帶來獨特改進的地方在于它可以理解工作負載的模式,并將這些需求與數(shù)據(jù)中心容量相匹配。”
 
人工智能管理可以使數(shù)據(jù)中心團隊從一系列平凡而重復(fù)的任務(wù)中解脫出來,其中包括服務(wù)器管理、安全設(shè)定、計算、內(nèi)存和存儲優(yōu)化、負載均衡,以及電力和冷卻分配等??萍际袌鲎稍儥C構(gòu)ABI Research公司首席分析師Lian Jye Su說,“這些工作負載都可以通過人工智能實現(xiàn)自動化或增強。”
 
IT管理軟件開發(fā)商Manage Engine公司人工智能和機器學習產(chǎn)品總監(jiān)Ramprakash Ramamoorthy表示,人工智能可以幫助分析從單個機器收集的數(shù)據(jù),并發(fā)現(xiàn)被監(jiān)控參數(shù)中的異常情況。他說,“人工智能還可以幫助更早地預(yù)測故障和中斷,這可以幫助數(shù)據(jù)中心管理團隊減少停機時間,并保持集群正常運行。人工智能還可以實現(xiàn)更好的溫度和電壓管理,從而直接降低運營成本,并幫助減少碳足跡。”
 
Ramamoorthy表示,雖然可以使用各種人工智能方法,但工作負載管理工具應(yīng)始終確保模型預(yù)測是完全可解釋的。與其他領(lǐng)域相比,人工智能系統(tǒng)在數(shù)據(jù)中心工作負載管理中做出的決定通常會由一個或多個協(xié)同工作的團隊來執(zhí)行。因此,人工智能模型決策應(yīng)該是可解釋的,讓IT團隊能夠更好地理解模型決策的意圖,并采取相應(yīng)的行動。
 
他指出,“人工智能模型最多可以達到80%到85%的準確度,因此這也有助于人類團隊通過正確解釋人工智能模型的決策來關(guān)聯(lián)明智的決策。如果人工智能模型可以為其呈現(xiàn)的決策提供置信度評分,那么它也將有助于有效的工作負載管理。”
 
人工智能和機器學習開發(fā)商Tanjo公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官Richard Boyd表示,隨著人工智能和機器學習工具變得越來越普遍,很多企業(yè)認識到,當人類智能與技術(shù)合作而不是競爭時,可以實現(xiàn)最佳結(jié)果。他說,“機器在許多方面根本無法取代人類,但機器在某些領(lǐng)域的應(yīng)用肯定比人類好得多。一旦人工智能和機器學習變得流行,并且企業(yè)員工適應(yīng)這種新的合作關(guān)系,那么他們的觀點就會發(fā)生轉(zhuǎn)變。”
 
Dell科技公司的人工智能戰(zhàn)略負責人Brons Larson表示,數(shù)據(jù)中心可以利用人工智能/機器學習來提高性能以及優(yōu)化配置和部署。人工智能/機器學習支持動態(tài)協(xié)調(diào)資源與工作負載,以優(yōu)化資源利用率以更好地管理成本。所有人工智能解決方案,無論是何種應(yīng)用程序或供應(yīng)商,都需要專業(yè)知識來正確配置和優(yōu)化價值。這首先要正確捕獲和評估用于訓(xùn)練和測試的數(shù)據(jù),以及針對漂移和偏差管理部署的模型。
 
此外,基于規(guī)則的人工智能可以通過智能策略控制和預(yù)定義配置幫助自動化資源優(yōu)化和合規(guī)性。Su指出,“使用從日常運營中收集的數(shù)據(jù),基于機器學習的人工智能可以進一步增強數(shù)據(jù)中心運營的其他方面,這些方面以前需要深入的領(lǐng)域?qū)I(yè)知識。例如,可以通過自學威脅檢測和監(jiān)控算法來加強數(shù)據(jù)中心的安全性。通過將所需資源引導(dǎo)到正確的方向,可以優(yōu)化負載均衡、電源和冷卻分配功能。”
 
Kavanaugh說,“人工智能還可以簡化數(shù)據(jù)管理。企業(yè)越來越發(fā)現(xiàn)自己被與關(guān)鍵利益相關(guān)者有關(guān)的大量數(shù)據(jù)所包圍。使用人工智能,企業(yè)可以確保有效、準確地管理這些大量數(shù)據(jù)。”在人工智能的幫助下,企業(yè)的IT團隊可以比以往更快、更準確地執(zhí)行數(shù)據(jù)質(zhì)量分析或提取數(shù)據(jù)以創(chuàng)建預(yù)測等任務(wù)。他說,“這對企業(yè)來說至關(guān)重要,因為他們需要更準確的數(shù)據(jù)來做出明智的決策。”
 
人工智能軟件包
 
隨著人工智能的成熟,現(xiàn)在出現(xiàn)了一種軟件驅(qū)動的方法,可以將不同的元素結(jié)合在一起,并將人工干預(yù)降至最低。例如,在典型的數(shù)據(jù)庫系統(tǒng)中,需要大量配置才能使操作高效運行,例如索引表、跨服務(wù)器對數(shù)據(jù)進行分區(qū)、為某些類型的查詢分配內(nèi)存以及調(diào)整優(yōu)化器以適應(yīng)計算平臺和預(yù)期的工作量。Howe指出,“人工智能可以通過從大量歷史數(shù)據(jù)中學習規(guī)則和程序來提供幫助,關(guān)于哪些日程安排對哪些任務(wù)有效,而不是讓我們試圖弄清楚所有事情。”
 
有了人工智能,企業(yè)IT領(lǐng)導(dǎo)者和團隊可以自由地專注于解決業(yè)務(wù)問題,而不必擔心基礎(chǔ)設(shè)施的細節(jié)。Belliappa說,“從人工智能的角度來看,我們使用的大多數(shù)模型都是自學習集成模型,它們結(jié)合使用各種技術(shù),并在從它們管理的工作負載模式中學習時不斷優(yōu)化。”
 
規(guī)劃和部署
 
在人工智能開始發(fā)揮其管理魔力之前,IT和業(yè)務(wù)領(lǐng)導(dǎo)者需要接受將關(guān)鍵管理職責移交給軟件的想法。Shah說,“根據(jù)其規(guī)模和內(nèi)部知識庫,人工處理可能非常困難。”
 
最終,企業(yè)如何處理從人工到人工智能工作負載管理的過渡取決于其技術(shù)成熟度、運營規(guī)模和數(shù)據(jù)中心的活力。Kavanaugh說,“缺乏現(xiàn)代基礎(chǔ)設(shè)施來有效利用其數(shù)據(jù)的孤立企業(yè)將陷入困境。”另一方面,越來越多的人工智能供應(yīng)商提供針對特定類型企業(yè)的工具,這增加了幾乎任何類型和規(guī)模的企業(yè)能夠平穩(wěn)過渡的可能性。他預(yù)測說,“隨著企業(yè)及其解決方案的成熟,配置和部署的便利性將會繼續(xù)提高,”
 
如果說人工智能有致命弱點的話,那就是該技術(shù)對數(shù)據(jù)中心系統(tǒng)和實踐中甚至相對微妙變化的反應(yīng)。Howe解釋道,“大多數(shù)人工智能技術(shù)都是在假設(shè)固定環(huán)境的情況下尋找穩(wěn)定的模式。如果以模型無法看到的方式改變環(huán)境,它會提供錯誤的答案。而在部署更改之前仔細規(guī)劃可以幫助減輕這種擔憂。”
 
人工智能得到更廣泛的應(yīng)用
 
雖然人工智能驅(qū)動的數(shù)據(jù)中心工作負載管理已經(jīng)被許多大型企業(yè)使用,特別是谷歌、亞馬遜和微軟等超大規(guī)模企業(yè),但規(guī)模較小的數(shù)據(jù)中心運營商直到現(xiàn)在才開始采用這項技術(shù)。Belliappa指出,用不了多久,數(shù)據(jù)中心管理人員將面臨一個嚴峻的選擇:或者繼續(xù)依賴傳統(tǒng)的數(shù)據(jù)中心管理技術(shù)和實踐,或者大量投資于人工智能驅(qū)動的業(yè)務(wù)以保持活力。
 
從長遠來看,隨著技術(shù)的進步、成本的下降以及采用者信心的增強,人工智能驅(qū)動的管理有望成為主流。Shah預(yù)測說,“在接下來的四到六年內(nèi),人們將看到人工智能數(shù)據(jù)中心工作負載管理技術(shù)成為標準選項。”
 
Howe說,““我認為這種趨勢正在迅速發(fā)展,隨著數(shù)據(jù)中心自動化程度的提高,人工智能技術(shù)提供了一種更好的方法來利用提供商擁有大量數(shù)據(jù)的內(nèi)容。”他預(yù)計使用人工智能學習方法的自動化工作負載管理將很快變得司空見慣。
 
Kavanaugh說,“越來越多的行業(yè)觀察家認為人工智能將在未來三四年內(nèi)的某個時候開始主導(dǎo)數(shù)據(jù)中心管理,盡管疫情的驅(qū)動可能有助于推動這一時間表向前推進。數(shù)據(jù)中心很快將能夠?qū)崿F(xiàn)幾乎所有操作的自動化,從網(wǎng)絡(luò)安全到維護再到監(jiān)控。但是,隨著數(shù)據(jù)量呈指數(shù)級增長,以及企業(yè)發(fā)現(xiàn)人工智能的新用途,數(shù)據(jù)中心管理人員的工作量及其管理將會繼續(xù)增長。”
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責任的權(quán)利。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號