以拷貝管理系統(tǒng)助力數(shù)據(jù)瘦身減量

責(zé)任編輯:editor004

作者:Alastair Cooke

2017-06-06 10:52:26

摘自:TechTarget中國

摘要:對今天任何企業(yè)而言,信息和數(shù)據(jù)都已成為其核心資產(chǎn),維護這部分信息正是IT部門的關(guān)鍵要務(wù)。在服務(wù)器虛擬化技術(shù)出現(xiàn)之前,應(yīng)用程序使用專門的開發(fā)與用戶驗收培訓(xùn)(UAT)系統(tǒng),并在開發(fā)環(huán)境中測試代碼,由UAT測試系統(tǒng)負載。

對今天任何企業(yè)而言,信息和數(shù)據(jù)都已成為其核心資產(chǎn),維護這部分信息正是IT部門的關(guān)鍵要務(wù)。在常見的業(yè)務(wù)流程中,IT人員會將每天的數(shù)據(jù)備份復(fù)制,用于其他各種用途。不幸的是,這部分數(shù)據(jù)存儲往往消耗過量的存儲空間,從而加緊了原本便不寬裕的存儲預(yù)算。

數(shù)據(jù)無休止增長的解決方案之一便是使用拷貝管理系統(tǒng)。雖然這仍屬于較新出現(xiàn)的技術(shù),但市場上已經(jīng)有不少小型的拷貝數(shù)據(jù)管理(CDM)廠商,而大型存儲系統(tǒng)供應(yīng)商則將此功能添加到現(xiàn)有產(chǎn)品之中。

為何針對拷貝?

數(shù)據(jù)副本對IT部門有許多種用途。除了用于災(zāi)難恢復(fù)的拷貝會實際將所有數(shù)據(jù)都遷移至另一個平臺,絕大多數(shù)的只是時間點拷貝,表示其只代表數(shù)據(jù)在某個特定時刻的狀態(tài)。舉例而言,快照每小時或每天都會生成,以便在發(fā)生用戶錯誤刪除等操作時,IT部門能夠快速找回或更正相關(guān)數(shù)據(jù)。

數(shù)據(jù)拷貝亦可以用于搭建測試環(huán)境,供應(yīng)用程序開發(fā)使用。這種使用場景會從主備份中復(fù)制出一份拷貝,以確保主拷貝不會損壞而無法滿足合規(guī)或引起生產(chǎn)數(shù)據(jù)無法恢復(fù)的風(fēng)險。

在服務(wù)器虛擬化技術(shù)出現(xiàn)之前,應(yīng)用程序使用專門的開發(fā)與用戶驗收培訓(xùn)(UAT)系統(tǒng),并在開發(fā)環(huán)境中測試代碼,由UAT測試系統(tǒng)負載。

現(xiàn)在,伴隨著應(yīng)用程序變得越來越虛擬化,并采用容器技術(shù),更改應(yīng)用程序的過程更多采取DevOps的方式,從而確保快速迭代與上市。這意味著開發(fā)人員需要同時提供多個測試數(shù)據(jù)副本,即使其中的大部分只會保留幾個小時或幾天。

維護多個數(shù)據(jù)副本令企業(yè)組織頭疼不已。每個副本必須有負責(zé)人跟進其狀態(tài),以便在某個時刻將其釋放。在備份領(lǐng)域,已經(jīng)有些許流程來對此做生命周期管理。備份通常根據(jù)時間周期循環(huán)往復(fù)。

但這不適合測試或開發(fā)數(shù)據(jù),因此仍需要開發(fā)出新的流程。這或?qū)⒊蔀榭截悢?shù)據(jù)管理的潛在市場。

海量復(fù)制

伴隨著向服務(wù)器虛擬化的轉(zhuǎn)變,我們之前所討論的二級數(shù)據(jù)使用都通過虛擬機鏡像中獲得?,F(xiàn)代化的虛擬機管理程序(Hypervisor)提供接口和API ,從而可以在數(shù)據(jù)塊層級提取虛擬機數(shù)據(jù),讓備份過程相對簡單化。

虛擬機管理程序通常也能實現(xiàn)快照功能,但這絕非是無償?shù)?。保留多份快照,尤其是在后期合并這些快照更新,會對運行在虛擬機中的應(yīng)用程序性能產(chǎn)生重大影響。這是拷貝管理系統(tǒng)可以解決的另一項問題。

整合帶來效益

有許多內(nèi)部的IT流程和系統(tǒng)會為各種用途進行時間點拷貝。隨著服務(wù)器虛擬化技術(shù)的高度滲透,大多數(shù)通過API采集數(shù)據(jù)的業(yè)務(wù)流程都用這些相同或相似的接口來提取數(shù)據(jù)。將這些功能整合至單一平臺頗具意義。

整合能夠帶來下列顯著的改善之處:

節(jié)省成本。因各種用途而產(chǎn)生的數(shù)據(jù)(歸檔、備份、測試和開發(fā))可以集中到單個硬件集群上,避免了同時運行多個平臺,減少相關(guān)的部署、維護和升級成本。同時,這樣做也減少了硬件和相應(yīng)的空間,并降低冷卻成本。

避免對業(yè)務(wù)運營的影響。將事務(wù)性工作遷移到另一平臺上可以減少對生產(chǎn)系統(tǒng)的影響。這樣做可以消除快照管理(和性能)的開支。你可以在輔助平臺上管理數(shù)據(jù)恢復(fù),而非去影響生產(chǎn)系統(tǒng)。這樣還能降低意外覆蓋生產(chǎn)系統(tǒng)的風(fēng)險。

減少安全風(fēng)險。對業(yè)務(wù)運營而言,將二級數(shù)據(jù)放在另一個平臺上可以輕松分割安全權(quán)限。對需要訪問生產(chǎn)鏡像的團隊,無論其處于何種目的,都可以從安全的角度分離出來,單獨審計。

那么,市場上為什么直到今天才出現(xiàn)CDM的成功部署?有一些技術(shù)創(chuàng)新使得拷貝管理系統(tǒng)比運行單獨的平臺更具吸引力。

第一項創(chuàng)新技術(shù)是重復(fù)數(shù)據(jù)刪除,通過消除重復(fù)的數(shù)據(jù)塊(通常在數(shù)據(jù)塊級別)從數(shù)據(jù)集合中消除冗余的物理數(shù)據(jù)。事實上,該技術(shù)僅保留單個物理副本,然后用元數(shù)據(jù)和指針來映射數(shù)據(jù)的邏輯和物理關(guān)系。

二級數(shù)據(jù)通常是高度冗余的,其中創(chuàng)建了虛擬機和虛擬機下層鏡像的多個副本。這使得重復(fù)數(shù)據(jù)刪除能夠節(jié)省下相當(dāng)可觀的存儲量,尤其是在組合了多個時間點的數(shù)據(jù)源(如備份和數(shù)據(jù)鏡像)時。

今天硬件平臺(其中的絕大部分基于Intel x86架構(gòu))處理能力的提高代表著你可以無需額外的定制化硬件,即可執(zhí)行諸如重復(fù)數(shù)據(jù)刪除、過零檢測和壓縮等技術(shù)。這使得拷貝管理技術(shù)更專注于通過軟件提升價值,即便在最終產(chǎn)品上,仍會以軟硬件組合的形式銷售。

我們還能夠為這項創(chuàng)新增添閃存技術(shù)。閃存為隨機數(shù)據(jù)訪問操作(通常是經(jīng)過重復(fù)數(shù)據(jù)刪除帶來了極高的性能,并且伴隨著價格持續(xù)下降,其在設(shè)備內(nèi)的部署會逐漸增多。

從硬件上分離開

拷貝管理系統(tǒng)通常被部署為獨立的平臺,而非直接對接生產(chǎn)系統(tǒng)。這樣的設(shè)計有助于遵循最基本的備份原則,即從物理上分開平臺與生產(chǎn)系統(tǒng)的數(shù)據(jù)聯(lián)系。從邏輯上將主數(shù)據(jù)與二級數(shù)據(jù)隔離開,甚至在需要的情況下將數(shù)據(jù)存儲到遠程。

二級平臺還可以處理與主存儲不同的數(shù)據(jù)。對生產(chǎn)端的主數(shù)據(jù)而言,其目的是盡可能快地滿足應(yīng)用程序的I / O請求,而不需要快照。通過拷貝管理技術(shù),數(shù)據(jù)不斷變化,應(yīng)用程序不斷更新存儲,而將訪問歷史數(shù)據(jù)留給輔助平臺完成。

因此,拷貝管理系統(tǒng)中的數(shù)據(jù)存儲和檢索方式必須結(jié)構(gòu)化,以便不論是訪問六個月或五分鐘之前的數(shù)據(jù)都不會對性能產(chǎn)生什么影響。這也意味著數(shù)據(jù)的內(nèi)部結(jié)構(gòu)需要不同于生產(chǎn)系統(tǒng)。數(shù)據(jù)結(jié)構(gòu)和相關(guān)元數(shù)據(jù)要能夠提供諸如搜索之類的高級功能,這樣增加了作為備份和歸檔平臺的CDM的總體價值。

擴展至云端

拷貝管理系統(tǒng)可以重復(fù)利用公有云帶來的靈活性。諸如Amazon Web Services、Microsoft Azure和Google Cloud Platform所帶來的超大規(guī)模服務(wù)可以提供近乎無限的計算和存儲資源,根據(jù)實際消費逐月收費。公有云將資產(chǎn)購置轉(zhuǎn)化為服務(wù)購買,只收取所使用的資源,而不用為資源的建設(shè)買單。

拷貝管理系統(tǒng)擴展至公有云意味著企業(yè)組織能夠卸下陳舊數(shù)據(jù)的包袱,這些數(shù)據(jù)不太會馬上被用來進行恢復(fù)或測試。CDM系統(tǒng)可以有效地成為應(yīng)用程序的歸檔工具(這也就是為什么搜索會成為一項重要的特性)。

伴隨著CDM在云端技術(shù)支持的日益成熟,我們可以想象未來可以將應(yīng)用程序直接部署在公有云端,進行測試/開發(fā)工作,不需要將數(shù)據(jù)存儲到現(xiàn)場。這會大幅度降低成本,而且只是運營成本。

領(lǐng)先的拷貝數(shù)據(jù)管理廠商能夠提供哪些功能?

現(xiàn)在我們對CDM可以實現(xiàn)的內(nèi)容有更清晰地認識,那么接下來簡要介紹下今天市場上領(lǐng)先的拷貝管理系統(tǒng)。這些產(chǎn)品經(jīng)由市場權(quán)威人士的廣泛研究確定,其中涉及到哪些產(chǎn)品最適合用于作為行業(yè)購買標準。

Rubrik和Cohesity都通過軟硬件結(jié)合的方式來處理拷貝管理。 這些拷貝管理系統(tǒng)通??梢詸M向擴展,并支持與公有云的對接。

Actifio和Druva提供的軟件都可以獲取現(xiàn)有硬件平臺上的數(shù)據(jù),包括虛擬服務(wù)器環(huán)境和傳統(tǒng)應(yīng)用環(huán)境。

Catalogic Software可以利用底層存儲平臺的快照功能,管理來自EMC、IBM和NetApp存儲陣列上的快照。

Hitachi Data的Instance Director可以管理Hitachi Data System的企業(yè)級的Virtual Storage Platform 和Hitachi NAS Platform,支持諸如Oracle、Exchange、SQL Server和SAP HANA等傳統(tǒng)應(yīng)用程序。

Dell EMC所提供Enterprise Copy Data Management可以管理Dell EMC的 VMAX,XtremIO以及Data Domain平臺之間的數(shù)據(jù)。

Delphix軟件專注于解決數(shù)據(jù)庫的拷貝管理問題。

Commvault在其包羅萬象的數(shù)據(jù)管理平臺中提供了一系列類似CDM的功能。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號