阿里數(shù)據(jù)庫(kù)備份專家:教你pick最有效的備份系統(tǒng)

責(zé)任編輯:zsheng

作者:衡鐵剛

2018-08-15 10:20:43

數(shù)據(jù)庫(kù)備份是個(gè)老生常談的話題,看似很簡(jiǎn)單,但在實(shí)際操作過(guò)程中,運(yùn)維人員往往會(huì)遇到這樣或那樣的坑。

數(shù)據(jù)庫(kù)備份是個(gè)老生常談的話題,看似很簡(jiǎn)單,但在實(shí)際操作過(guò)程中,運(yùn)維人員往往會(huì)遇到這樣或那樣的坑。

那么,如今的數(shù)據(jù)庫(kù)備份有哪些挑戰(zhàn)?如何構(gòu)建有效備份系統(tǒng)?有什么解決辦法?日前,小編就這些問(wèn)題采訪了阿里巴巴數(shù)據(jù)庫(kù)事業(yè)部備份專家衡鐵剛(佩恩)。

1、先問(wèn)個(gè)小白問(wèn)題:數(shù)據(jù)庫(kù)為什么要備份?

衡鐵剛:時(shí)至今日,我認(rèn)為這個(gè)問(wèn)題已經(jīng)不再是問(wèn)題了,我換個(gè)問(wèn)題來(lái)回答,數(shù)據(jù)庫(kù)備份能規(guī)避哪些風(fēng)險(xiǎn)?其實(shí)從數(shù)據(jù)誕生時(shí)起就伴隨著丟失風(fēng)險(xiǎn),比如,自然災(zāi)難、電力故障、網(wǎng)絡(luò)故障、硬件故障、軟件故障、人為故障等。

上面列舉了一大串風(fēng)險(xiǎn),其現(xiàn)實(shí)意義是,你今天躲過(guò)了硬件bug,明天避開了雷劈,后天繞開了斷電,大后天還是可能會(huì)“手滑”碰到誤刪除。

2、數(shù)據(jù)庫(kù)備份有哪些挑戰(zhàn)?

衡鐵剛:首先,數(shù)據(jù)庫(kù)資產(chǎn)盤點(diǎn),對(duì)于個(gè)人用戶,所有數(shù)據(jù)庫(kù)資產(chǎn)可能就是一個(gè)實(shí)例,不用盤點(diǎn)也非常清楚。對(duì)于企業(yè)用戶,特別是有一定規(guī)模的企業(yè),由于業(yè)務(wù)多樣性,數(shù)據(jù)庫(kù)可能不止一個(gè)實(shí)例,甚至不止一種數(shù)據(jù)庫(kù)類型。運(yùn)維人員需要搞清楚有哪些數(shù)據(jù)庫(kù),分布在哪些環(huán)境,哪些是測(cè)試數(shù)據(jù)庫(kù),哪些是生產(chǎn)數(shù)據(jù)庫(kù),哪些是核心數(shù)據(jù)庫(kù),跑著什么業(yè)務(wù),務(wù)必做到心中有數(shù)。

接下來(lái),備份系統(tǒng)評(píng)估,經(jīng)常有人問(wèn),備份如此基礎(chǔ)、常規(guī)的工作,為什么總給人關(guān)鍵時(shí)刻掉鏈子的感覺呢?究其原因,備份作為基礎(chǔ)工作,不會(huì)對(duì)業(yè)務(wù)發(fā)展起到推動(dòng)作用,不出問(wèn)題就無(wú)人問(wèn)津。反過(guò)來(lái),一旦出問(wèn)題,又立刻成為眾矢之的。對(duì)備份不重視、投入不足是導(dǎo)致其掉鏈子的主要原因。很多企業(yè)“備份重于一切”守則常掛嘴邊,然則口號(hào)震天響,風(fēng)過(guò)了無(wú)痕。

建議大家立刻問(wèn)下技術(shù)團(tuán)隊(duì):備份真的有效嗎?

3、什么是有效的備份系統(tǒng)?

衡鐵剛:因?yàn)閿?shù)據(jù)庫(kù)用途不同,備份系統(tǒng)有效性也有所不同,從數(shù)據(jù)庫(kù)用途上,大體分為測(cè)試數(shù)據(jù)庫(kù)、生產(chǎn)數(shù)據(jù)庫(kù)和核心數(shù)據(jù)庫(kù)。

對(duì)于測(cè)試數(shù)據(jù)庫(kù),首先要識(shí)別數(shù)據(jù)庫(kù)重要性,如果是個(gè)人測(cè)試用途,數(shù)據(jù)經(jīng)常導(dǎo)入和清空,多數(shù)情況是不用備份的,如果是研發(fā)用途,建議開啟備份,不要輕視測(cè)試數(shù)據(jù)庫(kù)的備份,企業(yè)中所有開發(fā)、測(cè)試人員都在測(cè)試數(shù)據(jù)庫(kù)上工作,一旦數(shù)據(jù)出現(xiàn)問(wèn)題,壓力撲面而來(lái),同時(shí)我們也看到,測(cè)試數(shù)據(jù)庫(kù)出問(wèn)題幾率往往高于生產(chǎn)數(shù)據(jù)庫(kù)。

對(duì)于生產(chǎn)數(shù)據(jù)庫(kù),首先要確保備份開啟,其次評(píng)估備份周期是否滿足要求,比如每天一個(gè)全量備份,一旦出現(xiàn)故障時(shí),數(shù)據(jù)最多丟失一天,最后備份數(shù)據(jù)有沒(méi)有恢復(fù)過(guò),確保備份數(shù)據(jù)是有效的。

對(duì)于核心數(shù)據(jù)庫(kù),其重要性高于測(cè)試數(shù)據(jù)庫(kù)和生產(chǎn)數(shù)據(jù)庫(kù),除了以上手段外,還要有額外手段。首先實(shí)時(shí)備份已經(jīng)成為企業(yè)選擇數(shù)據(jù)庫(kù)備份方案的必選項(xiàng),將故障發(fā)生時(shí)丟失數(shù)據(jù)量降到最小,其次快速恢復(fù)對(duì)核心數(shù)據(jù)庫(kù)價(jià)值越來(lái)越明顯,根據(jù)故障風(fēng)險(xiǎn),選擇最佳的恢復(fù)方案,最后整個(gè)備份恢復(fù)系統(tǒng)要定期演練,可以抽樣備份數(shù)據(jù)進(jìn)行恢復(fù),最好可以制定策略,定期自動(dòng)完成整個(gè)恢復(fù)過(guò)程,并產(chǎn)出演練報(bào)告。

特別提醒:

· 比不備份數(shù)據(jù)更糟糕的事情,就是不驗(yàn)證備份數(shù)據(jù)的有效性。設(shè)想一下,在災(zāi)難降臨時(shí),您的所有業(yè)務(wù)數(shù)據(jù)都被徹底摧毀,但在你想恢復(fù)數(shù)據(jù)時(shí),卻發(fā)現(xiàn)備份已損壞,備份錯(cuò)了文件,或者發(fā)生了其他可怕的情況,那時(shí)候該怎么辦呢? 沒(méi)有經(jīng)過(guò)驗(yàn)證的數(shù)據(jù)備份方案,本身就是一場(chǎng)災(zāi)難。

測(cè)試備份內(nèi)容可確保數(shù)據(jù)得到了妥善備份且可用于恢復(fù)。千萬(wàn)別等事到臨頭才悔不當(dāng)初。

· 不要迷信大而全方案,多樣需求就要由多樣方案滿足,特別對(duì)于核心數(shù)據(jù)庫(kù),既要有整個(gè)實(shí)例定期備份,以防實(shí)例損壞、硬件故障,同時(shí)也要有單表實(shí)時(shí)備份,往往在關(guān)鍵時(shí)刻,能省去90%數(shù)據(jù)恢復(fù)時(shí)間。

· 恢復(fù)數(shù)據(jù)校驗(yàn),無(wú)論是手工恢復(fù),還是自動(dòng)恢復(fù),主要是為了解決備份數(shù)據(jù)有效性問(wèn)題,其實(shí)對(duì)于恢復(fù)數(shù)據(jù),如何校驗(yàn)數(shù)據(jù)完整性非常具有挑戰(zhàn),目前多數(shù)情況是根據(jù)業(yè)務(wù)特征,將恢復(fù)數(shù)據(jù)與生產(chǎn)數(shù)據(jù)進(jìn)行抽樣比對(duì),也可以通過(guò)將恢復(fù)數(shù)據(jù)庫(kù)作為備庫(kù),與主庫(kù)同步來(lái)校驗(yàn)數(shù)據(jù)完整性。

4、有什么解決辦法?

衡鐵剛:還是那句話“不要等到數(shù)據(jù)丟失時(shí),才問(wèn)怎么辦”。趁現(xiàn)在給數(shù)據(jù)庫(kù)加一份保障,接下來(lái)介紹基于阿里云產(chǎn)品的幾個(gè)解決方案:

• 你的數(shù)據(jù)庫(kù)在阿里云ECS上,使用數(shù)據(jù)庫(kù)備份DBS將數(shù)據(jù)備份到OSS上,從購(gòu)買、配置到運(yùn)行,僅需5分鐘

• 你的數(shù)據(jù)庫(kù)在本地機(jī)房上,如果數(shù)據(jù)庫(kù)已開通公網(wǎng)可以使用數(shù)據(jù)庫(kù)備份DBS直接備份,或者通過(guò)開通阿里云專線,也可以使用數(shù)據(jù)庫(kù)備份DBS將數(shù)據(jù)備份到OSS上,根據(jù)DBS地域選擇,還可以做到異地備份

• 你的數(shù)據(jù)庫(kù)在非阿里云的云環(huán)境上,如果數(shù)據(jù)庫(kù)已開通公網(wǎng)可以使用數(shù)據(jù)庫(kù)備份DBS直接備份,或者通過(guò)部署代理、開通阿里云專線,都可以使用數(shù)據(jù)庫(kù)備份DBS將數(shù)據(jù)備份到OSS上,在阿里云上做跨云備份

5、請(qǐng)簡(jiǎn)單介紹下你的工作?

我目前在負(fù)責(zé)一款阿里云產(chǎn)品,就是上面提到的數(shù)據(jù)庫(kù)備份DBS,你聽過(guò)嗎?DBS已經(jīng)商用,作為數(shù)據(jù)庫(kù)備份通道,與對(duì)象存儲(chǔ)OSS一起構(gòu)建無(wú)門檻的云數(shù)據(jù)庫(kù)備份解決方案,整個(gè)配置過(guò)程只需5分鐘,就可以實(shí)現(xiàn)秒級(jí)RPO(Recovery Point Objective恢復(fù)點(diǎn)目標(biāo),通俗理解是當(dāng)數(shù)據(jù)庫(kù)故障時(shí),允許丟失多長(zhǎng)時(shí)間數(shù)據(jù),RPO越小越好)的實(shí)時(shí)備份。

除了為數(shù)據(jù)庫(kù)提供連續(xù)數(shù)據(jù)保護(hù)、低成本的備份服務(wù)外,DBS還可在多種環(huán)境下提供強(qiáng)有力的數(shù)據(jù)保護(hù),包括公共云、企業(yè)自建數(shù)據(jù)中心及其他云廠商。DBS具備低成本、高性能、零風(fēng)險(xiǎn)等優(yōu)勢(shì),為用戶提供理想的云數(shù)據(jù)庫(kù)備份解決方案。

目前,數(shù)據(jù)庫(kù)備份DBS提供的備份系統(tǒng)時(shí)刻被海量用戶驗(yàn)證,產(chǎn)品不僅擁有實(shí)時(shí)備份、秒級(jí)RPO的能力,同時(shí)還具備單表恢復(fù)能力,幫助用戶只恢復(fù)有價(jià)值的數(shù)據(jù),RTO可降到分鐘級(jí)。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)