不出所料,這次雲硬盤故障,運維人員又“背鍋”了。

運維要想不背鍋,就需要從掌握災備知識做起。不管你是西二旗的小王、陸家嘴軟件園的小孫,還是科興科學園的小張,今天,就讓我們重新武裝自己,一起溫習數據及業務保護的那些知識,早日擺脫背鍋俠的宿命。

備份

備份是指數據或系統的備份,它是容災的基礎,是指爲防止系統出現操作失誤或故障導致的數據丟失,而將全部或部分數據集合從應用主機的硬盤或陣列複製到其它存儲介質的過程。

按照備份的數據量,可以分爲全量備份、增量備份、差量備份,可以從下圖看出它們之間的差異:

按照備份時間頻率,可以分爲定時備份、實時備份。

定時備份——是指有時間間隔的數據備份方式,比如一天一次,一週一次,或者一個月一次,定時備份不能保證數據的零丟失。

實時備份——是指無時間間隔的數據備份方式,通過實時數據複製,保證主備兩端的數據讀寫一致,確保數據的零丟失。

根據數據備份時服務器是否停機又可分爲冷備和熱備;按照數據存儲介質之間的距離又可以分爲本地備份和異地備份。

通過網絡進行備份是熱備的主要方式,其主要的傳輸模式如圖:

備份是DBA的重要法寶。備份是第一位,有了安全的數據備份,哪怕遭遇一般的災難,也可以從容應對。

快照

快照是指一種快速數據保護技術,快照是某個數據集在某一特定時刻的鏡像,也稱爲即時拷貝,是數據集的一個完整可用的副本。

快照實現的技術方式包括:寫時複製 (COW)、I/O重定向 (I/O Redirect)、鏡像分離 (Split Mirror)、克隆快照(COW with Copy)、持續數據保護(CDP)等。

快照有兩個作用:

一是能夠進行在線數據恢復,當存儲設備發生應用故障或者文件損壞時可以進行及時數據恢復,將數據恢復成快照產生時間點的狀態。

二是爲存儲用戶提供額外的數據訪問通道,當原數據進行在線應用處理時,用戶可以訪問快照數據,還可以利用快照進行測試等工作。

目前主流的快照技術包括鏡像分裂快照技術、按需備份快照技術、指針重映射快照技術、增量快照技術等。

快照產品一般有三種基本形式:基於存儲設備、卷級別和文件系統級別。

歸檔

歸檔是把不常訪問的數據遷移到其他存儲設備上。遷移後可以選擇在原系統中留下歸檔存根,用戶通過對歸檔存根直接訪問,自動回調歸檔數據,從而實現透明訪問歸檔數據。

歸檔的特點包括改變了系統中的數據及狀態;可大量節省在線存儲空間,提高在線存儲性能;提高備份/恢復速度,並節省備份介質。

歸檔的主要應用對象:文件系統、NAS;郵件系統:MS Exchange、Lotus Domino;文檔系統:SharePoint等。

歸檔的技術路線:

首先設定一個時間線,把文件分成常用數據和歷史數據兩個部分。

其次要定期進行歸檔操作,把歷史數據存放于歸檔存儲,歸檔後的文件/郵件在原處可留下存根;用戶訪問存根,歸檔文件/郵件自動回調。

最後,歸檔後,只需要對常用數據進行備份,大大減少備份數據量;同理,只要恢復常用數據,系統就能工作,大大降低恢復時間。

CDP

CDP(Continual Data Protection)是一種連續數據保護技術,它兼具數據備份與數據恢復的功能,通過CDP實時備份技術,可以實現到秒級的細粒度抓捕效果。

目前,主流的CDP有很多維度,包括基於存儲數據塊的,存儲快照的,操作系統IO層的。

採取不同的技術維度,所獲得的數據還原細粒度也有所差別,根據恢復的細粒度的大小,業界將CDP分爲真CDP(True CDP)和準CDP(Near CDP)。

真CDP技術是持續不間斷的監控並備份數據變化,可以恢復到過去任意時間點,是真正的實時備份,不會造成數據的丟失。準CDP是指接近持續數據保護,數據備份存在延時,也就是意味着存在部分數據丟失的風險。

根據用戶對RPO的要求以及災備策略的不一樣,CDP技術方案選擇有很大自主性,但是隨着數據量的增長和業務信息化的加快,未來的趨勢將是以真CDP爲主。英方i2CDP屬於真CDP技術,能夠提供細粒度數據持續保護,可恢復至任意歷史時間點。

上面的備份、快照、歸檔和CDP,其實都是爲了數據和業務的恢復。

狹義的恢復(Recovery)定義是指重新創建生產系統應用或計算環境的過去操作狀態,包含完全恢復和小顆粒恢復兩種模式。

廣義的災難恢復(國內通常簡稱爲災備或容災)則屬於業務連續性的技術層面。在用戶信息服務中斷後,需要快速調動各種資源,在異地重建信息技術服務平臺(包括基礎架構、通信、系統、應用及數據),災難恢復也包括本地的恢復與重建。

容災

通俗地講,這就是容災的範疇。容災,從廣義上講,任何提高系統可用性的措施都可稱之爲容災,它的主要作用是幫助用戶快速恢復系統正常功能,持續對外提供服務。

它分爲本地容災、異地容災、雲容災。

本地容災,一般指主機集羣,當某臺主機出現故障,不能正常工作時,其他的主機可以替代該主機,繼續進行正常的工作。

異地容災,一般指在與生產機房有一定距離的異地建立與生產機房類似的信息平臺(備份中心),並採用特定的技術將生產中心的數據傳輸到該備份中心,從而在生產中心發生較大的災難如火災或地質災害時,仍能對生產數據進行保護的容災系統。

雲容災,一般指雲數據中心的物理機或虛擬機容災。雲主機系統由大量服務器組成並分佈在不同的地點,同一時間爲大量用戶服務,因此雲計算系統採用分佈式存儲的方式存儲數據,用冗餘存儲的方式(集羣計算、數據冗餘和分佈式存儲)保證數據的可靠性。這種方式保證分佈式數據的高可用、高可靠和經濟性,即爲同一份數據存儲多個副本。

綜上,評判數據保護和容災方案優劣的兩個重要參考指標是:RTO和RPO。

RTO是指災難發生後,從系統宕機導致業務停頓之刻開始,到系統恢復至可以支持業務部門運作,業務恢復運營之時,此兩點之間的時間。RTO可簡單的描述爲企業能容忍的恢復時間。

RPO是指災難發生後,容災系統能把數據恢復到災難發生前時間點的數據。它是衡量企業在災難發生後會丟失多少生產數據的指標。RPO可簡單的描述爲企業能容忍的最大數據丟失量。

總而言之,不管是在本地還是雲端,或者兩者之間的災備,數據實時備份、數據恢復粒度越小和容災切換接管越快,將是未來災備領域數據和業務保護的趨勢。

英方基於字節級增量實時複製技術、數據序列化一致性傳輸技術和數據庫語言級同步複製技術,能夠爲各類用戶在物理、虛擬或雲計算平臺的關鍵業務提供連續保護及快速恢復。下圖是一個300M大小的文件修改了512B文件後的三種複製技術的數據傳輸量。

同時英方雲(i2yun.com)作爲英方旗下企業業務連續性雲服務平臺,基於互聯網爲企業用戶提供在線熱遷移、實時備份和恢復,以及應用高可用等服務,讓用戶數據和業務在私有云、公有云或者混合雲上實現自由的流動、保護、應用和分享。

查看原文 >>
相關文章