服務器數(shù)據(jù)恢復環(huán)境&故障:
一臺emc某型號存儲服務器,存儲服務器上組建了一組raid5磁盤陣列,陣列中有兩塊磁盤作為熱備盤使用。存儲服務器在運行過程中有兩塊磁盤出現(xiàn)故障離線,但是只有一塊熱備盤激活,最終導致該raid5陣列崩潰,上層應用無法正常使用。
服務器故障檢測:
將故障存儲服務器中所有磁盤編號后取出,由硬件工程師對兩塊掉線的硬盤進行物理故障檢測,經(jīng)過檢測發(fā)現(xiàn)這2塊離線的磁盤確實存在物理故障,需要對這2塊盤進行物理故障修復后才能進行下一步的數(shù)據(jù)恢復,存儲服務器中其他硬盤經(jīng)過檢測沒有發(fā)現(xiàn)存在物理故障及壞道。
將故障存儲服務器中的完好硬盤以只讀方式進行扇區(qū)級的全盤鏡像。針對存在物理故障的2塊磁盤,由硬件工程師進行開盤處理后使用專業(yè)工具進行全盤鏡像。由于故障存儲服務器中所有磁盤的扇區(qū)大小為520字節(jié),在進行數(shù)據(jù)恢復之前需要將所有鏡像數(shù)據(jù)做520字節(jié)to512字節(jié)的轉(zhuǎn)換。
服務器數(shù)據(jù)恢復過程:
1、基于鏡像文件分析所有磁盤底層數(shù)據(jù),經(jīng)過分析發(fā)現(xiàn)故障存儲服務器中的兩塊熱備盤是空的,沒有寫入任何數(shù)據(jù),據(jù)此推斷有一塊熱備盤雖然上線,但此時raid陣列仍處于缺盤狀態(tài),數(shù)據(jù)并沒有開始同步。
2、通過分析底層數(shù)據(jù)獲取到條帶大小、磁盤順序等raid陣列結(jié)構(gòu)基礎(chǔ)信息,利用這些信息虛擬重組raid5陣列。
3、由于該型號存儲服務器的LUN是基于RAID5陣列的,在raid5陣列重組完成之后,需要分析LUN在RAID陣列中的分配信息以及LUN分配的數(shù)據(jù)塊MAP。
4、根據(jù)上一步獲取到的信息,使用北亞企安自研程序解釋LUN的數(shù)據(jù)MAP并導出LUN的所有數(shù)據(jù)。
5、使用北亞企安自研的ZFS文件系統(tǒng)解釋程序?qū)ι傻腖UN做文件系統(tǒng)解釋,但是在解釋某些文件系統(tǒng)元文件的時候程序報錯。開發(fā)工程師對該解釋程序做debug調(diào)試并分析程序報錯原因,與此同時,文件系統(tǒng)工程師分析ZFS文件系統(tǒng)是否存在問題。經(jīng)過數(shù)小時的分析與調(diào)試,最終確認導致程序無法正常解釋ZFS文件系統(tǒng)的原因:ZFS文件系統(tǒng)中某些元文件損壞。對損壞的元文件進行分析,發(fā)現(xiàn)ZFS文件系統(tǒng)正在進行I/O操作的時候存儲服務器癱瘓,導致部分文件系統(tǒng)元文件損壞。
6、北亞企安數(shù)據(jù)恢復工程師對損壞的ZFS文件系統(tǒng)元文件進行手工修復,直到ZFS文件系統(tǒng)能夠正常解析。
7、對修復后的ZFS文件系統(tǒng)進行解析并驗證數(shù)據(jù)。經(jīng)過用戶方工程師的仔細驗證,確認存儲服務器內(nèi)所有數(shù)據(jù)成功恢復。本次存儲服務器數(shù)據(jù)恢復工作完成。
審核編輯 黃宇
-
存儲
+關(guān)注
關(guān)注
13文章
4791瀏覽量
90059 -
服務器
+關(guān)注
關(guān)注
14文章
10253瀏覽量
91484 -
數(shù)據(jù)恢復
+關(guān)注
關(guān)注
10文章
712瀏覽量
18983 -
emc
+關(guān)注
關(guān)注
176文章
4390瀏覽量
191573 -
RAID5
+關(guān)注
關(guān)注
0文章
137瀏覽量
13317
發(fā)布評論請先 登錄
【服務器數(shù)據(jù)恢復】服務器raid5陣列raid模塊損壞的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—5盤RAID5中的4盤重建RAID5,RAID5數(shù)據(jù)恢復秘籍!
服務器數(shù)據(jù)恢復—EqualLogic存儲上raid5磁盤陣列數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—硬盤指示燈亮黃燈,RAID5崩潰數(shù)據(jù)這樣恢復
服務器數(shù)據(jù)恢復—Raid5兩盤損壞熱備盤未啟咋恢復?
服務器數(shù)據(jù)恢復—服務器斷電導致raid模塊損壞的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—熱備盤上線過程中硬盤掉線導致數(shù)據(jù)丟失,數(shù)據(jù)恢復揭秘
服務器數(shù)據(jù)恢復—壞道“突襲”Raid5陣列,數(shù)據(jù)恢復大揭秘
raid5數(shù)據(jù)恢復—Raid陣列重建后如何恢復原陣列的數(shù)據(jù)?
raid5數(shù)據(jù)恢復—raid5陣列熱備盤未完全激活導致崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—raid5陣列多塊硬盤離線導致EMC存儲不可用的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—V7000存儲上raid5熱備盤同步失敗的數(shù)據(jù)恢復方案
服務器數(shù)據(jù)恢復—raid5陣列中硬盤壞道導致陣列崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復-EMC存儲raid5熱備盤未激活的數(shù)據(jù)恢復案例
評論