服務器存儲數據恢復環境&故障:
一臺EVA存儲設備中有兩塊硬盤掉線,lun丟失。
將故障EVA存儲設備上的所有硬盤編號后取出。硬件工程師對所有硬盤進行硬件故障檢測。檢測后發現掉線硬盤不存在物理故障和壞道。將所有硬盤以只讀方式做全盤鏡像備份,鏡像完成后將所有磁盤按照編號還原到原EVA存儲設備中,后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
硬盤掉線,但是硬盤不存在物理故障,初步判斷硬盤掉線的原因是硬盤讀寫不穩定。讀寫不穩定的硬盤會被控制器識別為壞盤并踢出。
通過分析EVA存儲設備內的raid條目存儲形式,每個硬盤的不同塊組成一個raid條目,每個LUN都有一份LUN_MAP。EVA將LUN_MAP分別存放在不同的磁盤中,使用一個索引來指定其位置。因此去每個磁盤中找這個指向LUN_MAP的索引就可以找到現存LUN的信息了。
該案例中的LUN中的磁盤陣列都是RAID5陣列,只需要將一個LUN的RAID條目通過RAID5的校驗算法算出校驗值,再和原有的校驗值作比較就可以判斷這個條目中是否有掉線盤。將一個LUN的所有LUN_MAP都校驗一遍就可以知道這個LUN中哪些RAID條目中有掉線盤。這些RAID條目中都存在的那個盤就一定是掉線盤。排除掉線盤,然后根據LUN_MAP恢復所有LUN的數據即可。
服務器存儲數據恢復過程:
1、北亞企安數據恢復工程師編寫程序掃描全部LUN_MAP,結合人工分析獲取到準確的LUN_MAP。數據恢復工程師編寫程序檢測所有LUN中掉線的磁盤,結合人工分析排除掉線的磁盤。數據恢復工程師編寫程序,結合LUN_MAP恢復所有LUN數據。人工核對每個LUN,確認是否和用戶方工程師描述的一致。
2、根據用戶方工程師描述,所有LUN的數據分成兩大部分:Vmware的虛擬機和HP-UX上的裸設備。裸設備存放的是Oracle的dbf數據庫。由于恢復的是LUN,無法看到里面的文件,因此需要人工的核對哪些LUN是存放Vmware的數據,哪些LUN是存放HP-UX的裸設備。然后將LUN掛載到不同的驗證環境中驗證恢復的數據是否完整。
3、在一臺服務器上安裝了ESXI虛擬主機環境,然后通過iSCSI的方式將恢復出來的LUN掛載到虛擬主機上。
但是在VMware vSphere Client上掃描,卻沒有發現掃描到vmfs卷。發現因為EXSI版本不同。
數據恢復工程師于是換一種驗證方式:將所有符合vmware虛擬機的LUN里面的虛擬機文件都生成出來,然后通過NFS共享的方式掛載到虛擬主機上,然后將虛擬機一個一個的添加到清單。
4、通過NFS將所有虛擬機都添加到虛擬主機以后,將所有虛擬機都加電開機,都能啟動系統。交由用戶方工程師遠程驗證虛擬機里面的數據,確認沒有問題。本次數據恢復工作完成。
-
硬盤
+關注
關注
3文章
1361瀏覽量
59876 -
數據恢復
+關注
關注
10文章
712瀏覽量
18983
發布評論請先 登錄
【服務器數據恢復】多盤掉線RAID6數據恢復:基于Reed-Solomon算法的修復
服務器數據恢復—EqualLogic存儲硬盤離線導致上層虛擬機不可用的數據恢復案例
【服務器數據恢復】EVA存儲硬盤離線,LUN丟后數據如何“重生”?
評論