服務器數據恢復環境&故障:
一臺服務器有32塊硬盤,采用Windows操作系統。
服務器在正常運行的時候突然變得不可用。沒有異常斷電、進水、異常操作、機房不穩定等外部因素。服務器管理員重啟服務器,但是服務器無法進入系統。管理員聯系北亞企安數據恢復工程師要求恢復服務器數據。
服務器數據恢復過程:
1、將故障服務器上所有硬盤做好標記后取出,經過硬件工程師檢測后沒有發現有硬盤存在硬件故障。將所有硬盤以只讀方式進行扇區級完整鏡像,鏡像完成后將所有硬盤根據標記按照原樣還原到原服務器中。后續的數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析所有磁盤底層數據,經過分析發現:故障服務器采用zfs文件系統。所有磁盤組建了幾組RAIDZ。熱備盤全部啟用。
在服務器ZFS文件系統中,池被稱為ZPOOL。ZPOOL的子設備可以有很多種類,包括塊設備、文件、磁盤等等,本案例中就是三組RAIDZ作為子設備。
經過分析發現,三組RAIDZ中的兩組RAIDZ分別啟用1個和3個熱備盤。熱備盤啟用后,第一組RAIDZ又有一塊盤離線,第二組RAIDZ則有兩塊硬盤離線。
通過上述分析結果模擬故障:三組RAIDZ中的兩組RAIDZ出現離線盤,熱備盤自動上線替換。熱備盤無冗余狀態下,其中一組RAIDZ出現離線硬盤的RAIDZ又有一塊盤離線,另外一組RAIDZ中又出現兩塊離線盤。ZPOOL進入高負荷狀態;2塊盤離線的RAIDZ中又有第三塊盤離線,RAIDZ崩潰、ZPOOL下線、服務器崩潰。
3、重組ZPOOL,追蹤數據入口。
ZFS對所有磁盤進行統一管理。在數據存儲時,ZFS會為每次寫入的數據分配適當大小的空間,并計算得到指向子設備的數據指針。這種精細化的管理方式使得ZFS能夠更高效地利用磁盤空間,并且在數據存儲和檢索時更加靈活和智能。
當出現缺盤情況時,常規RAID和ZFS的處理方式也截然不同。常規RAID通常可以通過校驗機制,利用剩余磁盤上的數據來恢復丟失的數據,因為它在存儲時已經按照固定的規則分布了校驗信息。
但對于ZFS管理的存儲池,當RAIDZ(ZFS的一種RAID實現方式)缺盤時,無法直接進行校驗得到數據。這是因為ZFS的存儲特性使得數據和校驗信息的分布更為復雜,必須將整個ZPOOL(ZFS存儲池)作為一個整體進行解析,才能嘗試恢復數據。這種方式雖然在缺盤恢復時相對復雜,但也保證了數據的完整性和一致性。
北亞企安數據恢復工程師手工截取事務塊數據,編寫程序獲取最大事務號入口。
獲取文件系統入口:
北亞企安數據恢復—RAIDZ數據恢復
獲取到文件系統入口后,北亞企安數據恢復工程師編寫數據指針解析程序進行地址解析。
解析數據指針:
北亞企安數據恢復—RAIDZ數據恢復
獲取到文件系統入口點在各磁盤分布情況后,數據恢復工程師開始手工截取并分析文件系統內部結構。經過分析發現入口分布所在的磁盤組無缺失盤,可直接提取信息。根據ZFS文件系統的數據存儲結構順利找到映射的LUN名稱,進而找到其節點。
4、經過分析發現此存儲中的ZFS版本與開源版本有較大差別,無法使用原先開發的解析程序進行解析,所以數據恢復工程師重新編寫數據提取程序。
北亞企安數據恢復—RAIDZ數據恢復
由于磁盤組內缺盤個數較多,每個IO流都需要通過校驗得到,提取進度極為緩慢。與用戶方溝通后得知,此ZVOL卷映射到XenServer作為存儲設備,用戶方所需的文件在其中一個vhd內。提取ZVOL卷頭部信息,按照XenStore卷存儲結構進行分析,發現該vhd在整個卷的尾部,計算得到其起始位置后從此位置開始提取數據。
5、Vhd提取完成后,驗證其內部的壓縮包及圖片、視頻等文件,均可正常打開。
交由用戶方驗證數據,經過驗證發現文件數量與系統自動記錄的文件個數一致。驗證文件可用性,文件全部可正常打開,服務器數據恢復工作完成。
審核編輯 黃宇
-
服務器
+關注
關注
14文章
10251瀏覽量
91480 -
RAID
+關注
關注
0文章
290瀏覽量
37666 -
數據恢復
+關注
關注
10文章
712瀏覽量
18983
發布評論請先 登錄
【服務器數據恢復】多盤掉線RAID6數據恢復:基于Reed-Solomon算法的修復
【服務器數據恢復】服務器raid5陣列raid模塊損壞的數據恢復案例
服務器數據恢復—RAIDZ多盤離線導致服務器崩潰的數據恢復案例
服務器數據恢復—硬盤指示燈亮黃燈,RAID5崩潰數據這樣恢復
服務器數據恢復—服務器斷電導致raid模塊損壞的數據恢復案例
服務器數據恢復—壞道“突襲”Raid5陣列,數據恢復大揭秘
服務器數據恢復—硬盤離線導致raid上層的卷無法掛載的數據恢復案例
服務器數據恢復——服務器異常斷電導致raid模塊損壞的數據恢復案例
服務器數據恢復—raid5陣列多塊硬盤離線導致EMC存儲不可用的數據恢復案例
服務器數據恢復—raid5陣列中硬盤壞道導致陣列崩潰的數據恢復案例
服務器數據恢復—RAIDZ多塊硬盤離線導致服務器崩潰的數據恢復案例
評論