一、用戶信息:
廣東某單位
二、數(shù)據(jù)恢復環(huán)境:
主機操作系統(tǒng):ESXI
分區(qū)類型:VSAN
存儲介質(zhì)清單 :一共8臺服務器節(jié)點,每節(jié)點2個磁盤組,其中1個磁盤組配置1塊SSD固態(tài)硬盤,4塊1.2T機械硬盤;另一個磁盤組配置1塊SSD固態(tài)硬盤,4塊2T機械硬盤。共計16塊SSD固態(tài)硬盤和64塊機械硬盤。
故障描述:一個節(jié)點服務器掉線,導致部分虛擬機無法訪問。
期望恢復數(shù)據(jù):恢復VSAN環(huán)境中故障虛擬磁盤數(shù)據(jù)。
三、數(shù)據(jù)恢復項目成員&分工:
項目主管 宋國建 負責每一步流程審核,項目協(xié)調(diào),方案制定。
商務工程師 王宇晴 負責反饋消息給用戶。
實施工程師 吳慶亮 負責技術(shù)實現(xiàn)。
四、初檢&恢復概率:
8臺服務器節(jié)點,64塊數(shù)據(jù)盤,16個SSD固態(tài)硬盤。在使用過程中,由于一個節(jié)點服務器故障離線,導致部分虛擬機數(shù)據(jù)無法訪問。
VSAN架構(gòu)比較復雜,元信息和數(shù)據(jù)結(jié)構(gòu)解析比較困難。節(jié)點服務器故障導致部分虛擬機無法訪問,這種情況下可能存在元信息丟失或者損壞的情況,需要拿到硬盤后具體分析。根據(jù)北亞企安做過大量VSAN數(shù)據(jù)恢復案例的經(jīng)驗,這種故障情況下數(shù)據(jù)恢復的可行性較大,完整恢復數(shù)據(jù)的可能性在98%以上。
五、數(shù)據(jù)恢復流程:
商務流程:
1、簽訂數(shù)據(jù)恢復協(xié)議、保密協(xié)議。
2、實施數(shù)據(jù)安全救援工作(見下方的技術(shù)流程)。
3、進行數(shù)據(jù)驗收。
A、驗收成功:客戶簽字確認;在約定周期內(nèi),完成付款及開具發(fā)票流程。提供后續(xù)數(shù)據(jù)保管、服務跟蹤及技術(shù)咨詢服務。
B、驗收不成功,銷毀中轉(zhuǎn)數(shù)據(jù)及已恢復數(shù)據(jù),移交設(shè)備。
技術(shù)流程:
1、備份:
A、將所有節(jié)點服務器斷電、關(guān)機,并取出所有數(shù)據(jù)硬盤和固態(tài)硬盤。
B、準備一臺恢復操作服務器(北亞企安提供)、一臺備份存儲(可北亞企安提供,也可因數(shù)據(jù)敏感等原因由用戶提供),在恢復平臺上以只讀方式掛載服務器硬盤,使用北亞企安磁盤備份工具(或 dd等工具)進行完整的扇區(qū)對扇區(qū)的備份。
C、備份完成后,提供詳細報告,涉及硬盤健康狀態(tài)及可能存在的壞道列表。
D、將服務器硬盤交回給用戶,之后不再直接操作原介質(zhì)。
2、故障硬盤修復:
檢測故障硬盤損壞情況,對可能存在故障的硬盤進行修復,并完整讀取故障硬盤中的數(shù)據(jù)。
3、磁盤組結(jié)構(gòu)分析:
A、對每個服務器節(jié)點上的SSD硬盤和機械硬盤進行分析;
B、分析磁盤組中,磁盤之間的聚合方式;
C、分析每個磁盤組中數(shù)據(jù)的分布情況;
D、分析磁盤組之間的聚合結(jié)構(gòu)。
4、虛擬機位圖分析:
A、定位磁盤組中虛擬機的位圖信息;
B、提取并解析磁盤組中虛擬機的位圖;
C、確定丟失虛擬磁盤的位圖信息。
5、虛擬磁盤拼接:
A、根據(jù)虛擬磁盤的位圖信息提取文件片段;
B、對虛擬磁盤文件的片段進行拼接;
C、校驗拼接后的磁盤文件的正確性。
6、快照合并:
A、使用恢復出的父盤文件進行快照合并;
B、校驗合并后的磁盤文件的正確性;
C、磁盤文件結(jié)構(gòu)修復。
7、解析并修復文件系統(tǒng):
A、校驗提取出的虛擬磁盤中文件系統(tǒng)的完整性及正確性;
B、對數(shù)據(jù)虛擬磁盤中的文件系統(tǒng)進行修復。
8、 解析文件系統(tǒng)及數(shù)據(jù)恢復:
A、使用專業(yè)的數(shù)據(jù)恢復軟件對虛擬磁盤中的文件系統(tǒng)進行解析及刪除數(shù)據(jù)恢復;
B、恢復虛擬磁盤中的所有被刪除的數(shù)據(jù)。
9、數(shù)據(jù)驗證:
A、由用戶主導對數(shù)據(jù)本身進行詳細驗證;
B、如發(fā)現(xiàn)新問題,重新檢驗上述所有恢復過程。
六、服務承諾:
1、整個數(shù)據(jù)恢復過程不會對原盤有任何的寫操作,以確保原盤的數(shù)據(jù)安全。
2、盡可能保證每一步操作可逆,確保人力可控范圍內(nèi)操作可回溯。
3、以上所有操作都是在有備份的情況下進行,若不成功不影響其他數(shù)據(jù)恢復方案的繼續(xù)。
七、數(shù)據(jù)恢復時間預估:
原始磁盤鏡像:約100G/每小時(可同步進行)
磁盤組結(jié)構(gòu)分析:2天
數(shù)據(jù)位圖分析:2天
磁盤文件拼接:2天
數(shù)據(jù)移交:1天
總時間:7-10個工作日,上述時間只是預估,以實際情況為準。
審核編輯 黃宇
-
服務器
+關(guān)注
關(guān)注
14文章
10253瀏覽量
91486 -
數(shù)據(jù)恢復
+關(guān)注
關(guān)注
10文章
712瀏覽量
18983
發(fā)布評論請先 登錄
【服務器數(shù)據(jù)恢復】多盤掉線RAID6數(shù)據(jù)恢復:基于Reed-Solomon算法的修復
【服務器數(shù)據(jù)恢復】服務器raid5陣列raid模塊損壞的數(shù)據(jù)恢復案例
【服務器數(shù)據(jù)恢復】服務器“泡水”硬盤掉線,數(shù)據(jù)竟這樣恢復
服務器數(shù)據(jù)恢復—一文讀懂服務器高頻故障排查+標準數(shù)據(jù)恢復流程
vsan數(shù)據(jù)恢復—VSAN超融合架構(gòu):供電異常的vsan數(shù)據(jù)恢復案例
vsan數(shù)據(jù)恢復—Vsan故障與SQLserver數(shù)據(jù)庫數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—EqualLogic存儲上raid5磁盤陣列數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—RAIDZ多塊硬盤離線導致服務器崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—服務器斷電導致raid模塊損壞的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—硬盤離線導致raid上層的卷無法掛載的數(shù)據(jù)恢復案例
數(shù)據(jù)庫數(shù)據(jù)恢復—服務器異常斷電導致Oracle數(shù)據(jù)庫故障的數(shù)據(jù)恢復案例
vsan數(shù)據(jù)恢復—vsan分布式服務器節(jié)點上raid數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—Linux系統(tǒng)服務器崩潰的數(shù)據(jù)恢復案例
虛擬化數(shù)據(jù)恢復—VMware虛擬化環(huán)境下重裝系統(tǒng)導致服務器數(shù)據(jù)丟失的數(shù)據(jù)恢復
服務器數(shù)據(jù)恢復-VSAN數(shù)據(jù)恢復方案
評論