案例一:6盤RAID6多盤離線,數(shù)據(jù)庫與網(wǎng)站文件完整恢復(fù)
客戶一臺(tái)搭載6塊750G硬盤的WEB服務(wù)器采用RAID6陣列,前期已有兩塊硬盤先后離線,運(yùn)維人員未及時(shí)更換處理,直至第三塊硬盤離線后陣列直接崩潰,服務(wù)器內(nèi)全部數(shù)據(jù)丟失。該服務(wù)器運(yùn)行MySQL數(shù)據(jù)庫,同時(shí)存儲(chǔ)大量業(yè)務(wù)文件,客戶此前委托某數(shù)據(jù)恢復(fù)公司處理,仍有近一個(gè)月的文件損壞、缺失,MySQL數(shù)據(jù)庫也嚴(yán)重?fù)p壞,后經(jīng)運(yùn)維人員推薦,客戶聯(lián)系到北亞數(shù)據(jù)恢復(fù)中心進(jìn)行數(shù)據(jù)恢復(fù)。
我司工程師接收硬盤后,首先將6塊磁盤完整鏡像備份至安全存儲(chǔ)池,全程不再操作原始磁盤,最大限度保障原始數(shù)據(jù)完整性。通過對(duì)備份鏡像深度分析發(fā)現(xiàn),其中兩塊硬盤離線時(shí)間較早,已不再寫入最新數(shù)據(jù)。該RAID6采用雙校驗(yàn)機(jī)制,第一校驗(yàn)基于常規(guī)XOR運(yùn)算,第二校驗(yàn)采用復(fù)雜的Reed-Solomon算法,數(shù)學(xué)邏輯嚴(yán)謹(jǐn)且恢復(fù)難度極高。
由于陣列依賴第二校驗(yàn)存儲(chǔ)最新數(shù)據(jù),若不依托該校驗(yàn)進(jìn)行重組,必然導(dǎo)致最新數(shù)據(jù)丟失或損壞,而市面通用數(shù)據(jù)恢復(fù)軟件雖標(biāo)注相關(guān)功能,實(shí)際無法有效支撐此類復(fù)雜恢復(fù),這也是前序機(jī)構(gòu)未能完整恢復(fù)數(shù)據(jù)的核心原因。北亞數(shù)據(jù)恢復(fù)工程師精準(zhǔn)解析出原始RAID關(guān)鍵參數(shù)后,使用北亞企安自研專用RAID6恢復(fù)工具,重組生成完整數(shù)據(jù)鏡像,再將鏡像遷移至客戶新搭建的存儲(chǔ)陣列中。服務(wù)器開機(jī)后運(yùn)行正常,經(jīng)客戶全面核驗(yàn),所有文件與數(shù)據(jù)庫均無異常,本次數(shù)據(jù)恢復(fù)圓滿成功。
案例二:4盤RAID5雙盤故障,Windows 2000系統(tǒng)完整修復(fù)
客戶一臺(tái)服務(wù)器由4塊18GB硬盤組建RAID5陣列,陣列卡型號(hào)為NetRaid,搭載Windows server系統(tǒng)與SQL Server數(shù)據(jù)庫。運(yùn)維過程中,一塊硬盤故障燈亮起,服務(wù)器仍短暫運(yùn)行,未及時(shí)處理后很快第二塊硬盤也出現(xiàn)故障告警,系統(tǒng)隨即癱瘓無法正常啟動(dòng)。
北亞數(shù)據(jù)恢復(fù)工程師到場(chǎng)后,在服務(wù)器硬件自檢至陣列環(huán)節(jié)時(shí)按Ctrl+M進(jìn)入NetRaid管理界面,檢測(cè)到陣列內(nèi)硬盤狀態(tài)為Failed。首次嘗試將其中一塊故障硬盤強(qiáng)制設(shè)為OnLine,重啟后硬件自檢不通過,系統(tǒng)啟動(dòng)失敗。
隨后北亞數(shù)據(jù)恢復(fù)工程師重新進(jìn)入陣列管理工具,先將此前強(qiáng)制上線的硬盤手動(dòng)標(biāo)記為Fail,再將另一塊故障硬盤設(shè)置為OnLine,重啟后服務(wù)器成功進(jìn)入系統(tǒng),系統(tǒng)與數(shù)據(jù)庫均運(yùn)行正常。接著在陣列配置界面對(duì)故障硬盤執(zhí)行Rebuild重建操作,重建完成后重啟服務(wù)器,陣列狀態(tài)、系統(tǒng)及業(yè)務(wù)均恢復(fù)正常,數(shù)據(jù)完整無丟失,恢復(fù)工作順利完成。
案例三:20盤服務(wù)器多盤離線,Oracle數(shù)據(jù)庫完整恢復(fù)
一臺(tái)配備20塊硬盤的服務(wù)器因未知原因業(yè)務(wù)突然中斷,機(jī)房管理員檢查發(fā)現(xiàn)3塊磁盤離線,遂按原槽位順序取出所有硬盤,送至北亞數(shù)據(jù)恢復(fù)中心進(jìn)行數(shù)據(jù)恢復(fù)。
北亞數(shù)據(jù)恢復(fù)工程師使用專業(yè)數(shù)據(jù)恢復(fù)設(shè)備檢測(cè)所有硬盤,確認(rèn)硬盤均可正常識(shí)別,無嚴(yán)重物理損壞,無需進(jìn)行硬件修復(fù),有效規(guī)避了物理故障導(dǎo)致的恢復(fù)風(fēng)險(xiǎn)。隨后對(duì)全部硬盤做鏡像備份,過程中發(fā)現(xiàn)原離線的3塊硬盤鏡像速度極慢,判斷盤內(nèi)存在大量壞道與不穩(wěn)定扇區(qū),這也是其在服務(wù)器環(huán)境中離線的主要原因。北亞數(shù)據(jù)恢復(fù)工程師通過調(diào)整鏡像策略跳過壞扇區(qū),最終完成所有硬盤完整鏡像。
鏡像完成后,北亞數(shù)據(jù)恢復(fù)工程師通過底層數(shù)據(jù)分析工具,結(jié)合ext3文件系統(tǒng)逆向解析,確定硬盤盤序與陣列校驗(yàn)信息,完成RAID重組。初步提取Oracle dmp備份文件時(shí),導(dǎo)入出現(xiàn)imp-0008報(bào)錯(cuò),經(jīng)日志分析判定為文件結(jié)構(gòu)異常。北亞數(shù)據(jù)恢復(fù)工程師重新深度分析RAID結(jié)構(gòu)與ext3文件系統(tǒng)損壞程度,耗時(shí)數(shù)小時(shí)重新恢復(fù)dmp文件與dbf原始庫文件。
重新交付的dmp文件導(dǎo)入測(cè)試無異常,dbf文件校驗(yàn)全部通過,經(jīng)客戶核驗(yàn),所有業(yè)務(wù)數(shù)據(jù)均完整恢復(fù)。最后北亞數(shù)據(jù)恢復(fù)工程師協(xié)助客戶搭建新RAID陣列,將恢復(fù)后的數(shù)據(jù)完整遷移回服務(wù)器,系統(tǒng)與數(shù)據(jù)庫正常上線,本次數(shù)據(jù)恢復(fù)成功。
-
服務(wù)器
+關(guān)注
關(guān)注
14文章
10325瀏覽量
91667 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
721瀏覽量
19029
發(fā)布評(píng)論請(qǐng)先 登錄
【服務(wù)器數(shù)據(jù)恢復(fù)】多盤掉線RAID6數(shù)據(jù)恢復(fù):基于Reed-Solomon算法的修復(fù)
【服務(wù)器數(shù)據(jù)恢復(fù)】服務(wù)器raid5陣列raid模塊損壞的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—5盤RAID5中的4盤重建RAID5,RAID5數(shù)據(jù)恢復(fù)秘籍!
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線致raid5陣列崩潰,數(shù)據(jù)恢復(fù)大揭秘
服務(wù)器數(shù)據(jù)恢復(fù)—EqualLogic存儲(chǔ)上raid5磁盤陣列數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—Raid6陣列數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器斷電導(dǎo)致raid模塊損壞的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—服務(wù)器上的卷被誤刪數(shù)據(jù)如何恢復(fù)?
服務(wù)器數(shù)據(jù)恢復(fù)—壞道“突襲”Raid5陣列,數(shù)據(jù)恢復(fù)大揭秘
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致raid上層的卷無法掛載的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列多塊硬盤離線導(dǎo)致raid崩潰的數(shù)據(jù)恢復(fù)
服務(wù)器RAID陣列故障數(shù)據(jù)恢復(fù)典型案例與技術(shù)解析
評(píng)論