如何提高RAID 5數(shù)據(jù)恢復(fù)的成功率

對于IT管理員而言,遭遇RAID數(shù)據(jù)災(zāi)難總是最為頭痛的,因為相關(guān)恢復(fù)技術(shù)涉及到的知識面太廣,普通管理員甚至服務(wù)器廠商的工程師都無法解決。既然RAID數(shù)據(jù)災(zāi)難不應(yīng)當(dāng)由管理員來進行處理,那么管理員在此時又應(yīng)該如何處理呢?我們采訪了的資深數(shù)據(jù)恢復(fù)工程師,他將告訴您如何才能確保較高的恢復(fù)成功率。


常見問題解答-廣州天翱信息科技有限公司


不要強行上線:危險的操作方法

在服務(wù)器的某一個硬盤出現(xiàn)故障時,一般服務(wù)器都會有一個Offline指示燈提示,此時要求用戶更換一個完好的相同硬盤,并且重新校驗算法。按理說這是非常正常的操作過程,但是殊不知很多RAID災(zāi)難就是由此而引起的。

以一個硬盤數(shù)量比較多的RAID5磁盤陣列為例,很可能同時采購的多個硬盤中,有幾個已經(jīng)出現(xiàn)了不穩(wěn)定現(xiàn)象。而服務(wù)器的Offline提示可能并不是最準確的,經(jīng)常會誤報(也有硬盤不穩(wěn)定的因素)或是遺漏其它也同樣存在隱患的硬盤。在看似平常的強制上線過程中,硬盤需要進行大量的讀寫操作,此時就是一場嚴峻的考驗:運氣好的話自然平穩(wěn)度過,而運氣不好就會導(dǎo)致其它硬盤突然掉線,此時就令問題更加棘手了。

當(dāng)然,出現(xiàn)一個硬盤掉線提示,或是在RAID容錯范圍以內(nèi)的掉線提示,強制上線還是必須執(zhí)行的操作。但是在進行這一步前,強烈建議大家檢測一下每一個硬盤的穩(wěn)定性情況,這樣才更加保險。大家可不要忽視這樣一個小細節(jié),往往這一步能夠讓RAID服務(wù)器沒免于癱瘓。


保護第一現(xiàn)場:什么都不做才最安全

對于廠商而言,所有的質(zhì)保承諾僅僅局限于硬件設(shè)備,也就是說磁盤陣列故障后所引發(fā)的數(shù)據(jù)危機與之毫無關(guān)系,負責(zé)為用戶更換或者維修已經(jīng)算是“克盡職守”。但是用戶所需要的并不是找回硬盤或是重建RAID,而是更價值不菲的數(shù)據(jù)。如果尋找整機廠商,此時無異于“自討苦吃”,因為所謂的售后服務(wù)根本沒有從用戶的本源需求出發(fā),盡快確保硬件設(shè)備完好反而犧牲了數(shù)據(jù)。當(dāng)然,知名品牌的服務(wù)器廠商或是代理商會主動選擇為大客戶的RAID數(shù)據(jù)恢復(fù)服務(wù)費“埋單”,但是這也僅僅是個別情況。

據(jù)數(shù)據(jù)恢復(fù)中心的主管工程師介紹,因為尋找服務(wù)商的售后服務(wù)工程師修復(fù)而導(dǎo)致最終數(shù)據(jù)徹底破壞的案例幾乎每個星期都會發(fā)生。畢竟售后服務(wù)工程師基本都偏向于硬件,而RAID數(shù)據(jù)恢復(fù)則是以軟件類操作為主。

此外,即便是簡單的檢驗性操作,也有可能為后期的數(shù)據(jù)恢復(fù)帶來不便。以普通RAID5恢復(fù)為例,當(dāng)硬盤損壞超過容錯能力時,必須將損壞硬盤的鏡像完全提取才能進行最終的恢復(fù)。而如果頻繁對硬盤上電,很容易造成磁頭進一步疲勞損傷,甚至劃傷盤片。正確的處理方法應(yīng)當(dāng)是立即咨詢專業(yè)數(shù)據(jù)恢復(fù)服務(wù)商。


選擇專業(yè)數(shù)據(jù)恢復(fù)服務(wù)商:切莫迷失方向

根據(jù)數(shù)據(jù)恢復(fù)中心的統(tǒng)計,很多數(shù)據(jù)恢復(fù)失敗的案例都是因為用戶尋求了并不正確的解決途徑。服務(wù)器用戶所依靠的售后服務(wù)也往往不夠?qū)I(yè),RAID 磁盤列陣出現(xiàn)問題之后輕易選擇重建,數(shù)據(jù)丟失情況更是雪上加霜。在選擇數(shù)據(jù)恢復(fù)服務(wù)商時,根據(jù)規(guī)模以及業(yè)界口碑來判斷是一條可行的捷徑。而在這一方面,服務(wù)網(wǎng)點遍及全國的數(shù)據(jù)恢復(fù)中心有著深厚的積累,能夠幫助廣大遭遇RAID數(shù)據(jù)災(zāi)難的用戶及時度過難關(guān)。