RAIDコントローラによる、で終わってしまう話のような気がしますが、昔Data ONTAPでHDDの警告出たけど切り離されずにそのまま使用されている状態だったときに、サポートやCEから聞いた話をします。うろ覚えなので多少間違っているかも知れません。
RAIDコントローラはいろいろな点でHDDを監視しています。S.M.A.R.Tというのを聞いたことがあると思いますが、HDDでは、読み込みエラーや書き込みエラー、その他いろいろなエラーについて自動的に検出し、その回数等を取得できる機能を持っています。RAIDコントローラはそのエラー回数等を常に監視しており、製品によって(または設定によって)決められた回数以上になればそのHDDは使用できないと判断し、切り離しを行うようになっているとのことです。使用できないと判断する回数はエラーの種類によって異なり、軽微なエラーであれば多少あってもそのまま使用するし、重大なエラーは1回でも起きると故障と判断することもあるそうです。なお、許容範囲内の軽微なエラーであっても、サポートの判断によっては予防交換する場合もあります。また、故障とする回数は、同じメーカーの製品であっても機種などによって異なり、SSDやSASなどといったディスクやインターフェースの種類によっても異なるそうで、このエラーは何回というのが常に決まっているわけでは無いそうです。なお、このエラー検出は、不良セクタなどのOSからも見えるレベルでは無く、ハード部分の内部動作でエラーが無いかを見ていることに注意してください。実際に不良セクタなどがなくても、エラー回数等から故障する前兆であると判断して切り離す場合もあるそうです(むしろ、不良セクタが出てからでは遅い方で、前兆段階で切り離せるのがいい製品らしいです。ただ、あまりにも厳しいと交換ばかりになるので、そこら辺のバランスが取れているかが各メーカーの見せ所らしいです)。
以上ですが、上の話は100万円以上する専用NASや専用SANストレージでの話なので、低価格のNASやソフトウェアRAIDでは事情が異なる可能性があります。サーバ用のハードウェアRAIDであれば、似たような仕組みを持っている可能性は高いですが、専用NAS等に比べると作り込みのレベルは落ちると思います。
また、メタ情報が壊れた場合、一般的に復旧は不可能です(専門の業者に頼めば、一応復旧はできる場合もありますが、料金はとても高いです)。メタ情報が壊れる原因はソフトのバグやオペレーションミスであり、RAIDが守る範囲を超えています。もうひとつ、まともなRAIDコントローラではメタ情報を二重三重にバックアップするため、物理故障で破壊されることはありません。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2015/08/21 13:02