質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
OS

OS(オペレーティングシステム)は、システムソフトウェアの一種であり、一般的に、ハードウェアを直接的に管理・操作する最も中心的な機能を有するソフトウェアがオペレーティングシステムとして呼ばれます。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

UNIX

UNIXとは、AT&Tのベル研究所で開発されたコンピューター用のマルチユーザー・マルチタスクのオペレーションシステム(OS)です。政府や教育機関や研究所で広範囲に採用されています。

サーバ

サーバは、 クライアントサーバモデルにおいてクライアントからの要求に対し 何らかのサービスを提供するプログラムを指す言葉です。 また、サーバーソフトウェアを稼動させているコンピュータ機器そのもののことも、 サーバーと呼ぶ場合もあります。

Q&A

解決済

1回答

2807閲覧

HDD障害発生時の冗長化されているRAIDの一般的な挙動について

nob777

総合スコア112

OS

OS(オペレーティングシステム)は、システムソフトウェアの一種であり、一般的に、ハードウェアを直接的に管理・操作する最も中心的な機能を有するソフトウェアがオペレーティングシステムとして呼ばれます。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

UNIX

UNIXとは、AT&Tのベル研究所で開発されたコンピューター用のマルチユーザー・マルチタスクのオペレーションシステム(OS)です。政府や教育機関や研究所で広範囲に採用されています。

サーバ

サーバは、 クライアントサーバモデルにおいてクライアントからの要求に対し 何らかのサービスを提供するプログラムを指す言葉です。 また、サーバーソフトウェアを稼動させているコンピュータ機器そのもののことも、 サーバーと呼ぶ場合もあります。

0グッド

3クリップ

投稿2015/08/20 12:19

編集2015/08/20 12:27

RAID1や5のような冗長化されているRAIDについて、HDD障害発生時の一般的な挙動に関しての質問になります。
通常、HDDに障害が発生すると、障害の発生したHDDを除いた(もしくは障害の発生したセクタを除いた)HDDで稼働すると思います。(この時、RAIDは修復を試みるかもしれまんが・・・)。
そもそもHDDが故障して一切動作しない場合は分かるのですが、
微妙なラインのHDD障害時にどこまでをRAIDが障害発生と認識するのかを
知りたいです。

A.代替えセクタが無い状況下での不良セクタ発生時(物理的な障害)
B.不良セクタ発生時(物理的な障害)
C.メタ情報破壊時(論理的な障害)
D.etc・・・

※Cのような論理的な障害も認識する場合、修復を試みてくれるものなのでしょうか?
※微妙なラインですので、ソフトウエアRAID、ハードウエアRAID、使用しているRAIDコントローラ等によるところもあるかと思います。
確認したいのは一般的なRAIDの振る舞いとして、ここまでは障害として認識するだろうといった境界線を知りたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

RAIDコントローラによる、で終わってしまう話のような気がしますが、昔Data ONTAPでHDDの警告出たけど切り離されずにそのまま使用されている状態だったときに、サポートやCEから聞いた話をします。うろ覚えなので多少間違っているかも知れません。

RAIDコントローラはいろいろな点でHDDを監視しています。S.M.A.R.Tというのを聞いたことがあると思いますが、HDDでは、読み込みエラーや書き込みエラー、その他いろいろなエラーについて自動的に検出し、その回数等を取得できる機能を持っています。RAIDコントローラはそのエラー回数等を常に監視しており、製品によって(または設定によって)決められた回数以上になればそのHDDは使用できないと判断し、切り離しを行うようになっているとのことです。使用できないと判断する回数はエラーの種類によって異なり、軽微なエラーであれば多少あってもそのまま使用するし、重大なエラーは1回でも起きると故障と判断することもあるそうです。なお、許容範囲内の軽微なエラーであっても、サポートの判断によっては予防交換する場合もあります。また、故障とする回数は、同じメーカーの製品であっても機種などによって異なり、SSDやSASなどといったディスクやインターフェースの種類によっても異なるそうで、このエラーは何回というのが常に決まっているわけでは無いそうです。なお、このエラー検出は、不良セクタなどのOSからも見えるレベルでは無く、ハード部分の内部動作でエラーが無いかを見ていることに注意してください。実際に不良セクタなどがなくても、エラー回数等から故障する前兆であると判断して切り離す場合もあるそうです(むしろ、不良セクタが出てからでは遅い方で、前兆段階で切り離せるのがいい製品らしいです。ただ、あまりにも厳しいと交換ばかりになるので、そこら辺のバランスが取れているかが各メーカーの見せ所らしいです)。

以上ですが、上の話は100万円以上する専用NASや専用SANストレージでの話なので、低価格のNASやソフトウェアRAIDでは事情が異なる可能性があります。サーバ用のハードウェアRAIDであれば、似たような仕組みを持っている可能性は高いですが、専用NAS等に比べると作り込みのレベルは落ちると思います。

また、メタ情報が壊れた場合、一般的に復旧は不可能です(専門の業者に頼めば、一応復旧はできる場合もありますが、料金はとても高いです)。メタ情報が壊れる原因はソフトのバグやオペレーションミスであり、RAIDが守る範囲を超えています。もうひとつ、まともなRAIDコントローラではメタ情報を二重三重にバックアップするため、物理故障で破壊されることはありません。

投稿2015/08/20 13:49

raccy

総合スコア21735

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

nob777

2015/08/21 13:02

ご回答いただきありがとうございます。 監視方法、障害判定等、細かい違いはあれど、少なくともS.M.A.R.T.機能で予測検知可能なレベルの障害は認識可能と理解しました。 (不良セクタが発生してから検知するのは遅いという点についてもS.M.A.R.T.の検査項目からも納得できました) また、各ファイルシステム固有の管理方法があるメタ情報については守備範囲外であることもわかりました。 確かに各ベンダのRAIDコントローラに関する対応表でも、サーバやOSまでは対応一覧が存在しますが、対応ファイルシステムの記載はないですね。ソフトウェアRAIDについても同様のようです。 非常に貴重なご意見をいただきありがとうございました。 もやもやとしていた部分が取れたようで、スッキリしました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問