質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.12%

vmwareとLinuxOS

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 1,231

shuro

score 12

サーバにESXiOS(ver5.x)をインストールし、ESXiホストOS上に複数のvmを作り、すべてのvm上にRHEL5.5, 6, CentOS5 のLinux OSをゲストOSとして構築した環境があります。
この複数のvmがある日を境に突然bootできなくなることが起こり、黒い画面(shell)上に、
grub>
というプロンプトが出て、
root (hd0,1)

help

コマンドなどいろいろ試してみましたが、MBRが見つからず、ゲストOS(Linux)がbootできなくなってしまう事象が定期的に起こります。
もっともISOイメージから修復して一旦は回復するのですが、しばらくすると再現するもので、根本的な解決方法が分かりません。

vmwareのナレッジベースを見ると、
https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2113325
上記の通り、"この問題は、起動可能なディスクの MBR が破損または変更された場合に発生します。"
の表記があり、この点については、仮想化基盤上でなくても物理環境でも同様のことと思います。

ここで考えたことは、vm上のLinux OS のMBRは、vm data fileのどこかに書かれており、これをシステムBIOSが読み込む仕組みかと思います。
そしてそのファイルはやはりホストOSであるESXiがいる物理ディスクのどこかにいると思うのですが、先頭部分にあるとは限らないと思いました。
本事象は仮想基盤上すべてのvm(6つ すべてlinux)で同時に発生したもので、なぜこのような事象が発生するのか、その原因が分かりません。6箇所のファイルが同時に壊れたと考えるのはあまりに不自然なためです。
それとも、すべてのvmのゲストOS(Linux)のMBRのファイルが、仮に物理HDDの先頭部分に書かれていて、この部分が壊れてしまった、と考えるべきなのでしょうか?
ESXiの仕組み(vmの実体は、vm data fileであってESXiOSがこれらのファイルを読み込むことで動かしているという考え方であっているでしょうか?)について、あまりくわしくないもので、ご教示いただければ大変助かります。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

0

ESXi 4 / 5 をいくつかの環境で利用していますので、経験談も含め回答させて頂きます。

まずハードウェア的に安定している環境では同様の現象になった事はありませんが、
一度だけ古い不安定な環境で VMFS (ファイルシステム) 自体が認識されなくなった
事がありました。(その時は電源不良かHDD故障の疑いがありました)

お考えの通り仮想HDDのMBRは、物理HDDのどこに書かれているか不定で、別々の離れた
場所に書かれている可能性が高いです。

逆に考えるとMBRの場所だけではなく、HDDの全体的なハードウェア不良が発生している
可能性もあると思います。
(ISOからの全体復旧ではなく、MBRのみ復旧した状態でOS起動できなければ全体的な不良です)

可能であれば物理ディスクを交換して原因の切り分けをしてみてはいかがでしょうか。
(交換後も再発するようであればソフトウェアや運用を含む別の問題になります)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/09/07 23:40

    迅速なご回答まことにありがとうございます。過去の事案にもなかなか見つからず困っておりました。
    やはり場所はわからないのですね。。一旦MBRのみを復旧させてみて、再発するようであればHDDの交換を提案してみます。ありがとうございました!

    キャンセル

0

既に解決済み statusではありますが、若干補足させていただきます。

VM(仮想マシン)の OSディスク領域ですが、VMが存在する ESXi Serverに ssh接続し、「/vmfs」以下をみると
Datastoreが配置されている場所を確認できます。
VM名称のディレクトリを確認し、その中に「(仮想マシン名)-flat.vmdk」に rawのディスクデータが存在します。このデータはある意味「ddコマンドで HDD等に書き込めば起動可能なディスクイメージそのもの」です。ですのでこの中に MBRもあります。

ちなみに VM稼働環境となる ESXi Serverの Firmware設定は CMS mode(BIOS互換)と UEFIのどちらで設定されているでしょうか?。ESXi Serverの場合、Install時の前述 Firmware構成に依存した VMしか作成できません。UEFI modeであれば UEFI modeの VMになり、VM内に入れられる OSも UEFI modeになります。
特に vSphere 6以降はそれが前提条件です。

MBRがそうそう壊れることも通常ありませんので、それ以外であれば grub構成やオプションを確認し直して、きちんと grub infoが正しく保存されるようにすることも確認が必要です。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/10/12 19:15

    まずは、返答が遅くなりましたことを深くお詫びいたします。
    さて、この件につき、調べてみた結果、MBRを含むパーティションが誤って削除されていたということが判明しました。ありがとうございました。

    >「/vmfs」以下をみると
    Datastoreが配置されている場所を確認できます。
    こちら情報ありがとうございました。今後はこちらで確認することとします。
    また、firmware観点についてもご指摘ありがとうございました。
    この点で質問なのですが、環境を確認したところESXiのバージョンは5.5でした。
    私の理解によると、最初に起動時のHWレベルでのチェックが行われ、問題なければ次のステージであるMBRを読み込む作業に移ります。
    そして、今回のケースでは、grubのメニュー画面が表示されている以上、BOISレベルのステージは突破している、というのが私の考えなのですが、いかがでしょうか?
    また、そもそもESXiがUEFIの場合で、vm上のゲストOSのfirmware設定をBIOSにするということ(ESXiとguestOSのfirmware構成が食い違うこと)は可能なのでしょうか?ありえないとすれば、firmwareの観点で考える必要は特にないということになります。
    以上、よろしくお願いいたします。

    キャンセル

  • 2016/10/12 20:38

    基本的に HW側の BIOS(CMS mode含む)/UEFIは双方とも揃っている、というのが VMware社の公式見解です。
    ※実際にはその辺りずれていてもdeploy出来る場合
    (HW側がUEFIなのに CMS modeなど)もありますが、
    保証対象外なのでお勧めしません。

    Grubのメニューまで至るとはいえ、Boot selection menuまで至っていない、という事はおそらく grub.conf等の情報が飛んでしまった可能性を想定しないとならないのではないかと思います。私自身 Linux系は業務で扱っていないのでその辺りの解説は大変恐縮ですが割愛いたします。

    ただ、Grub binaryが居る、という事は最悪 Rescue mode bootで復旧→復旧後他 storageへ storage vMotion(vCenter Server binaryがあり、かつEvaluationとして緊急避難的に使用するだけですが)し、その上で状況確認、という方法は取れると思います。

    grub自体も BIOSと UEFIでは動作が異なるはずですので、おそらく何か config含めて原因があるかもしれませんね。

    それと、念のために確認させていただきますが、ESXi 5.5で使用可能なゲストOSの確認はされていると思います。ただ、仮想ハードウェアの構成によって対応可否が異なりますので、余裕があるようでしたら以下の「Guest OS Compatibility Guide」を参考に対応する仮想ハードウェア構成を確認してみても良いかと思います。
    ※特に Linuxで仮想ディスクが壊れる、という現象の場合、
     私の知る限りでは「仮想ディスクコントローラ(HBA等)の
     構成が正しくない」場合に頻発した記憶があります。

    何かのご参考になれば!

    ●VMware Compatibility Guide(Guest OS)
    http://www.vmware.com/resources/compatibility/search.php?deviceCategory=software
    ※PDFによる Full ver.を入手する場合は「What are you looking for:」右のプルダウン右隣の「Compatibility Guides」をポイントし、開くメニュー内の[Guest OS Compatibility Guide] - [Download Full Guest OS Guide]を選択すれば、PDFでの全対応ゲスト OS情報が入手できます。

    ●Guest Operating System Installation Guide
    http://partnerweb.vmware.com/GOSIG/home.html

    キャンセル

  • 2016/10/14 21:42

    ご返信ありがとうございます。
    今後仮想ディスクが壊れるケースが再発した場合には、GuestOSの対応可否表を確認することにします。
    ESXiの設定等について、まだ詳しくないものでこれからも質問させていただくことがあるかと思います。
    今後ともよろしくお願いいたします。
    ご丁寧に答えていただき誠にありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.12%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる