質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.63%

WindowsServer2008にて再起動の原因特定の協力依頼

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 7,083

micmic

score 9

構成概要

ADサーバ×1台
OS:Windows Server 2008 Standard Edition

DBサーバ×2台 ※MSFCによる冗長化構成
OS:Windows Server 2008 Enterprise Edition
DB:SQL Server 2008 Enterprise Edition

質問事項

ADサーバで原因不明の再起動が発生し、
原因特定に難航しています。

■発生時のタイムテーブル
発生当時  10:32 ADサーバが停止
発生翌日   6:57 ADサーバが起動 ※1
※1・・・異常を検知したため、ADサーバへリモート接続した際に再起動が発生。
※2・・・発生当日は8:00まではシステムログの出力があり、翌日の起動までログはありません。

<補足>
発生したのは恐らく、強制再起動と思われます。
10:32頃にシャットダウンシーケンスが発生し、
翌日の6:57頃に起動が行われました。
そのため 当日 10:32 ~ 翌日 6:57 頃までは、フリーズの状態に陥っていたと思われます。
※起動後のイベントログにてシャットダウンシーケンスの時間を確認。

10:32に発生したシャットダウンシーケンスは意図しないシャットダウンです。
本システムは、定期再起動等は行っていないため、シャットダウンは通常、発生しません。

発生している問題・エラーメッセージ

イベントID:6008 再起動発生時のイベントログには以下のメッセージが出力されていました。

keywords 0x80000000000000

その他特記事項

再起動発生によるメモリダンプ等の出力は見当たりませんでした。

どのように調査を進めていけばよいかご教示いただければと思います。
よろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • yuba

    2016/10/18 12:06

    再起動なのですか? それとも意図しないシャットダウン(10:32)と意図しないブート(翌日6:57)だということですか?

    キャンセル

回答 3

+1

コンピュータをシャットダウン後再起動すると、イベント ID 6008 がシステム イベント ログに書き込まれる 
6008はシャットダウンしたときでなく再起動したときに書き込まれるイベントで、正常にシャットダウンされた記録が残っていないことを意味します。
これが意味するところは、10:32にはすでに再起動しており、その直前にいったん落ちていたということです。

Server 2008ということはマシン自体も相当古そう。
そこから一番考えられる不意なOSダウンの原因は、電源ユニットの劣化です。最後に電源ユニットを交換してから(無交換なら購入から)何年経過していますか?
5年以上なら、もう電源ユニットの劣化と断定してかまわないかと思います。あれは消耗品です。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/10/18 13:29

    6008のイベントが出力されていたのは、発生翌日 6:52 の時刻です。
    その際のイベントログに、
    「以前のシステムシャットダウン(YYYY/MM/DD 10:32)は予期されていませんでした」
    との内容から記載しています。
    実際に、日時でバッチが動くようにタスクスケジューラを実装していますが、当時10:32~翌日6:57の間はバッチ処理が起動していませんでした。
    そのため、当日10:32~翌日6:57はフリーズしていたと想定しています。

    機器自体は2012年1月頃かと思います。ですので、4年半といったところでしょうか。
    (担当が外出しており、誤っている可能性はあります)
    仰っているのは、電源ケーブルではなく、機器にある電源ユニットの事になりますか?
    ケーブルでしたら、2本の冗長化構成で構築しています。
    また、機器自体もデータセンターに設置しているため、電源DOWNもありません。

    キャンセル

  • 2016/10/19 08:07

    そう、ケーブルではなく電源ユニットです。
    10:32というのは動くべき処理が動かなくなり始めた時刻ということですね。
    そこから20時間のマシンの様子を知る方法は… 一般的には残っていませんね。
    意外に電力スマートメーターが参考になったり。使用量が跳ね上がっていれば、CPUが回りっぱなしになっていたのではとか推測できます。

    キャンセル

check解決した方法

0

すっかり遅くなりましたが、こちらで確認した内容を投稿します。
ハードウェアの保守契約を結んでいたたため、同時並行でメーカーへ問合せを行っておりました。
その際、BIOSやアレイコントローラのバージョンが古い可能性を指摘されました。
本番運用しているサーバのため、影響についての調査もままならないため、実施せずとしています。

関連があるかどうかは不明ですが、
実は同日早朝の4時過ぎにも実は再起動が発生しておりました。
※つまり、この日は2回再起動が発生していました。

バックアップ製品によるバックアップ取得を行っている最中に、
サーバに接続出来ない事象が発生(要はバックアップがコケた状態)になりました。
その時間が再起動発生の時刻とほぼ一致。
バックアップ対象ディレクトリには13万程のファイル数が存在しており、
それが原因でIOに高負荷が掛かり、自動で再起動が発生したのでは無いかという仮設を立てました。
ファイルを削除し、現在は経過観測を行っています。
4時と10時の再起動の関連性は不明ですが、現時点では事象の再発は出ていません。

以上です。

ご回答頂いた皆様
本件は一旦、クローズ致します。
どうも、ありがとうございました。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

12日の首都圏の停電の影響をうけていたのかどうかも何かヒントになるかもしれません。
数年間無停止で動いていて、このタイミングで問題が起きたとなると、停電によりハードウェアになんらかの不具合が出た可能性も疑いたくなります。例えば無停電電源があるなら、ステータスが永遠に充電中のままになってたりとか。

ほんとかどうかは知らないのですが、大規模停電後は電気の品質(周波数や振幅)が悪くなることがあるそうです。こういうことと、yubaさん指摘の電源ユニットの劣化が重なると、良からぬことが起こるかもしれません。

--追記
データセンターに設置してあるものでしたか。それだと停電の影響は考えなくてよさそうですね。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/10/18 13:46

    コメントありがとうございます。
    残念(?)なことに、サーバの設置場所は首都圏でも無いため、影響は無いと思われます。

    電源ユニットの劣化も含め、ハードウェア関係の可能性かどうかを確認していこうと思います。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.63%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる