質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.10%

CentOSサーバでの突然のシャットダウン(?)の調査方法について

解決済

回答 5

投稿 編集

  • 評価
  • クリップ 3
  • VIEW 1,342

knegi

score 7

CentOSサーバでの突然のシャットダウン(?)の調査方法について

CentOS6.9を計算機として運用しています。

前提

$ cat /etc/redhat-release 
CentOS release 6.9 (Final)

発生している問題・エラーメッセージ

CentOSマシンが突然応答がなくなります。
だいたいsshログインできなくなることから発覚し、
pingも通らない、
[Ctrl]+[Alt]+[Delete]も受け付けません、
ディスプレイの出力もないです。
マシンはファンも動いて、
中のボード(なんのボードかはわからないのですが...)のLEDも光っています。

電源ボタン長押しでシャットダウンして再び起動させると、
特に問題なく立ち上がります。

試したこと

再起動させた後にsuとしてログインし、
/var/logの中に何かエラーが書いてないか調べています。
例えば、messageに再起動の直前の記述に

Jun  24 22:18:38 e2f112 gnome-session[3286]: WARNING: Could not launch application 'linc-cleanup-sockets.desktop': Unable to start application: Failed to execute child process "/usr/bin/linc-cleanup-sockets" (No such file or directory)


と書かれていました。
これ以外で、WARNINGもERRORも見当たりません。

質問一つ目

シャットダウンの原因が分からないので原因を特定したい

何か工夫することでシャットダウンの原因を特定できるログを取得する方法などありますでしょうか?
/var/log以外にも何か有効な調査方法ありますでしょうか?
カーネルがシャットダウンさせた要因となったプロセスなどを特定、
そう至るまでの過程のログなどを取得したいのですが、
シャットダウンするタイミングでカーネルがダンプを吐くような一般的なやり方などありますでしょうか?

質問二つ目

/var/log/messageの

Jun  24 22:18:38 e2f112 gnome-session[3286]: WARNING: Could not launch application 'linc-cleanup-sockets.desktop': Unable to start application: Failed to execute child process "/usr/bin/linc-cleanup-sockets" (No such file or directory)


は何を意味しているのでしょうか?

以上、よろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • yoorwm

    2019/07/24 10:31

    内容からして、「突然シャットダウン」した訳ではなくて反応が無くなっただけですよね?
    意味合いが全然違うので意識するようにしてください。
    あと、サーバと言いながらgnome-sessionとか出ているという事は、デスクトップ用のものをサーバとして使っているのですか?
    単にGUI上でダイアログ待ちしているだけな気がしますが、「どのように使っているのか?」詳細を書くようにしてください。

    キャンセル

  • knegi

    2019/07/25 08:30

    > サーバと言いながらgnome-sessionとか出ているという事は、デスクトップ用のものをサーバとして使っているのですか?
    おっしゃる通りです、すいません。

    「突然シャットダウン」した訳ではなくて反応が無くなっただけですよね?
    こちらもその通りです。
    [Ctrl]+[Alt]+[Delete]でも反応がないので、動いていないんじゃないかと思ったのですが、
    この状況がどういう状況なのかもわかっていないです。

    キャンセル

回答 5

+1

ディスプレイの出力もないです。
マシンはファンも動いて、

熱暴走はすでに指摘されているので...

「画面が消えていて、ファンが動いている」ということですが、「サスペンド」しようとしてフリーズしている等の可能性はありますか?

サスペンドしようとしてフリーズするのであれば、ハードウェアが「サスペンド」に対応していない可能性が高いので、サスペンドしないように設定すれば、解決すると思われますが...

コンピューターをサスペンドしたあと復帰しないのはなぜですか? 

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/26 08:18

    コメントありがとうございます。
    >「サスペンド」しようとしてフリーズしている等の可能性はありますか?
    考えていませんでした。おっしゃる通り、可能性はなくはないですね。
    調べてみます。

    キャンセル

checkベストアンサー

0

ログもなにもなく突然落ちる、というのは、イマドキのLinuxではソフトウエア的な原因ってのは考えにくいです
熱暴走とかメモリ不良とか、ハード的な原因が考えられますんで、マシンを替えてみるなどしてみればどうでしょう

ログに出ているのは
WARNING: アプリケーション 'linc-cleanup-sockets.desktop'を起動できませんでした
ってことなんで、あんましこの件とは関係ないかと。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/25 08:35

    コメントありがとうございます。
    やはりハードが怪しいでしょうか...
    逆にソフトウエア上に問題がないことの証明はこれ以上追求できないものでしょうか?
    重ねての質問申し訳ないです。

    キャンセル

  • 2019/07/25 08:48

    もちろん、ソフト側の問題を想定しての十分な時間をかけての検証は必要でしょう。
    ましかし結局、悪魔の証明になってしまうので、問題がないという証明はむずかしいでしょうね
    #よく上司やら客先に言われる命題ではありますがw

    私個人的な意見としては、とにかく別のマシンを用意して同じ処理を走らせるのが結局時間の節約になるのではと思います。
    それでも同じ問題が出るなら、ソフト的な問題だ、ってことがわかりますし。

    キャンセル

  • 2019/07/26 08:20

    ありがとうございます。
    > もちろん、ソフト側の問題を想定しての十分な時間をかけての検証は必要でしょう。
    > ましかし結局、悪魔の証明になってしまうので、問題がないという証明はむずかしいでしょうね
    > #よく上司やら客先に言われる命題ではありますがw
    まさしくそのような状況でして...
    ご理解感謝します。
    コメント参考になりました。

    キャンセル

0

/var/log/messages を確認してください

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/25 08:33

    コメントありがとうございます。
    /var/log/messagesに
    前述のWARNING以外、
    WARNINGもERRORも出ていない状況です。
    他に確認すべきところありますでしょうか?

    キャンセル

0

kexec-toolsを導入してみてはいかがでしょうか?
Kernel Panic時にvar配下に出力されるとのことです。
(その分メモリを使用しますが…)

https://qiita.com/saikoro-steak/items/c61f3d9b6384836f8e80
カーネルダンプ出力設定メモ

またこれだけでは、情報量としては心もとない(かもしれない)ので、
topコマンドを使用し、30秒間隔でログを吐き出すなどしておき、
再起動したタイミングで最新のログを確認するのもありかなと思います。
(ディスクに空きが大量にあるのであればですが…)

https://bit.ly/2YdXbh4
逆引きUNIXコマンド/topコマンドの出力をファイルに保存したい

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/25 08:31

    コメントありがとうございます。
    こちらトライして、状況の把握に努めてみます。

    キャンセル

0

コンソールの画面とキーボードがついているようでしたら
キーボードの操作でCtrl+Alt+F2で仮想コンソールにつないでログイン可能であれば、
sshでログインできない場合でも様子が確認できる可能性があります。
今度、sshでログインできない時に確認してみてください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/07/26 08:18

    コメントありがとうございます。
    こちらもトライしてみます。ありがとうございます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.10%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる