質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.48%

  • AWS(Amazon Web Services)

    2094questions

    Amazon Web Services (AWS)は、仮想空間を機軸とした、クラスター状のコンピュータ・ネットワーク・データベース・ストーレッジ・サポートツールをAWSというインフラから提供する商用サービスです。

  • サーバ

    789questions

    サーバは、 クライアントサーバモデルにおいてクライアントからの要求に対し 何らかのサービスを提供するプログラムを指す言葉です。 また、サーバーソフトウェアを稼動させているコンピュータ機器そのもののことも、 サーバーと呼ぶ場合もあります。

  • Amazon EC2

    131questions

    Amazon EC2は“Amazon Elastic Compute Cloud”の略称です。Amazon Web Services(AWS)の一部であり、仮想化されたWebサーバーのコンピュータリソースをレンタルできるサービスです。

Amazon EC2が停止した原因が掴めません

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 4,536

grnfnt

score 36

AWSで運用している1台のウェブサーバのインスタンス突然停止してしまいました。
以下、停止直前の /var/log/messages の内容となりますが、ここから何か原因等わかりますでしょうか。
もし何かアドバイス等ございましたらいただければ幸いです。
(ほかにログが必要であれば提供いたします)


May 16 17:28:10 ip-xxx.xxx.xxx.xxx dhclient[2098]: bound to xxx.xxx.xxx.xxx -- renewal in 1510 seconds.
May 16 17:53:20 ip-xxx.xxx.xxx.xxx dhclient[2098]: DHCPREQUEST on eth0 to xxx.xxx.xxx.xxx port 67 (xid=0x151a63e9)
May 16 17:53:20 ip-xxx.xxx.xxx.xxx dhclient[2098]: DHCPACK from xxx.xxx.xxx.xxx (xid=0x151a63e9)
May 16 17:53:22 ip-xxx.xxx.xxx.xxx dhclient[2098]: bound to xxx.xxx.xxx.xxx -- renewal in 1517 seconds.
May 16 18:18:39 ip-xxx.xxx.xxx.xxx dhclient[2098]: DHCPREQUEST on eth0 to xxx.xxx.xxx.xxx port 67 (xid=0x151a63e9)
May 16 18:18:39 ip-xxx.xxx.xxx.xxx dhclient[2098]: DHCPACK from xxx.xxx.xxx.xxx (xid=0x151a63e9)
May 16 18:18:41 ip-xxx.xxx.xxx.xxx dhclient[2098]: bound to xxx.xxx.xxx.xxx -- renewal in 1474 seconds.
May 16 18:43:15 ip-xxx.xxx.xxx.xxx dhclient[2098]: DHCPREQUEST on eth0 to xxx.xxx.xxx.xxx port 67 (xid=0x151a63e9)
May 16 18:43:15 ip-xxx.xxx.xxx.xxx dhclient[2098]: DHCPACK from xxx.xxx.xxx.xxx (xid=0x151a63e9)
May 16 18:43:17 ip-xxx.xxx.xxx.xxx dhclient[2098]: bound to xxx.xxx.xxx.xxx -- renewal in 1678 seconds.
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: serial (ttyS0) main process (2482) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: tty (/dev/tty1) main process (2484) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: tty (/dev/tty2) main process (2487) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: tty (/dev/tty3) main process (2489) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: tty (/dev/tty4) main process (2491) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: tty (/dev/tty5) main process (2493) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: tty (/dev/tty6) main process (2495) killed by TERM signal
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: plymouth-shutdown main process (9032) terminated with status 1
May 16 19:02:13 ip-xxx.xxx.xxx.xxx init: splash-manager main process (9027) terminated with status 1
May 16 19:02:14 ip-xxx.xxx.xxx.xxx ntpd[2353]: ntpd exiting on signal 15
May 16 19:02:14 ip-xxx.xxx.xxx.xxx init: Disconnected from system bus
May 16 19:02:14 ip-xxx.xxx.xxx.xxx rpcbind: rpcbind terminating on signal. Restart with "rpcbind -w"
May 16 19:02:14 ip-xxx.xxx.xxx.xxx auditd[2139]: The audit daemon is exiting.
May 16 19:02:14 ip-xxx.xxx.xxx.xxx kernel: [237095.274698] audit: type=1305 audit(1463392934.546:610): audit_pid=0 old=2139 auid=4294967295 ses=4294967295 res=1
May 16 19:02:14 ip-xxx.xxx.xxx.xxx kernel: [237095.366951] audit: type=1305 audit(1463392934.638:611): auid=4294967295 ses=4294967295 op="remove_rule" key=(null) list=1 res=1
May 16 19:02:14 ip-xxx.xxx.xxx.xxx kernel: [237095.373571] audit: type=1305 audit(1463392934.646:612): audit_enabled=0 old=1 auid=4294967295 ses=4294967295 res=1
May 16 19:02:14 ip-xxx.xxx.xxx.xxx kernel: Kernel logging (proc) stopped.
May 16 19:02:14 ip-xxx.xxx.xxx.xxx rsyslogd: [origin software="rsyslogd" swVersion="5.8.10" x-pid="2157" x-info="http://www.rsyslog.com"] exiting on signal 15.

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

+2

OS は CentOS 6 か Amazon Linux でしょうか。
ログを見る限り、普通にシャットダウンしているように見えます。
last コマンドや /var/log/secure で該当時間にログインしていた人はいないでしょうか。

OS 内に痕跡がなければ、AWS 側からインスタンスを stop されたのかもしれません。
CloudTrail が有効であれば、AWSマネージメントコンソールや API で stop したなどのログが記録されていますので、確認ください。
そうでなければ、AWSサポートに問い合わせると何かわかるかもしれません。

ないと思いますが、1年前に cron でシャットダウンした設定が残っているとか。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/05/18 11:17

    ご回答誠にありがとうございます。

    lastや/var/log/secureを見ても侵入されたという痕跡はなく、secureについては停止直前と思われる時間帯に以下の記録がされておりました。
    May 16 19:02:14 ip-xxx.xxx.xxx.xxx sshd[2328]: Received signal 15; terminating.

    インスタンスはm4.largeで、先月運用開始したばかりのものとなります。OSはAmazonLinuxです。
    ロードバランサーで同内容のインスタンスでEC2は2台、RDS1台で運用してます。

    お客さんに根拠ある説明ができればそれで解決ではあるのですが、もし何かアドバイス等ありましたらいただけると助かります。
    よろしくお願いいたします。

    キャンセル

  • 2016/05/24 16:40

    AutoScaling を利用していないのであれば、次善の策として Auto Recovery を有効にしておくといいと思います。

    キャンセル

checkベストアンサー

+1

AWSで300台程度のインスタンスを2年程度運用していたことがあります。
EC2インスタンス、特にバーストタイプ(t2インスタンス)はAWS側のインフラの問題で割と簡単に死にます。
(毎月1-2台くらいは死んでました)
この場合、AWSサポートに問い合わせる他原因を判明する方法がありません。
*それも有料サポート契約をしていないとスムーズに行かないと思います。

非バーストインスタンスではそういった経験はありませんが、単純に運用していた数が少ないので当たらなかった可能性もあります。

そのため、AWSでバーストインスタンスを運用するには死んでも大丈夫な状態にする(冗長化、監視、AutoScalingによる復旧など)という運用をしていました。

ご参考になれば幸いです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/05/18 11:15

    ご回答誠にありがとうございます。

    インスタンスはm4.largeで、先月運用開始したばかりのものとなります。OSはAmazonLinuxです。
    ロードバランサーで同内容のインスタンスでEC2は2台、RDS1台で運用してます。

    アクセスは画像やCSS等含めても1日300アクセス程度ですのでバーストしているとは考えにくいのですが、ロードバランサーの設定か何かで自動的に1台をシャットダウンしてしまうようなことはあるものなのでしょうか。
    どうも原因がそれくらいしか思いつかないんですよね。。

    お客さんに根拠ある説明ができればそれで解決ではあるのですが、どうも気持ち悪いのでアドバイス等ありましたらいただけると助かります。
    よろしくお願いいたします。

    キャンセル

  • 2016/05/18 11:26

    >ロードバランサーの設定か何かで自動的に1台をシャットダウンしてしまうようなことはあるものなのでしょうか。
    AutoScalingGroupを組んで、ELBでヘルスチェックしているのであればシャットダウンというよりはterminateされて新しいインスタンスが起動しますね。
    あとはAWS側のメンテナンス予定が入っていて再起動予告がされていたのに気づかなかったとかもあり得ます。
    が、殆どのケースでAWSサポート以外は原因がわからないことが多いので、業務で使っているものならビジネス以上のサポート契約をしてAWSサポートに聞く以外の選択肢は無いかと思いますよ。

    キャンセル

  • 2016/05/18 12:07

    早速のご返答ありがとうございます
    AutoScalingは使っていないので、可能性があるならば、メンテナンスですかね。
    同じアベイラビリティゾーン内のもう1台は生きているので可能性としては低いかもしれませんが、この角度で少し調べてみます。
    ありがとうございます。

    キャンセル

関連した質問

同じタグがついた質問を見る

  • AWS(Amazon Web Services)

    2094questions

    Amazon Web Services (AWS)は、仮想空間を機軸とした、クラスター状のコンピュータ・ネットワーク・データベース・ストーレッジ・サポートツールをAWSというインフラから提供する商用サービスです。

  • サーバ

    789questions

    サーバは、 クライアントサーバモデルにおいてクライアントからの要求に対し 何らかのサービスを提供するプログラムを指す言葉です。 また、サーバーソフトウェアを稼動させているコンピュータ機器そのもののことも、 サーバーと呼ぶ場合もあります。

  • Amazon EC2

    131questions

    Amazon EC2は“Amazon Elastic Compute Cloud”の略称です。Amazon Web Services(AWS)の一部であり、仮想化されたWebサーバーのコンピュータリソースをレンタルできるサービスです。