質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.49%

  • Linux

    3887questions

    Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

  • Server+

    55questions

    Server+は、IT業界団体CompTIAが認定しているサーバー業務に関する資格です。サーバーのHW/SW構築・メンテナンス・仮想化など、サーバー運営上の運用・管理において幅広く対応できるスキルを評価します。

サーバーが起動してたのにWebサイトが見れない

解決済

回答 3

投稿

  • 評価
  • クリップ 1
  • VIEW 866

wasi300

score 43

いつもお世話になっております。

問題発生

さくらのvpsでpopサーバーとWebサーバーを運用しております。帰宅後、メールを受信しようとしたら受信ができませんでした。webサイトの方も見てみると、見れませんでした。(多分DNSのエラーだったような・・・)
sshでサーバーつなごうと思ったら

ssh_exchange_identification: read: Connection reset by peer

こんなメッセージが表示されました。

問題解決

Pingがタイムアウトするので、さくらの管理画面からサーバーを触りました。ps auxしたところ、httpdは動いてました。が、Webサイトは見れませんでした。メールサーバーは確認せず、とりあえずサーバーを再起動したところ、メールが受信でき、Webサイトも観れるようになりました。sshの方も、hosts.allowにrefuseされてるipを加えたら通信できるようになりました。

ご質問

問題は解決したのですが、腑に落ちない事があります。

  1. Webサーバが起動していたのにWebサイトが見れなかったこと
  2. 回線を変えていないのにipがrefuseされていたこと(インターネットするIPが変わったからでしょうか・・・)

特に1番が気になるのですが、こういう問題に対して、皆さんどの様に対処されるのでしょうか。
1番だったら/var/log/httpdで対象のドメインのログをサーバーが止まったくらいの時間から見ていけば良いのでしょうか。
よろしければ教えてください。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

+1

あまり参考にならないかもしれませんが・・・・

自分の場合は以下のように切り分けします。

  1. いつから起きたのかかを把握(httpdログの最後のタイムスタンプなど)
  2. /var/log/messagesなどに何か吐かれていないか確認
  3. /var/log/yum.logなどに何か書かれていないか確認
    (自動的にRPMアップデートかかってしまったとか、それによってconfig変わっていないか確認)

経験則レベルで裏付けないですが、
同じコンフィグでも、yum updateした直後に怪しい動作をすることがあり、
本番環境ではyum updateでの自動アップデートを止めています。
update を手動出かけたら、ミドルウェアの再起動・動作確認までは通常の流れとして実施しています。

http://www.glamenv-septzen.net/view/1320

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/05/03 19:53

    とても分りやすい回答を頂きありがとうございます。
    頂いた回答を元に自分なりにログを確認しました。以下、結果になります。

    1. httpdログを確認しました。問題のあった時間でも、200を返してるという風にログには残っていたので、サーバーに問題はなかった様に思いました。

    2.問題があった時期と今日と、前日のログを見比べてみました。吐き出されているメッセージが同じだったので、問題はない様に思いました。

    3.最後にアップデートかかったのが、4月の中旬だったので、これではない様に思いました。

    問題の切り分けができてない状態で質問させて頂いたにも関わらず丁寧にご回答頂きありがとうございました。

    1についてなのですが、GETなどのリクエストに対して200を返せているなら、サーバーは正常に動作してるという認識であっているのでしょうか。

    ログを確認する際に、よく検索するキーワードなどがございましたら教えていただけないでしょうか。

    お手間でなければご回答をいただきたいです。

    キャンセル

  • 2016/05/03 20:18

    頂いた内容からすると、そのタイミングでCPU使用率、プロセスの数はとっていましたか?
    できえればCPU使用率、メモリ使用率、プロセス数は監視しておいたほうがいいです。

    たとえば、httpdログを集計して、応答のなかった時間、実はアクセス過多であった、
    というような可能性はありませんか?

    自分は、Web/DB/MailをVPSで運用していますが、
    低予算案件でも、VPSを2台用意して、お互いからお互いをプロセス・CPU使用率・メモリ使用率などを相互に監視・可視化しています。
    (Nagios+MRTGがシンプルなので私はずっとこれです)

    また、DNSラウンドロビン方式でどちらにもアクセスがあっても応対できるようコンテンツの冗長化・DBのミラーリングなどを行っています。

    ちょっと脱線してしまいましたが、200 OKがあってなおかつ繋がらないとなると、
    アクセスが多い状態で待ち行列→タイムアウトとなっているだけで
    実は処理できているものがある、という状況であったのかもしれません。

    キャンセル

  • 2016/05/04 10:39

    ご回答ありがとうございます。

    プロセス数やCPU使用率は監視していないです。
    応答のなかった時間はアクセスが普段より多かったです。が普段よりちょっと多いくらいでした。

    確かに、もしものためにだけでなく、原因を切り分けるためにも、2台で運用するのが良いのかもしれません。ありがとうございます。

    とても参考になりました。とりあえず、プロセス数などの監視は今後やっていきたいと思います。ありがとうございした。



    キャンセル

+1

ping がタイムアウトということはネットワークの疎通が最も怪しい箇所になるのではないでしょうか。
sshもhttpもsmtpも接続できていないということからもそこが怪しいかと思います。

ありそうなのはiptables(ファイアウォール)が意図せず起動してしまったとか、設定不良とか。
あとはルーティングをいじったとかゲートウェイの設定を誤ったとか、いずれにせよそういったネットワーク回りを確認してみるといいかと思います。

ということで、他の方がおっしゃってる通り、その時間帯の特にネットワークまわりのログを調べてみるといいかと思います。

ついでにhistoryで操作ログを見返してみると何か思い出すかもしれません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/05/04 11:01

    ご回答ありがとうございます。

    ルーティングは弄っていないです。
    iptablesはログを取っていないので起動の確認ができませんでした。
    ログをとる様にログローテ設定しました。
    historyで一覧にできるのは知りませんでした。ありがとうございます。

    ネットワークの監視をしてないので、
    監視してログを取る仕組みも作ってみようと思います。

    どうもありがとうございました。

    キャンセル

0

まずログを見ましょう。
/var/log/ フォルダにいろいろあると思います。
その中で、該当時間帯前後のログファイル、アクセスログなどをみて、怪しそうなところを検討を付けましょう。
話はそれからです。

多いのは、不正アクセスなどで連続してWebサーバーにアクセスが来たせいでWebサーバーがハングアップしてしまうといった内容かと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2016/05/03 19:54

    ご回答ありがとうございます。他のログも見てみます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.49%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Linux

    3887questions

    Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

  • Server+

    55questions

    Server+は、IT業界団体CompTIAが認定しているサーバー業務に関する資格です。サーバーのHW/SW構築・メンテナンス・仮想化など、サーバー運営上の運用・管理において幅広く対応できるスキルを評価します。