EC2上で nginx + php-fpm 構成のWebサーバ(m3.medium) を2台ロードバランシングして運用しています。
ある時ロードアベレージが急上昇し、2台ともレスポンスを返さない状態になってしまいました。わかっているその時の状態としては、次のようなものでした。
- ロードアベレージが30〜40
- アクセス数は通常と変わらないくらいか、やや少ないくらい
- TOPコマンドで見てみると、st値が30〜40。負荷が高いプロセスはいずれもphp-fpm
- アクセスログを見ても異常なものは見られない
あわてて2台、4台と同様のインスタンスを起動するも(計6台)、いずれのインスタンスもやがて同じように負荷が高い状態になりました。
またインスタンスの再起動、インスタンスを一度停止→起動など試してみましたが、同じでした。
結局、日付が変わった頃に急に負荷が下がり、通常のような状態に戻りました。
下記はMUNINのキャプチャです。2/9〜10の間が該当の期間です。
http://bababa.main.jp/sozai/20180212.jpg
インスタンスがホストされている物理サーバになにか障害が発生した為なのかとも思いましたが、「インスタンスを一度停止→起動」したり、新たなインスタンスを起動したりもしているので、全てのインスタンスが同じ物理サーバにホストされているとはちょっと考えにくいと思っています。
また普段は2台で運用し、アクセスログを見ても異常がなく、インスタンスを追加しても改善しないことから、アクセス集中によるものでもないと考えています。
このような状態になる場合、他にどのような原因が考えられるでしょうか?
回答2件
あなたの回答
tips
プレビュー