前提・実現したいこと
Apacheを採用したWEBシステムを運用している。
このシステムはPacemaker+corosyncで冗長構成を組んでいる。系の切替トリガーは
下記の通りの定義
ネットワークインタフェース → pingに対する応答有無
WEBサーバ → http://XXX.XXX.XXX.XXX/server-status 取得に対する応答有無
DB → 簡易select 文に対する応答有無
Apacheの監視で60秒以内に応答が返ってこないことがあり、それを解消したい。
発生している問題・エラーメッセージ
・週に一回程度の頻度で、システムの系切替が発生している。
・切替時のトリガーとしては上記のうち、WEBサーバのserver-status応答。
・WEBサーバからの応答待機時間は60秒を設定しているが、その時間内に応答が返ってこないことにより系切替となっている。
試したこと
apacheのaccessログでは当該時間に他の時間帯と比較してWEBアクセスは特段の増加はなく、また発生直前までのserver-statusを確認してもセッションやワーカーは設定の上限の半分程度の占有状況であった。
補足情報(FW/ツールのバージョンなど)
OS:CentOS7.6
開発言語:Ruby 2.6 / Rails5
WEBサーバ:Apache 2.4.39
DB:postgreSQL 9.6
あなたの回答
tips
プレビュー