お世話になります
公開しているサーバー(Centos 自宅サーバー)がアクセスが困難なほどに重くなるタイミングがあって、ご質問させていただきます
自宅で公開しているサーバーは
ルーター → WEBサーバー → (Mysql, Redisクラスター, MongoDBのレプリカセットのDBサーバー)という構成です
(その他にDNSもあり)
重くなるタイミングは、ルーターからの接続WEBサーバーを別のWEBサーバー(構成管理ツールで作成した同じ機能のWEBサーバー)に切り替えるタイミングで、長くて10分ほどサイトが反応してないのでは?と思われるほどの重さになります
その後時間の経過で重さは解消されます
(再び元のWEBサーバーに戻すと、戻す際に10分ほどサイトが反応しない同様の反応がある)
上記の反応しない時間は、アクセスが多い時間帯のみ発生して(より長く)、アクセスが少ない時間には発生していません(又は重くなるほど発生していない)
時間の経過とともに重さが解消されるので実害はなさそうですが、WEBサーバーに対してロードバランサを使用していたのが上記の問題のために事実上使用不可能になっています(ロードバランサで切り替えるとサイトが継続して反応しないことに)(ロードバランサを使用しないで、ルーターから切り替えても上記の現象は発生)
アクセスが多いタイミングで発生するので長時間の再現をしづらいのも困っている点です(秒間2,3アクセスから)
Muninでチェックしたところ、デフォルトの監視項目では変化した点は特になさそうです
ログをチェックしたところ、Apacheのログ・PHPのエラーログとも通常通りでエラーは出力されていませんでした
ネットワークを切り替えたタイミング(例えばWEBサーバー192.168.0.100からWEBサーバー192.168.0.101)で発生しているのでネットワークの問題だと思っていますが、1週間ほど迷宮をさまよっています
解決方法をぜひお願い致しますm(__)m
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/01/05 03:01
2016/01/05 07:06
2016/01/05 09:26
2016/01/06 15:14
2016/01/07 00:58
2016/01/07 01:03
2016/01/07 01:09
2016/01/07 01:16
2016/01/07 01:28
2016/01/07 01:40
2016/01/07 01:44 編集
回答3件
0
ベストアンサー
ネットワークを切り替えたタイミング(例えばWEBサーバー192.168.0.100からWEBサーバー192.168.0.101)で発生しているのでネットワークの問題だと思っています
Webサーバやその先のサーバで何らかの初期化処理が実行されている可能性も
あるのではないでしょうか。
(元のサーバからのredisへの接続が残っていてタイムアウトするまで新しいサーバから接続できないなど。)
Webサーバでの処理時間の情報はないでしょうか?
(Apacheであれば、ログフォーマットに%Dを指定すればアクセスログに出せるはずです。)
遅くなったときのポートのESTABLISHの数などはどうなっていますか?
それから、別の観点ですが、現象が発生しだした頃に、(一週間前でしょうか)
何らかの変更は行っていないですか?
投稿2016/01/04 09:19
総合スコア1546
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/01/05 02:51
2016/01/05 03:36
2016/01/05 07:54
2016/01/05 10:07
2016/01/05 11:56
2016/01/06 01:41
2016/01/06 13:42
2016/01/07 01:18
2016/01/07 07:11
2016/01/08 03:19
2016/01/08 03:33
2016/01/10 07:36
2016/01/10 08:35
2016/01/10 09:26
2016/01/12 02:13
2016/01/13 04:18
2016/01/13 04:55 編集
2016/01/13 08:45
2016/01/13 09:37
2016/01/13 10:42
2016/01/15 02:32
2016/01/15 02:53 編集
2016/01/15 04:15
2016/01/15 08:11
2016/01/15 08:18
2016/01/15 08:22
2016/01/15 08:27
2016/01/15 08:34
2016/01/19 14:35
0
「構成管理ツールで作成した同じ機能のWEBサーバ」が設定により新・旧のサーバで仮想NICのMACアドレスが同じになっている、という可能性はないでしょうか?
約10分間というのがARPキャッシュ絡みな気がしてなりません。
投稿2016/01/08 04:50
編集2016/01/08 05:12総合スコア1149
0
回答レベルのものは提示できないので申し訳ないのですが、
追加情報で、
ルーター(wan)経由だと重くなりローカルネットワークから直接webサーバーにアクセスした場合は通常通りの軽さでした。
とのことですので、ルーターもしくはネットワークの問題のように思います。
現場にいないとちょっと調べようがないのですが、もう少し範囲を絞り込みたいと思います。
(ケース1) ルーターで止まっていて、KVMホスト、仮想マシンに届かない
(ケース2) KVMホストには届くが、仮想マシンに届かない
(ケース3) 仮想マシンには届くが、応答パケットが出ない
(ケース4) 仮想マシンには届き応答するが、応答パケットがルーターで止まる
どのケースか切り分けるため、KVMホストと仮想マシンで tcpdump を取ってみるのはいかがでしょうか。
[root@KVMホスト]# tcpdump -nn -i (ルータ側ブリッジI/F) host (クライアントIP) [root@仮想マシン]# tcpdump -nn -i (ルータ側I/F) host (クライアントIP)
クライアントからアクセスしてどこまでリクエストパケット、応答パケットが出るか確認します。
(どのケースかわかったからといって、原因のアテはないのですが ...)
投稿2016/01/07 15:42
総合スコア12146
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/01/08 02:43
2016/01/08 15:33
2016/01/10 08:04
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。