はじめまして。
私は現在AmazonEC2から外部のサーバに対してデータを相互にやり取りする処理を行っております。
最近この処理のスレッド数を増やしたくAWSに運用を移行し試してみたのですが、AWSでこの処理を行うとある一定時間を過ぎると急に処理速度が大きく低下するようになっています。
(以降前はVPCやEC2のようなものでは無く、通常のデスクトップPCで行っておりましたがその運用環境ではこのような事はありませんでした)
私の知識としてCPU、メモリ、ネットワークどこかにボトルネックがあると思い出来る限り調べたのですが。
CPUは特に使用率が高いわけでも無いのに時間経過で大きく低下する可能性を考え難く。
メモリはログを取りましたが特に使用率が高いわけでも無い。
となるとネットワークが、例えば帯域制限のような事を行われているとのが妥当かと思いました。
しかし、調べてもそのような情報は見当たりませんでした。
また上記の画像を取得した際のインスタンスタイプはc5.x9largeですが一度c5n.x9largeでも試しており、ネットワークが問題ならば解消・緩和されるのではと思っていたのですが
c5n.x9largeでも同様の問題が発生しているので何が問題か絞り込めておりません。
このネットワークは内部では無く外部のサーバに向けて送受信されているものです。
また、以前の運用環境と同スレッド数で行いましたので(画像の1回目の処理)スレッド数の増加(トラフィックの増加)による外部サーバ側の制限という事もないのかなと考えております。
質問としましては、上記画像からボトルネックを見つけるというのは不可能だと思いますので
一旦ネットワークに絞り込んで帯域制限のような事があるのか、あるならばその解消法をご教示いただきたく。
また仕組み上・あるいはモニタリングされた内容を見る限りそういった事は無い、あり得ないという事でしたらネットワーク以外のボトルネックを重点的にチェックしたいと思っております。
質問としてはあまり適切では無いかもしれませんが、何卒宜しくお願い致します。
###2020/09/21 追記
ログ取得にはあまり詳しくなく、調べて見て見やすそうだったhtopというものを利用してみました。
処理が順調な時点でのログ
処理が急速に遅くなり始めた瞬間のログ
処理が遅くなってからしばらく経ったログ
今回取得するべき内容がこれで網羅出来ている気はしませんが、まだ見方も良くわかっていないので自分なりに調べてひとまずこれが何を意味しているか理解したいと思います。
ログに関する知識が無い事。1日1度しか行えない不可逆的かつ再実行が難しい処理に関する部分であり試行回数も重ねられないことから情報が小出しになってしまい申し訳ございません。
回答1件
あなたの回答
tips
プレビュー