質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.58%

【CloudWatch】ネットワーク遅延が発生しているか監視するための設定を教えて下さい。

解決済

回答 1

投稿

  • 評価
  • クリップ 1
  • VIEW 1,319

hasshy

score 97

私自身、インフラ構築について知識が浅いところがあり、誤った知識でお話していたら大変申し訳ございません。

サービスに異常が無いか(応答が異常に遅くなっていないか)監視するために、CloudWatchでネットワークの遅延を監視したいです。
そのため、データをサーバーからの応答であるNetworkOut(ネットワーク出力)の数値を監視しようと考えております。

EC2のモニタを見ても、出力されたバイト数はわかるものの、これだけではサービスに影響するものなのかわかりません。

CloudWatchの設定する値はどのように決定すれば良いでしょうか?

 インスタンスタイプ

t2.midium

 ネットワーク帯域

実際にインスタンスを立てて測った数値ではなくて恐縮ですが、参考値は下記です。

254 Mbits/秒

 出典

https://qiita.com/saitara/items/882a3e70639637e24a4f

 ネットワーク出力

(推測されそうな情報は伏せましたが)、落ち着いている時はEC2のモニタでは下記のような結果が出ています。
だいたい、150Mbits前後くらいです。
ピーク時は、953.67 Mbits強ありました。  

イメージ説明

 他に監視しているもの

  • CPU使用率
  • ウェブサーバー死活監視
  • ストレージの空き容量
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • scsi

    2018/11/19 19:06 編集

    遅延を確認したいなら外部とのicmpの応答時間も監視した方が良いかと思います。
    WEBサーバの応答速度であればコンテンツのURLが表示されるまでの時間も監視する必要がありそうです。

    キャンセル

  • hasshy

    2018/11/19 21:13

    アドバイスありがとうございます!調べてみます。

    キャンセル

回答 1

checkベストアンサー

+1

EC2のNetworkに関するメトリクスはNetworkPacketsIn, NetworkIn, NetworkPacketsOut, NetworkOutの4つしか無く、遅延発生は確認できません。
測定したいレイテンシの値をCloudWatchにput-metric-dataして、アラートを作成すれば実現可能です。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/11/20 13:15

    いつもお世話にいなっております。
    ご回答頂きありがとうございます。
    いただいた回答で恐縮ですが、レイテンシの適正値はどのように決めるのがよろしいでしょうか?

    ELBを使っていないため、ロードバランサーのLatency Averageを取得する事できません。
    そのため、追記・修正で他の方がご指摘いただいたように、icmpの応答時間を監視する事を検討しています。
    moonphase様が仰っているように、レイテンシ値(私の場合、応答時間)を取得して異常値だったらアラートを出すことになると思います。

    異常値の決める時に、目安にする値を算出する方法があるのでしょうか?

    キャンセル

  • 2018/11/20 14:12

    まずは正常時のレイテンシを確認します。
    このレイテンシが0.100〜0.199 msくらいで、たまに0.200 以上になるのであれば例えば、0.200 以上がN個中M個(3個中3個)でアラートにする、などとします。
    1分間隔でデータがある場合、3回連続(3分)でアラートが上がります。

    アラームの評価については以下が詳しいです。
    https://docs.aws.amazon.com/ja_jp/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html#alarm-evaluation

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.58%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る