質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.61%

prometheusを用いたDockerコンテナの監視及びアラート設定について

受付中

回答 0

投稿

  • 評価
  • クリップ 1
  • VIEW 1,270

blood_stark

score 6

初めて質問致します。

 前提・実現したいこと

Dockerコンテナを用いたwebポータルシステムを構築をゴールとして
Docker関連技術の検証を行っております。
現在の構成としては

■VM 1(監視側)
RHEL 7.5
Prometheus(Dockerコンテナ上)
grafana(Dockerコンテナ上)
Alertmanager(Dockerコンテナ上)
node-exporter

■VM 2(監視側)
RHEL 7.5
apache(Dockerコンテナ上)
tomcat(Dockerコンテナ上)
cadvisor(Dockerコンテナ上)
node-exporter
となっております。

現在
Prometheus(grafana)側からは
VM 2のCPU、メモリ、リソース(node-exporter経由)
VM 2のDockerコンテナ上のCPU使用率メモリ、リソースが参照できる状態です。(cadvisor経由)
また、アラートに関してはnode-exporterを用いたノード死活のみできております。

しかし
メトリクスのフォーマットや計算記法がいまいちよくわからず
Dockerコンテナの死活監視、リソース監視がうまくできないため
質問させていただきます。
Promrtheusがcadvisorメトリクスを拾っている前提として

apacheコンテナのCPU使用率90超えでアラート等行う場合
どのようにalertrulesを書けば良いのでしょうか。(アラート登録であってアラート送信ではないです)
Dockerコンテナの死活やリソースを監視もしくはアラート設定している知見が
ありましたらご教授ください。

 alerts.rule(記法がわからず下記の内容のみ)

ALERT InstanceDown
  IF up == 0
  FOR 5m
  LABELS { severity = "page" }
  ANNOTATIONS {
    summary = "Instance {{ $labels.instance }} down",
    description = "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes."
  }

 prometheus.yml

global:
  scrape_interval:     15s # By default, scrape targets every 15 seconds.

rule_files:
  - alerts.rule

scrape_configs:
- job_name: node
  static_configs:
  #VM_1
  - targets: ['xxx.xx.x.x:9100']
  #VM_2
  - targets: ['xxx.xx.x.x:9100']
- job_name: cAdvisor
  static_configs:
  - targets: ['xxx.xx.x.x:8080']

 補足情報(FW/ツールのバージョンなど)

Dockerは
Docker version 1.13.1, build 94f4240/1.13.1
他のミドルウェア、コンテナは現時点で最新バージョンを使用しております。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.61%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る