#困っていること
##経緯
現在ZABBIXを使用してWebサーバを監視する体制を整えようとしています。
具体的には、障害が発生した場合サービスをリスタートしたり、長時間障害が発生し続ける場合はサーバごと再起動を行うなどし、
放置状態でも可能な限り人の手による対応が必要ないようにしたいと考えています。
これまで、長時間HTTPヘルスチェックに失敗した場合(トリガ)、
ZABBIX Serverよりリモートコマンドで"sudo reboot"をZABBIX Agentに向かって送信する(アクション)を設定していました。
##分からないこと
しかし、リモートコマンドすら受け付けられないような高負荷状況が続いていたり、
カーネルの内部エラーなどが発生し、そもそもZABBIX AgentとZABBIX Server間の疎通が取れなくなるなどした場合、
当然ZABBIX Serverからリモートコマンドを送信出来なくなります。
ZABBIX Agentと疎通が取れなくなった場合は間違いなく"異常"な状態ですので、
問答無用でシステムをリブートしてしまって構わないのですが、ZABBIX Agent自身でコマンドを発行出来ないとなった場合それを実現できるかどうかが分かりませんでした。
#考えた方法
ZABBIX Server及びZABBIX AgentはいずれもAWS上でEC2による構築が行われています。
その為、リモートコマンド以外でインスタンスを再起動させる方法としてはAWS CLIを使用することが可能です。
AWS CLI Command Reference reboot-instances: https://docs.aws.amazon.com/cli/latest/reference/ec2/reboot-instances.html
その為、ZABBIX Serverとの疎通が取れなくなったZABBIX AgentのインスタンスIDさえ取得出来れば、
ZABBIX ServerからAWS CLIを実行し、インスタンスを再起動させることが出来ると考えました。
しかしトリガー元となったホストのインスタンスIDを取得する方法がどうしても分からず、手詰まりとなっています。
ZABBIXにて、このような動作を行わせることは可能でしょうか?
お忙しいところ恐れ入りますが、ご教示頂けますと幸いです。
何卒宜しくお願い申し上げます。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/05 04:33
2019/09/05 05:41