vim monitor.rule.yml
groups: - name: example rules: # Alert for any instance that is unreachable for >5 minutes. - alert: InstanceDown expr: up == 0 for: 10s labels: severity: page annotations: summary: "Instance ææ $labels.instance åå down" description: "ææ $labels.instance åå of job ææ $labels.job åå has been down for more than 10 seconds."
expr でトリガー ステータス up が 0 のまま 10 秒経過したらアラート通知を行う という内容。
これを prometheus の方の設定ファイルでルールファイルとして指定する。
vim prometheus.yml
rule_files: - "monitor_2.rules.yml"
記載の場所は恐らくどこでも大丈夫だとおもいます。
アラート通知をトリガーにメールを送信したい場合は alertmanager ツールを公式からダウンロードしてくる感じです。