配置告警规则

最后更新于:2022-04-02 03:00:25

[TOC] ## 配置 prometheus.yaml 方式一: ``` rule_files: - "alert.yml" ``` 方式二: ··· rule_files: - rules/*.rules ··· ## 定义告警规则 alert.yml ``` groups: - name: alert_name rules: - alert: HighErrorRate expr: job:request_latency_seconds:mean5m{job="myjob"} > 0.5 for: 10m labels: severity: page annotations: summary: High request latency description: description info ``` - alert:告警规则的名称。 - expr:基于PromQL表达式告警触发条件,用于计算是否有时间序列满足该条件。 - for:评估等待时间,可选参数。用于表示只有当触发条件持续一段时间后才发送告警。在等待期间新产生告警的状态为pending。 - labels:自定义标签,允许用户指定要附加到告警上的一组附加标签。 - annotations:用于指定一组附加信息,比如用于描述告警详细信息的文字等,annotations的内容在告警产生时会一同作为参数发送到Alertmanager。 ## 检验 **查看规则生效** ``` http://192.168.0.229:9090/rules ``` ![](https://www.aneasystone.com/usr/uploads/2018/10/1285663259.jpg)
**查看警告生效** ``` http://192.168.0.229:9090/alerts ``` ![](https://www.aneasystone.com/usr/uploads/2018/10/1360557187.jpg) 当我们停掉某个 exporter 时, State 变为FIRING
';