告警规则配置
日志告警的第一步是配置告警规则,日志内容触发告警规则后,将产生一条新的告警事件,同时通过您配置的通知策略发送告警通知。进入日志搜索页面,输入搜索分析条件,搜索出日志结果。点击搜索栏下面的另存为告警,打开告警规则配置页面。
在告警规则配置页面,您需要填写以下信息:
告警规则属性
- 名称:告警规则名称。
- 描述:告警规则描述。
- 运行周期:告警规则运行周期,即每隔多久根据告警规则检测一次日志内容。
告警条件
- 查询语句:通过搜索分析语句过滤您想监控告警的指标。
- 查询时间:设定日志的查询的时间范围,只对此时间范围内的日志检测异常。
- 触发条件:设置告警触发阈值,如 cpu_avg>0.8 是一个告警触发条件。
- +添加:支持同一个告警条件添加多个触发条件,并指定或/且关系。
- 添加告警条件:支持添加多个告警条件,并指定或/且关系。
定义告警事件
您需要定义此告警规则触发后产生的告警事件的属性,包括以下内容:- 告警服务:告警服务定义了事件合并规则和通知策略。即:触发此告警规则产生的告警事件进行合并的条件以及发送告警通知的方式。若告警平台暂无服务,您需要先创建告警服务。
- 告警程度:定义触发此告警规则产生的告警事件的严重程度。
- 注意:告警事件名称与告警服务同名。
如图,这条告警规则的意思是:每5分钟检查检测一次日志内容,若有服务器的系统cpu使用率平均值超过0.8即触发告警,告警严重程度为“严重”,且根据“cpu告警服务”指定的通知策略发送告警通知,根据“cpu告警服务”指定的合并规则合并告警事件。
告警事件触发后,请前往告警事件管理页面查看并处理。
告警规则管理
进入日志告警规则管理页面,对告警规则统一管理,如启用/禁用告警规则、查看告警规则配置、查看告警详情等。
点击查看告警详情,您可以查看告警规则被触发后的告警记录详情。
- 查看告警规则触发产生的事件
- 查看告警运行记录,每次运行的指标状态(正常、异常)、指标详情、运行消耗时间等。
文档反馈
(如有产品使用问题,请提交工单)