Pandora提供告警事件审查管理视图,可以从原始告警事件和聚合事件组两个维度对事件进行管理。
告警事件总览
用户可以对产生的事件数据进行灵活关联分析,并添加至仪表盘进行可视化呈现,事件总览方便用户更直观得观察了解近期整体告警情况及事件处理情况,或者借助机器学习能力进行根因分析及预测分析,以提供更全面更多维的分析价值。
原始告警事件审查管理
当用户配置的告警规则被触发后,将产生告警事件,Pandora将对应的事件信息通过规则中配置的触发操作发送给用户,您也可以进入事件审查页面点击告警事件查看对应事件更详细丰富的信息,包括事件名称、描述、告警时间、告警级别、事件状态、指标详情、事件记录等,具体说明如下:
展示项目 | 说明 |
---|---|
事件描述 | 告警事件的更详细信息 |
事件ID | 告警事件的唯一标识 |
告警级别 | 告警事件对应的级别,例如致命 |
事件状态 | 事件状态分为“未恢复”或“已恢复”,当事件满足恢复条件时将被自动置为“已恢复”状态 |
告警对象 | 也称为监控对象,表示产生告警事件的对象,即满足阈值的指标归属对象。例如,cpu_usagerate=88%时满足大于阈值80%,对应实例host=xs1955,host就是该告警规则的告警对象 |
告警时间 | 告警事件触发的时间,例如,2020-11-21 10:13:11 |
指标详情 | 告警事件对应的指标值详情,触发阈值的指标值将以红色突出展示 |
附加内容 | 点击具体的「附加内容名称」后跳转到搜索页面查看对应的附加内容 |
原始日志 | 点击“查看”跳转到搜索页面,查看触发本次事件的运行任务对应的原始日志 |
触发操作 | 点击可以查看触发操作详情 |
事件来源 | 点击「告警规则名称」跳转到告警规则详情页面,具体参看告警规则 |
事件记录 | 记录告警事件触发后的时序状态变化,包括事件产生、触发操作、恢复等,记录触发操作执行结果 |
系统支持告警事件按角色分权限查看、管理,以支撑不同用户管理对应事件,减少干扰,保障业务数据的安全,普通用户可以查看发送给自己或具备权限的告警规则触发产生的事件,管理员可管理所有事件。
事件配置
-
支持用户通过“到期时间”自定义配置告警事件的存储时限,当事件到达到期时间时将自动删除,系统默认配置值为6个月。
-
可以通过视图切换进行事件审查页面的切换,点击配置中“切换”按钮可以进行原始事件审查和聚合事件组审查页面的互相切换,方便用户从两个维度进行事件的查看管理。
聚合事件组审查管理
用户可以通过聚合事件组视图对事件进行审查管理,原始事件通过多维度自定义聚合规则聚合归类到对应的事件组中,Pandora支持用户对事件组配置触发条件和告警触发操作,从而提升分析管理重要事件的效率,降低一定场景和时间范围内的告警风暴。
事件组有自身属性,管理列表展示包括聚合事件数、事件名称、告警级别、聚合对象、聚合事件(包含哪些原始告警事件)、告警时间及事件状态等信息,具体说明如下:
展示项 | 说明 |
---|---|
告警时间 | 该事件组对应的聚合规则运行周期 |
告警级别 | 事件组中包含的原始事件中最高告警级别 |
事件组状态 | 事件组状态包括“未恢复”or“已恢复”,当事件组包含的所有事件都置为“已恢复”,则将事件组状态置为“已恢复” |
聚合对象 | 根据1个或多个字段分组聚合,该事件组所对应的分组字段值 |
事件源 | 事件组中包含的事件概况 |
事件来源 | 点击「聚合规则名称」可以查看具体规则详情,具体参看聚合规则 |
触发操作 | 当满足配置的触发条件时,执行相应触发操作 |
事件描述 | 聚合事件组的具体描述信息 |
事件记录 | 记录聚合事件组的时序状态变化,包括事件组产生、触发操作、恢复等,记录触发操作执行结果 |
文档反馈
(如有产品使用问题,请 提交工单)