智能日志管理平台

  • 通过告警监控 nginx 日志

    最近更新时间:2018-09-26 14:15:26

    前面我们已经介绍了通过报表和仪表盘功能对 Nginx 日志内容进行分析与监控,详情请阅读 Nginx 日志分析。那如何在不盯着仪表盘的情况下及时了解 Nginx 日志 的异常并接收告警信息呢?

    使用智能日志管理平台的告警功能配置告警条件,自动定期运行日志查询结果,一旦触发告警条件,将以邮件、短信或 HTTP 形式给您发送告警信息。

    本文以 Nginx 日志为例,为您示范如何使用告警功能对收集到的日志定时查询分析并接收告警信息。使用 logkit-pro 采集 Nginx与前文无异,本案例从日志查询分析开始讲解。

    配置告警入口

    配置告警的步骤为:

    选择日志仓库--->输入搜索条件--->搜索日志内容--->另存为告警

    单击搜索栏下面的“另存为告警”,进入告警配置页面。

    判断服务器是否出错并告警

    对 Nginx 日志可以通过 http 返回码判断服务器是否出错并告警:判断是否出现 status(http 状态码) 字段的值为 500 的日志。

    首先通过查询语句:status:500 查询出指定时间范围内的 status500 的日志。

    点击另存为告警按照如图所示的配置填写告警指标:每 10 分钟 查询一次前 24 小时的日志结果,选择报警指标为事件总数,报警阈值为大于等于1,一旦 status500 的日志出现即发送告警信息到指定邮箱。

    点击测试规则,测试是否可以收到告警邮件。

    测试完成点击提交您就可以及时接收告警信息啦。

    注意:搜索条件与告警条件灵活结合可以满足更多告警场景哦!

    服务器响应时间过长告警

    服务器运行过程中如果出现响应时间过长的情况就告警,提醒您对 Nginx 进行性能优化。

    查询仓库下全部日志内容:

    点击另存为告警按照如图所示的配置填写告警指标:每 5 分钟 查询前 10 分钟的日志结果,选择报警指标为 request_time 的平均值,报警阈值为大于等于 1。request_time 的平均值如果超过 1s 即发送报警信息。

    流量异常告警

    为了防止一些恶意访问的行为,例如不断的请求刷流量,通过实时过滤 Nginx 访问日志,当单位时间内访问次数达到指定阈值时通过邮件的方式告警。

    查询日志仓库下全部日志内容:

    点击另存为告警按照如图所示的配置填写告警指标:每 1 分钟 查询一次前 1 分钟的日志结果,选择分组字段为 remote_addr(客户端 IP 地址),报警指标为事件总数,报警阈值为大于等于 200,即单位时间内单 ip 访问次数超过 200 就发送告警信息。

    关于告警的详细配置说明请阅读告警与通知

    以上内容是否对您有帮助?
  • Icon free helper
    Close