内置 CPU&内存 实时监控告警规则
自定义周期性执行的脚本进行监控告警
监控主机的 CPU 和内存的使用是否正常(比如都低于 80%)
服务器被挖矿 CPU 使用率过高导致业务服务不可用,以及保存告警时的进程列表方便后续排查
服务器内存使用率过高导致业务服务 OOM,以及保存当时的进程列表
(抛砖)自定义脚本监控 NAS 的磁盘是否正常
(引玉)发挥你的想象力,写任意监控脚本
需求一:监控主机 CPU 使用率是否异常,以及异常告警后能找到是哪个进程占用了这么高的 CPU
这里配置一个 “CPU 持续 60s 超过 80%”的告警规则
选择要监控的主机(一个监控规则可以批量选择多台主机)
完成!(文末附上测试方案和告警截图)
简单验证告警是否正常:
点击详情能看到触发告警的“恶意进程”快照
需求二:监控一下我家的 NAS 磁盘有没有异常(毕竟有多年的学习资料)
通过配置自定义脚本来实现,脚本执行失败则告警(如果不包含 healthy 就告警)
PS: 这里的告警条件也可以选择“脚本输出有关键字则告警”
这里就不模拟演示了QAQ
好用!!!快来试试吧