长亭百川云 - 文章详情

超好用的服务器监控&告警,快来试试

mx

45

2023-10-13

超好用的服务器监控&告警

新功能

  • 内置 CPU&内存 实时监控告警规则

  • 自定义周期性执行的脚本进行监控告警

使用场景

  • 监控主机的 CPU 和内存的使用是否正常(比如都低于 80%)

    • 服务器被挖矿 CPU 使用率过高导致业务服务不可用,以及保存告警时的进程列表方便后续排查

    • 服务器内存使用率过高导致业务服务 OOM,以及保存当时的进程列表

  • (抛砖)自定义脚本监控 NAS 的磁盘是否正常

    • 自建 NAS raid 的磁盘健康检查,如果损坏了及时备份数据,以免造成更大损失
  • (引玉)发挥你的想象力,写任意监控脚本

使用教程

需求一:监控主机 CPU 使用率是否异常,以及异常告警后能找到是哪个进程占用了这么高的 CPU

  1. 点击右上角的设置,然后点击监控告警进入到配置页面

  1. 点击添加监控项配置 CPU 或内存的监控

这里配置一个 “CPU 持续 60s 超过 80%”的告警规则

选择要监控的主机(一个监控规则可以批量选择多台主机)

完成!(文末附上测试方案和告警截图)

简单验证告警是否正常:

  • 通过 stress 压测 CPU

  • 等待 60 秒(也可以在告警规则配置更短的持续时间),消息列表已经发现了告警

  • 点击详情能看到触发告警的“恶意进程”快照

  • 如果配置了微信公众号和钉钉机器人,也可以实时收到告警

需求二:监控一下我家的 NAS 磁盘有没有异常(毕竟有多年的学习资料)

通过配置自定义脚本来实现,脚本执行失败则告警(如果不包含 healthy 就告警)

PS: 这里的告警条件也可以选择“脚本输出有关键字则告警”

这里就不模拟演示了QAQ

总结

好用!!!快来试试吧

相关推荐
关注或联系我们
添加百川云公众号,移动管理云安全产品
咨询热线:
4000-327-707
百川公众号
百川公众号
百川云客服
百川云客服

Copyright ©2024 北京长亭科技有限公司
icon
京ICP备 2024055124号-2