我让 Nagios 监视我所有 Unix 系统上的根分区(Linux - 基于 Gentoo 和 Debian - 以及一台 Mac Mini)。我还监控 4 个 NAS 系统(3 个 QNAP、1 个 Synology)和我的 VCentre 设备。
Nagios 突然向我显示所有这些设备的服务警告,声称磁盘空间不足,且值相同...
我使用服务模板通过 NagioSQL 设置了 Nagios,但这里是服务配置的内容。
define service {
#NAGIOSQL_CONFIG_NAME services
host_name BLURR-2,COSYFEET04a,ELUCIDRF,Laserbeak,LOGGER,MIRAGE,OUTBACK,QNAP1,QNAP2,QNAP3,Silverbolt,VCENTRE
service_description Root Partition
servicegroups infrastructure
use standard-service
check_command check_local_disk!20%!10%!/
icon_image root.png
register 1
}
...这是命令.cfg 中 check_local_disk 的配置...
define command {
command_name check_local_disk
command_line $USER1$/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$
register 1
}
理想情况下,我不想调整分区大小。在某些情况下(Mac Mini、NAS 设备)我不能!
Nagios 检查是否只是出现故障,我只是误用了根分区检查还是我这里正在酝酿真正的问题,因为我无法解释为什么所有值都重复 - 其中一个虚拟机是 P2V,一个正在运行 Nagios 本身,一个还不到一个月!
最佳答案
1)您应该为每个主机提供单独的服务,以便您可以指定唯一的阈值等
2) 您正在使用 check_local_disk,它没有 -H 参数,因此实际上您始终在检查 Nagios 磁盘本身。您应该使用 check_nrpe -H Remotehost -c check_disk -a '-w 20% -c 10% 检查远程主机上的磁盘 查看http://nagios-plugins.org/doc/man/check_disk.html
关于linux - *所有* Unix 系统的根分区警告,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31512932/