我在 Nagios Exchange 站点上找到了一项服务检查,它适用于小型目录,但不适用于完成时间超过 30 或 60 秒的大型目录。
我遇到的问题是我需要配置 Nagios 可以每天运行一次但将保持打开状态 1440 分钟(一天)的服务检查。目录列表很大,需要很多小时才能完成(最多 20 小时)。
这是我的服务检查(每天检查,使用nrpe时超时为86400秒,也是一天)。但是出于某种原因,即使我可以在 ps -ef | 中看到 du -sk 在命令行上运行。 grep du,Nagios 正在报告“(服务检查超时)”:
define service {
use generic-service,srv-pnp
host_name IMAGEServer1
service_description Images
check_command check_nrpe!check_dirsize -t 86400
check_interval 1440
}
在我的 linux 服务器上的 nrpe.cfg 文件中,我也有这两个指令:
command_timeout=86400
connection_timeout=86400
如何让Nagios完成检查而不超时?我的印象是我上面的指令是正确的。
最佳答案
超时的是本地的check_nrpe
命令(默认超时为2分钟)。您可以编辑其命令定义以使用长超时。
或者,您可能希望将此作为对 IMAGEServer1 的被动检查,作为 cron 作业运行。
关于linux - Nagios 中长时间运行的服务检查,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16155631/