我有一些必须以高优先级运行的进程(chrt 98),它们偶尔会决定硬锁定并将 1 个内核固定在 100%(不是什么大问题),但更重要的是,它会使用所有 IO在一个系统上,如此之多以至于不可能通过 ssh 登录机器来杀死它或在没有加载到 ram 的机器上执行任何任务。如果我碰巧有 htop 之类的东西已经在运行,我可以很好地结束这个过程。是否有任何类型的实用程序/方法来监视这种类型的失控进程并杀死任何使用 100% 系统 IO 超过 X 时间的东西?谢谢!
最佳答案
你不能用nice
(和较低的优先级)启动程序吗?这样至少你应该能够通过 ssh 进入盒子并轻松杀死它。
更好的解决方案当然是修复违规进程的行为(需要详细信息)。
This serverfault thread似乎也包含您具体要求的内容。
关于linux - 使用 100% IO 监视和终止失控进程?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2784468/