linux - 使用 100% IO 监视和终止失控进程?

标签 linux unix filesystems sysadmin

我有一些必须以高优先级运行的进程(chrt 98),它们偶尔会决定硬锁定并将 1 个内核固定在 100%(不是什么大问题),但更重要的是,它会使用所有 IO在一个系统上,如此之多以至于不可能通过 ssh 登录机器来杀死它或在没有加载到 ram 的机器上执行任何任务。如果我碰巧有 htop 之类的东西已经在运行,我可以很好地结束这个过程。是否有任何类型的实用程序/方法来监视这种类型的失控进程并杀死任何使用 100% 系统 IO 超过 X 时间的东西?谢谢!

最佳答案

你不能用nice(和较低的优先级)启动程序吗?这样至少你应该能够通过 ssh 进入盒子并轻松杀死它。

更好的解决方案当然是修复违规进程的行为(需要详细信息)。

This serverfault thread似乎也包含您具体要求的内容。

关于linux - 使用 100% IO 监视和终止失控进程?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2784468/

相关文章:

java - 使用java的sudo命令不起作用

linux - ACL和符号链接(symbolic link)问题

linux - 从 systemd bash 内联脚本创建 filename_$(date %Y-%m-%d)

c - 该程序中的 fgets

c - 系统范围页表

c++ - 什么是 C 中套接字编程的好书/指南?

linux - 到 stderr 的输出改为到 stdout

filesystems - 如何从 Laravel 5.6 中的 SFTP 下载目录中列出的所有文件

java - java.io.File length() 可以锁定文件并阻止 File.delete() 工作吗?

macos - 无法删除 Mac 中的目录