linux - 如何识别长时间运行的进程是否死亡？

我正在开发一个与多个进程通信的守护进程。守护进程不能一直监视进程，但它必须能够正确识别进程是否死亡以释放它为它保留的稀缺资源。

进程可以与守护进程通信，在开始时给它一些信息，但反之则不行。所以守护进程不能只询问进程的身份。

最简单的形式是只使用他们的 PID。但最终可能会在我的工具没有注意到的情况下为另一个进程分配相同的 PID。

更好的方法是使用 PID 加上进程开始的时间。具有相同 PID 的新进程将具有不同的开始时间。但是我找不到如何以 POSIX 方式获取进程启动时间的方法。使用 ps或查看 /proc/<pid>/stat似乎不够便携。

一个似乎符合 POSIX 的更复杂的想法是:

每个进程创建一个临时文件。
使用 flock 锁定它
告诉我的守护进程“我的身份与此文件有关”。
任何时候守护进程都可以检查临时文件。如果它被锁定，则该进程是事件的。如果不是，则进程已结束。

但这似乎不必要地复杂。

是否有更好的或标准的方法？

编辑:守护进程必须能够在重启后恢复，因此不可能为每个进程保持持久连接。

最佳答案

But I couldn't find a way how to get the process start time in a POSIX way.

试试 standard "etime" format specifier : LC_ALL=C ps -eo etime= $PIDS

公平地说，我可能会构建自己的实时进程表，而不是依赖进程表和耗时。这基本上是您的文件锁定方法，尽管我可能会将所有锁定文件聚集在一个已知位置并按 PID 命名它们，例如 /var/run/my-app/8819.lock。事实上，这甚至可能会在长时间运行的进程上进行改造，因为文件描述符上的文件锁可以在 exec() 中继承。

(当然，如果我关心的长时间运行的进程有一个共同的父进程，那么我宁愿查询这个共同的父进程，谁可以是进程运行和不运行的可靠权威。)

关于linux - 如何识别长时间运行的进程是否死亡？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20194144/

linux - 如何识别长时间运行的进程是否死亡？

上一篇：java - SOS - 柏林调度程序无法继续下一项工作

下一篇：c - 动态添加条目到 sysctl