Python:读取子进程的标准输出而不打印到文件

标签 python subprocess

我有一个名为 BOB.exe 的可执行函数,它只需短暂的停顿即可将大量文本打印到标准输出。 BOB 也有卡住的习惯,所以我编写了一个 python 监视函数,该函数使用 subprocess 模块调用 BOB 可执行文件,将其定向到临时文件并监视临时文件的大小以查看它是否已崩溃。这是我当前的解决方案:

#!/usr/bin/python
from subprocess import Popen
import tempfile, time
def runBOB(argsList):

    # Create a temporary file where BOB stdout will be piped
    BOBout = tempfile.NamedTemporaryFile()
    BOBoutSize = 0

    # Start the subprocess of BOB
    BOBsp = Popen(argsList, stdout=BOBout)

    while True:
        # See if subprocess has finished
        if BOBsp.poll() is not None:
            BOBout.close() # Destroy the temp file
            return 0

        # if the size of the stdout file has increased, BOB.exe is still running
        BOBoutSizeNew = os.path.getsize(BOBout.name)
        if BOBoutSizeNew > BOBoutSize:
            BOBoutSize = BOBoutSizeNew
        else: # if not, kill it
            BOBsp.kill()
            BOBout.close() # Destroy the temp file
            return 1

        # Check every 10 seconds
        time.sleep(10)

但是,这非常慢,我认为写入文件是原因。有没有更有效的方法来做到这一点,例如观察标准输出流,然后立即将其发送到 Null?任何减少打印量的方法都可能有所帮助。还有其他方法可以查看 exe 是否崩溃吗?我可能应该注意到我不关心标准输出,无论如何它都会被忽略

感谢您的帮助!

最佳答案

您可以使用 stdout=subprocess.PIPE 告诉 subprocess 让您能够读取子进程的输出,而无需将其存储到文件中。棘手的部分是异步执行此操作,以免在 BOB.exe 卡住时出现死锁。一个简单的方法是使用辅助线程;尽管 Python 在线程方面声誉不佳,但这实际上是线程的一个很好的用例,其中 GIL 不会妨碍。

只需创建一个辅助线程,除了从与 Bob 的输出相对应的文件句柄中读取输出之外,该线程不执行任何操作。辅助线程立即丢弃输出并递增字节计数器。主线程实现与之前完全相同的逻辑,但使用内存计数器而不是重新检查文件大小。当 Bob 完成或被主线程杀死时,辅助线程将收到 EOF 并退出。

这是上述内容的未经测试的实现:

#!/usr/bin/python
import subprocess
import threading
import time
import os

bytes_read = 0

def readBOB(pipe):
    global bytes_read
    bytes_read = 0
    while True:
        # Wait for some data to arrive. This must use os.read rather
        # than pipe.read(1024) because file.read would block us if less
        # than 1024 bytes of data arrives. (Reading one byte at a time
        # with pipe.read(1) would work, but would be too slow at
        # consuming large amounts of data.)
        s = os.read(pipe.fileno(), 1024)
        if not s:
            return  # EOF
        # we are the only writer, so GIL serves as the lock
        bytes_read += len(s)

def runBOB(argsList):
    # Start the subprocess of BOB
    BOBsp = subprocess.Popen(argsList, stdout=subprocess.PIPE)

    thr = threading.Thread(target=readBOB, args=(BOBsp.stdout,))
    thr.start()
    old_bytes_read = -1

    while True:
        # See if subprocess has finished
        if BOBsp.poll() is not None:
            return 0

        # if the size of the stdout has increased, BOB.exe is still running
        new_bytes_read = bytes_read

        if new_bytes_read > old_bytes_read:
            old_bytes_read = new_bytes_read
        else: # if not, kill it (readBOB will exit automatically)
            BOBsp.kill()
            return 1

        # Check every 10 seconds
        time.sleep(10)

关于Python:读取子进程的标准输出而不打印到文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29800032/

相关文章:

python - 像 Excel 一样对数据框列进行平均

python - 在 matplotlib 中分页/滚动二维热图集

python - 在 Python 中捕获 netcat shell 命令输出

Python子进程模块: send string to two chained subprocesses

python - subprocess.call 与 os.system python

Python 3.4 - 无法导入模块

Python 检查字典中是否定义了键

python - 向量化 np.arange 或等价物

python - 如何使用 Python 获取存储库分支列表

python - 如何防止 Docker 弄乱子进程输出顺序? (包括 MCVE)