python - 为 Python 处理其输出的外部程序计时

我想测量我的 Python 脚本使用其输出的外部程序的执行时间。

调用 extprogram 产生输出的程序，此刻我做了类似的事情:

import time
import subprocess

def process_output(line):
   ...
   ...
   return processed_data

all_processed_data = []

ts = time.time()
p = subprocess.Popen("extprogram", stdout=subprocess.PIPE)

for line in p.stdout:
    all_processed_data.append(process_output(line))
te = time.time()
elapsed_time = te - ts

这没有按预期工作，因为我测量的是 extprogram 的执行时间加上处理其输出所需的时间。

extprogram 会产生大量数据，因此我想像现在一样使用循环在我的 Python 程序中“流式传输”它的输出。当 extprogram 终止而不是等待所有输出被处理时，如何评估 te？

最佳答案

因为你在 Unix 下，你可以使用 time 命令。这是原则:

import sys
import subprocess

p = subprocess.Popen(["time", "ls"], stdout=subprocess.PIPE, stderr=subprocess.PIPE)

for line in p.stdout:  # ls output
    sys.stdout.write(line)

time_output = p.stderr.readlines()

print "Stderr:", ''.join(time_output)

在我的机器上，这给出了:

Stderr:         0.01 real         0.00 user         0.00 sys

处理器总时间是user + sys时间(real是挂钟时间，一般不代表处理器占用多少程序使用的时间:例如，sleep 5，real 时间是 5 秒，而 user 和 sys code> 次为 0)。

这是有效的，因为 time 输出了对实际执行时间的详细说明(不仅仅是墙上时间，这取决于其他正在运行的进程等)，并且对标准错误也是如此输出。您可以解析标准错误并获取时序信息。

如果您的程序将数据输出到可能干扰 time 命令解析的标准错误，则此方法可能不实用。

此外，我还没有检查过上面的代码不会发生死锁(我不确定如果调用的程序向标准错误打印很多内容会发生什么:程序是否会阻塞直到标准错误缓冲区是读取，如果 Python 程序正在读取标准输出，这可能不会发生？)。也就是说，如果你知道定时程序没有或只有很少的标准错误数据，我相信上面的代码不会死锁。

关于python - 为 Python 处理其输出的外部程序计时，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15787735/

python - 为 Python 处理其输出的外部程序计时

上一篇：python - Apache 工作台连接被拒绝 (61) apr_socket_recv

下一篇：python - 如何在 gtk3 中创建一个实时更新的 matplotlib 图