我正在使用将二进制文件输出到 STDOUT 的子进程模块从 shell 调用程序。
我使用 Popen() 调用程序,然后我想将流传递给 Python 包(称为“pysam”)中的一个函数,不幸的是,该函数不能使用 Python 文件对象,但可以读取来自标准输入。所以我想做的是让 shell 命令的输出从 STDOUT 进入 STDIN。
这如何在 Popen/subprocess 模块中完成?这是我调用 shell 程序的方式:
p = subprocess.Popen(my_cmd, stdout=subprocess.PIPE, shell=True).stdout
这将读取“my_cmd”的 STDOUT 输出并在 p 中获取到它的流。由于我的 Python 模块无法直接从“p”读取,我尝试使用以下方法将“my_cmd”的 STDOUT 重定向回 STDIN:
p = subprocess.Popen(my_cmd, stdout=subprocess.PIPE, stdin=subprocess.PIPE, shell=True).stdout
然后我调用我的模块,它使用“-”作为 STDIN 的占位符:
s = pysam.Samfile("-", "rb")
上面的调用只是意味着从STDIN(表示为“-”)中读取并将其作为二进制文件(“rb”)读取。
当我尝试这个时,我只是将二进制输出发送到屏幕,而且 Samfile() 函数似乎无法读取它。即使我删除了对 Samfile 的调用,也会发生这种情况,所以我认为问题出在我对 Popen 的调用上,而不是下游步骤。
编辑:为了回应答案,我试过:
sys.stdin = subprocess.Popen(tagBam_cmd, stdout=subprocess.PIPE, shell=True).stdout
print "Opening SAM.."
s = pysam.Samfile("-","rb")
print "Done?"
sys.stdin = sys.__stdin__
这似乎挂了。我得到输出:
Opening SAM..
但它永远不会超过 Samfile("-", "rb") 行。知道为什么吗?
知道如何解决这个问题吗?
编辑 2:我正在添加指向 Pysam 文档的链接以防它有帮助,我真的想不通。文档页面是:
http://wwwfgu.anat.ox.ac.uk/~andreas/documentation/samtools/usage.html
关于流的具体说明在这里:
http://wwwfgu.anat.ox.ac.uk/~andreas/documentation/samtools/usage.html#using-streams
特别是:
""" Pysam 不支持从真正的 python 文件对象读取和写入,但它支持从 stdin 和 stdout 读取和写入。以下示例从 stdin 读取并写入 stdout:
infile = pysam.Samfile( "-", "r" )
outfile = pysam.Samfile( "-", "w", template = infile )
for s in infile: outfile.write(s)
它也适用于 BAM 文件。以下脚本将 stdin 上的 BAM 格式文件转换为 stdout 上的 SAM 格式文件:
infile = pysam.Samfile( "-", "rb" )
outfile = pysam.Samfile( "-", "w", template = infile )
for s in infile: outfile.write(s)
注意,只需要将文件打开方式由r改为rb即可。 """
所以我只想获取来自 Popen 的流,它读取 stdout,并将其重定向到 stdin,这样我就可以使用 Samfile("-", "rb"),因为上面的部分说明是可能的。
谢谢。
最佳答案
如果您使用 stdout=subprocess.PIPE
,我有点困惑,您在 stdout 上看到二进制文件,但是,总体问题是您需要使用 sys.stdin
如果你想欺骗 pysam 使用它。
例如:
sys.stdin = subprocess.Popen(my_cmd, stdout=subprocess.PIPE, shell=True).stdout
s = pysam.Samfile("-", "rb")
sys.stdin = sys.__stdin__ # restore original stdin
更新:假设 pysam 在 Python 解释器的上下文中运行,因此当指定“-”时意味着 Python 解释器的标准输入。不幸的是,事实并非如此;当指定“-”时,它直接从文件描述符 0 读取。
换句话说,它没有使用 Python 的标准输入 (sys.stdin) 概念,因此替换它对 pysam.Samfile() 没有影响。也不可能从 Popen 调用中获取输出并以某种方式将其“推送”到文件描述符 0;它是只读的,它的另一端连接到您的终端。
将输出输出到文件描述符 0 的唯一真正方法是将它移动到一个额外的脚本,并从第一个开始将两者连接在一起。这确保了第一个脚本中 Popen 的输出将在第二个脚本的文件描述符 0 上结束。
因此,在这种情况下,您最好的选择是将其拆分为两个脚本。第一个将调用 my_cmd 并获取它的输出并将其用于另一个调用 pysam.Samfile("-", "rb") 的 Python 脚本的第二个 Popen 的输入。
关于python - 使用 Python 子进程将 stdout 重定向到 stdin?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8466926/