我的第一个命令行 "bcftools query -l {input.invcf} | head -n 1"
的输出打印了 vcf 文件的第一个个体的名称(即 IND1
)。我想在 -sn IND1
选项的 selectvariants GATK
中使用该输出。如何在 snakemake 中集成第一条命令行以便在下一条中使用它的输出?
rule selectvar:
input:
invcf="{family}_my.vcf"
params:
ind= ???
ref="ref.fasta"
output:
out="{family}.dn.vcf"
shell:
"""
bcftools query -l {input.invcf} | head -n 1 > {params.ind}
gatk --java-options "-Xms2G -Xmx2g -XX:ParallelGCThreads=2" SelectVariants -R {params.ref} -V {input.invcf} -sn {params.ind} -O {output.out}
"""
最佳答案
有多种选择,但最简单的一种是将结果存储到临时 bash 变量中:
rule selectvar:
...
shell:
"""
myparam=$(bcftools query -l {input.invcf} | head -n 1)
gatk -sn "$myparam" ...
"""
如@dariober 所述,如果修改pipefail
行为,可能会出现意外结果,请参阅the example in this answer .
关于python - Snakemake 将多个命令行集成在一个规则中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70985443/