bash - 使用 samtools 提取两个配对均未映射的未映射读数?

标签 bash bioinformatics samtools

我正在尝试确定提取未映射读数的最佳方法,其中配对中的两个配对均未映射。目前,我的代码似乎只是提取所有未映射的读取,无论它们的配对如何。我不知道如何解决这个问题,因为我已经使用 -f 选项来提取未映射的读取。我会再次迭代 samtools View 吗?

samtools view -@ 4 -buh -f4 sample${r}_pe.remove.sam > sample${r}_pe.unmapped.bam

最佳答案

仅提取读段 1 未映射且读段 2 未映射的读段(= 两个配合都未映射):

samtools view -b -f12 input.sam > output.both_mates_unmapped.bam

这里的选项是:

-b - 输出 BAM,
-f12 - 过滤器仅读取标志:4(读取未映射)+ 8(配合未映射)。

另请参阅:

解码 SAM 标志:https://broadinstitute.github.io/picard/explain-flags.html

关于bash - 使用 samtools 提取两个配对均未映射的未映射读数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63157073/

相关文章:

bash - sh/Bash shell 脚本中的 !#(重磅)是什么意思?

bash - sed 或 awk 替换前 14 个出现的位置

python - 错误的请求biopython出了什么问题

python - 如何让 PyC​​harm 在输出控制台中显示整个数据帧?

python - 如何解压缩/解密 gzip 文件的单行

python - 如何加入两个子进程的标准输出并通过管道连接到python中新子进程的标准输入

linux - 如何 "catch"非零退出代码尽管 "set -e"然后回显错误代码

python - 如何将 CRAFT 语料库中的 XML NER 数据转换为 spaCy 的 JSON 格式?

python - 如何缓存读取?

linux - 即使子进程仍在运行,Bash 等待子进程也可以返回