python - fasta 文件标题行插入列

标签 python unix awk sed

我有一个 fasta 文件,其中包含序列 header 及其相应的序列,如下所示:

>ID101_hg19
ATGGGTGTATCGTACCC
>ID102_hg19
AGCTTTAGCGGGGTACA

我想将标题行更改为序列旁边的另一个制表符分隔列。这是所需的输出:

>ID101_hg19    ATGGGTGTATCGTACCC
>ID102_hg19    AGCTTTAGCGGGGTACA

关于如何完成这项任务有什么想法吗?

最佳答案

使用 Sed,你可以这样做:

sed 'N;s/\n/\t/' file.txt

使用 awk,您可以执行以下操作:

awk '{getline a; printf("%s\t%s", $0, a);}' file.txt

关于python - fasta 文件标题行插入列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34532583/

相关文章:

python - 在 azure 上安装附加组件以与 python webapp 一起使用

Python Pandas 到 R 数据框

linux - Unix/Linux Bash 脚本 : sed doesn't respect spaces

linux - 将最繁忙进程的 PID 存储在变量中

linux - 使用 awk 命令行组合列

python - PySpark:如何判断数据框的列类型

python - Python 中的 float 概念

unix - stdin 和 stdout 是如何成为进程独有的?

apache - Varnish :大师冥想

mysql - 在出现如此多的空格后从行中删除空格