我有这样一个文件:
readA chr1 229665946 229666155 + ABCB10 NM_012089 exon6
readA chr1 229667383 229667478 + ABCB10 NM_012089 exon7
readA chr1 229675203 229675338 + ABCB10 NM_012089 exon8
readB chr2 229675000 229675888 + KGB09 NM_022158 exon2
我想像这样按第一列合并它:
readA chr1 229665946 229675338 + ABCB10 NM_012089 exon6,exon7,exon8
readB chr2 229675000 229675888 + KGB09 NM_022158 exon2
所以第一列和染色体位置被合并了,我试图通过 awk 或 bedtool merge 解决这个问题但失败了。有人可以帮助我吗?非常感谢!
最佳答案
以下可能对您有帮助。
awk '{a[$1]=a[$1]?a[$1] OFS $NF:$0} END{for(i in a){print a[i]}}' OFS=, Input_file
关于linux - 按一个字段合并行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50132248/