我是 UNIX 的新手,所以请耐心等待。我有一个长文件,如下所示:
0 MitoT217C 0 217
0 MitoG228A 0 228
0 MitoC295T 0 295
0 MitoC458T 0 458
此文件中没有 header 。第一列代表 1-22 号染色体以及 X 和 Y 染色体。我只想提取 22 号染色体和 X 染色体的数据并放入单独的文件中。我知道如何执行后者,但我对如何仅获取这两条染色体的数据感到困惑。
最佳答案
例如:
- GNU grep:
egrep '^(22|X)' 旧文件 > 新文件
- GNU sed:
sed -r '/^(22|X)/!d' 旧文件 > 新文件
关于shell - 在 UNIX 中遍历文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20619477/