regex - 使用 grep 的乘数问题

我有以下文件

1:10177 rs367896724 A AC
1:10352 rs555500075 T TA
1:10616 rs376342519 CCGCCGTTGCAAAGGCGCGCCG C
1:11012 rs544419019 C G
1:11063 rs561109771 T G
1:13110 rs540538026 G A
1:13116 rs62635286 T G
1:13118 rs62028691 A G
1:13273 rs531730856 G C
1:13284 rs548333521 GT A

最后两列只能有值 [ATCG]。我想 grep 所有在最后两列中只有一个字母的行

预期输出: 我有以下文件

1:11012 rs544419019 C G
1:11063 rs561109771 T G
1:13110 rs540538026 G A
1:13116 rs62635286 T G
1:13118 rs62028691 A G
1:13273 rs531730856 G C

我尝试了以下方法，但没有得到任何结果

grep -F '[ACTG]?\s[ACTG]?$' 文件 |头

grep '[ACTG]?\s[ACTG]?$' 文件 |头

grep -E '.?\s.?$' 文件

通过最后一条命令，我得到了以下信息:

1:10616 rs376342519 CCGCCGTTGCAAAGGCGCGCCG C
1:11012 rs544419019 C G
1:11063 rs561109771 T G
1:13110 rs540538026 G A
1:13116 rs62635286 T G
1:13118 rs62028691 A G
1:13273 rs531730856 G C
1:13284 rs548333521 G A

感谢您的帮助!

最佳答案

如果您只想在最后两列中使用一个字符，请使用前导空白字符。根据您的描述，听起来也不应该有任何可选字符。

grep -E '\s.\s.$' 文件

或者

grep -E '(\s[ACTG]){2}$' 文件

两者都可以。

关于regex - 使用 grep 的乘数问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57186460/