我正在编写一个应用程序,用于搜索长序列中的特定碱基对集。如果我有这样的碱基对序列:
A T G C A T G A C G T A A G C T
我需要在其中搜索一组不明确的字符。
要找到的序列必须匹配
n C G n A A
格式,其中“n”代表任意字符。因此,它会搜索文档以找到它所在的任何位置
[any character] [C] [G] [any character] [A] [A]
它会返回
A T G C A T G [A C G T A A] G C T
有没有办法在Java中表示“n”?
最佳答案
这个怎么样?正如 Codebender 所说,正则表达式非常适合这项工作:
public void matchBasePairSequence(String line){
// Construct regex
Pattern digitsPattern = Pattern.compile(".CG.AA");
Matcher m = digitsPattern.matcher(line);
while (m.find()){
System.out.println(m.group());
}
}
关于java - 在Java中表示通用字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31223514/