我正在尝试检测此文件中的所有段落:
XML 文件
为此,我使用了以下代码:
Pattern p = Pattern.compile("<paragraph>\\s*?(.*?)\\s*?(.*?)\\s*?(.*?)</paragraph>");
Matcher m = p.matcher(ne);
int occur = 1;
while(m.find()) {
System.out.print("Word = " + ne.substring(m.start(), m.end())+"\n"); }
}
问题是它只检测第一段。请帮忙?
最佳答案
这是使用 commons-lang 的一行:
String[] paragraphs = StringUtils.substringsBetween(ne, "<paragraph>", "</paragraph>");
关于java - 检测标签的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30245192/