我有一个如下所示的文件,其中包含几行标签。我有:
Pattern.compile("<(?:TIMEX TYPE|ENAMEX TYPE)=.+?>(.+?)</(?:TIMEX|ENAMEX)>");
如果两个标签都在一行上,这将获取我需要的数据。我的问题是处理以下几行:
<ENAMEX
TYPE="CITED">1</ENAMEX>
如果标签中间有分割,则它无法正常工作。因此,我正在寻求改进我的正则表达式的帮助,或者寻找适用于非标准 xml 标记的替代方案。
最佳答案
与其寻找“”(单个空格),为什么不多次寻找任何空格呢?应该类似于“\s+”。
关于java - 正则表达式帮助或替代方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10180475/