我有一个很大的 HTML 文件,里面装满了东西。
在该文件的某处,有这样一行
<span class="xcomponent">pls do not delete me</span>
我需要去掉这些东西,但留下中间的东西。
我正在使用 Java,并且我认为正确的方法是正则表达式 - 我只是没有足够的正则表达式经验来实现这一目标。
如果有任何帮助,这是我的“黑暗中的刺”。
.*?(<span class="xcomponent">.*?</span>).*?
最佳答案
这就是你想要的:
Pattern p = Pattern.compile("<span class="xcomponent">(.*?)</span>");
Matcher m = p.matcher(html);
m.replaceAll("$1");
关于java - REGEX - 删除某物周围的东西?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6496007/