我正在使用 jsoup 1.7.3 来编辑一些 html 文件。
我需要从 html 文件中删除以下标签:
<meta name="GENERATOR" content="XXXXXXXXXXXXXX">
<meta name="CREATED" content="0;0">
<meta name="CHANGED" content="0;0">
如您所见,它是标签,我该怎么做,到目前为止我已经尝试过:
//im pretty sure that the <meta> tag is nested in the <header>
but removing the whole header is bad practice.
Document docsoup = Jsoup.parse(htmlin);
docsoup.head().remove();
你有什么建议?
最佳答案
我建议您使用 Jsoup selectors , 例如
Document document = Jsoup.parse(html);
Elements selector = document.select("meta[name=GENERATOR]");
for (Element element : selector) {
element.remove();
}
doc.html(); // returns String html with elements removed
关于java - 如何使用jsoup从整个html页面中删除特定标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20746274/