java - 如何使用jsoup从整个html页面中删除特定标签

标签 java html dom tags jsoup

我正在使用 jsoup 1.7.3 来编辑一些 html 文件。

我需要从 html 文件中删除以下标签:

<meta name="GENERATOR" content="XXXXXXXXXXXXXX">
<meta name="CREATED" content="0;0">
<meta name="CHANGED" content="0;0">

如您所见,它是标签,我该怎么做,到目前为止我已经尝试过:

//im pretty sure that the <meta> tag is nested in the <header>
but removing the whole  header is bad practice.

Document docsoup = Jsoup.parse(htmlin);
docsoup.head().remove();

你有什么建议?

最佳答案

我建议您使用 Jsoup selectors , 例如

Document document = Jsoup.parse(html);
Elements selector = document.select("meta[name=GENERATOR]");

for (Element element : selector) {
    element.remove();
}

doc.html(); // returns String html with elements removed

关于java - 如何使用jsoup从整个html页面中删除特定标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20746274/

相关文章:

java - 将缩略图像素值加载到 Java 中的最快方法

javascript - 如何在表单提交时不上传图像/文件

javascript - getElementById().value 返回未定义

javascript - 有些东西阻止了 addEventListener(type, handler) 在 DOM 中工作

javascript - 使用脚本将 HTML Web 应用表数据发送回 Google 表格

java - 创建自定义java注释以修改方法

java - Android MediaPlayer无法正常工作

javascript - HTML bootstrap popover 函数

python删除html标签,包括html实体,但不包括带有 '&'前缀的普通文本

java - 如何解决 "Error creating bean with name ' 步骤 2' defined in class path resource "异常