我想删除 html div
和 table
表格标签以及其中的所有内容(childs),最好的方法是什么?
我试过像这样遍历文档,但它不起作用,在 Jsoup 文档中它说 node.remove()
从 DOM 及其子元素中删除元素:
doc.traverse(new NodeVisitor() {
@Override
public void head(Node node, int i) {
}
@Override
public void tail(Node node, int i) {
//Log.i(TAG,"node: "+node.nodeName());
if( node.nodeName().compareTo("table") == 0 ||
node.nodeName().compareTo("div") == 0 )
node.remove();
}
});
最佳答案
你试过remove()
了吗? Elements 的功能类(class)?
Document doc = Jsoup.parse(html);
doc.select("div").remove();
doc.select("table").remove();
这应该选择并删除所有 <div>
和 <table>
元素。
关于java - Jsoup去除html元素和子项的高效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19930737/