java - Jsoup去除html元素和子项的高效方法

标签 java html jsoup

我想删除 html divtable 表格标签以及其中的所有内容(childs),最好的方法是什么?

我试过像这样遍历文档,但它不起作用,在 Jsoup 文档中它说 node.remove() 从 DOM 及其子元素中删除元素:

doc.traverse(new NodeVisitor() {
                @Override
                public void head(Node node, int i) {

                }

                @Override
                public void tail(Node node, int i) {
                    //Log.i(TAG,"node: "+node.nodeName());
                    if( node.nodeName().compareTo("table") == 0 ||
                            node.nodeName().compareTo("div") == 0 )
                       node.remove();

                }
            });

最佳答案

你试过remove()了吗? Elements 的功能类(class)?

Document doc = Jsoup.parse(html);
doc.select("div").remove();
doc.select("table").remove();

这应该选择并删除所有 <div><table>元素。

关于java - Jsoup去除html元素和子项的高效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19930737/

相关文章:

java - 避免从不同的服务获取文件服务器的相同文件

java - 获取增量为10的数组的总和JAVA

html - 居中导航栏图标文本 - 使用 Bootstrap 的 Rails 应用程序

javascript - 如何检索 html 文件内容并插入到另一个 html 文件?

java - 解析 HTML 以获取内容及其标签

java - tinyradius 验证方法导致 NullPointerException

javascript - 如何将幻灯片放映动画添加到我的侧边代码

java - Jsoup连接错误403和503

android - 如何检查在android中的Jsoup html解析器中是否存在标签

java - 尝试使用我自己的比较器进行 binarySearch 时出错