java - 使用 JSoup 解析文档并删除具有特定 ID 和类的 div

标签 java jsoup

尽管它很简单并且已经提出了类似的问题,但我不知何故无法解决它。

public static Document removeDiv(Document document){

    document.getElementById("Wrapper_FixedWidth_Footer").remove();
    document.getElementById("u01").remove();

   return document;
}`

请使用以下文档作为该方法的输入。

Document doc = Jsoup.connect("https://www.oracle.com/storage/san/fs1/index.html").ignoreHttpErrors(true).userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/20100101 Firefox/31.0").timeout(0).get(); 

更具体地说,我不想包含页眉和页脚。 (我不想要本文档页眉和页脚相应div下的链接)

最佳答案

问题已解决。我在代码的其他部分检查的爬虫和条件似乎存在一些问题。

关于java - 使用 JSoup 解析文档并删除具有特定 ID 和类的 div,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32532943/

相关文章:

java - 如何在数组中添加 40 以下的数字

android - 如何从 android.webkit.CookieManager 获取所有 cookie 或 cookie 的 url

java - 用Java从互联网上获取数据

java - OpenHTMLToPDF:将自定义字体嵌入到由 HTML 创建的 PDF 中

java - 如何使用 JSoup 将 HTML 中的 ' ' 更改为 ' '

java - 无法从网页读取 html

java - 我可以在正则表达式中声明优先于匹配项吗?

JavaFX 和 IntelliJ 错误 : java. lang.module.InvalidModuleDescriptorException

java - 在mac上运行ant安装netbeans : Buildfile: build. xml不存在!构建失败

java - Android 应用程序不从 MYSQL 获取数据