html - 如何使用 HtmlUnit 在另一个 div 中找到 div?

标签 html web-scraping htmlunit

我正在做一些项目,我需要从不同的网站上收集一些信息。我为此目的使用 HtmlUnit,但问题是我无法遍历一页上的元素。

示例:

  <div id="some_id">

      <div>

        <div>

           <div>

              ......
                       many divs in between
              ......

               <div id="my_target_div"> some information </div>

                ........

                ........

                 </div>

现在如何获取 ID 为 my_target_divdiv 以及 div 中的信息

最佳答案

使用getHtmlElementById

检查 documentation .

一个例子:

@Test
public void getElements() throws Exception {
    final WebClient webClient = new WebClient();

    final HtmlPage page = webClient.getPage("http://some_url");
    final HtmlDivision div = page.getHtmlElementById("my_target_div");

    webClient.closeAllWindows();
}

Source.

关于html - 如何使用 HtmlUnit 在另一个 div 中找到 div?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17235628/

相关文章:

android - PhoneGap - 在 Samsung Galaxy Tab 10.1 上键盘使屏幕变黑并闪烁一段时间

维斯特 | read_xml 声明错误,而 read_html 则不声明错误

r - 通过带有嵌入式传单 svg 等的 RSelenium 提取底层数据

java - HtmlUnit WebClient 超时

java - 限制htmlunit中的带宽

java - 如何使用java获取DOM事件监听器

javascript - 捕获元素的点击 ID,然后使用 GTM 将其附加到传出 URL

JavaScript 无法在 Chrome 扩展程序中运行

html - margin 自动不起作用

python - 使用 Selenium 从没有 ID 或类的列表中抓取文本