java - 当所有div类名和span类名相同时如何使用java中的jsoup找到内部元素

标签 java jsoup

<div class="xyOfqd">
   <div class="hAyfc">
     <div class="BgcNfc">Updated</div>
       <span class="htlgb">
          <div>
             <span class="htlgb">July 14, 2018</span>
          </div>
       </span>
     </div>
   <div class="hAyfc">
     <div class="BgcNfc">Size</div>
     <span class="htlgb">
        <div><span class="htlgb">3.9M</span></div>
     </span>
  </div>
</div>

我想要使用 java 中的 jsoup 获取上面 html 中的所有文本。

像这样 更新 2018 年 7 月 14 日 尺寸 3.9M

更新和大小是恒定的,但日期和 3.9M 是动态值。

基本上,我正在尝试从 Google Play 商店中删除这些值。

最佳答案

您这里有两个问题:

  1. 查找同名元素的 CSS 选择器。这是更容易的部分,因为它们都有不同的选择器。如果您使用浏览器的开发者工具,您将看到 update 的选择器为 div.hAyfc:nth-child(1) > div:nth-child(1) 并且size 的选择器为 div.hAyfc:nth-child(2) > div:nth-child(1)
  2. 获取动态值 - 嗯,Jsoup 无法获取动态值。您可以尝试找到获取这些值的 ajax 调用,并尝试使用 Jsoup 执行相同的操作,或者使用其他工具,例如 PhantomJS

关于java - 当所有div类名和span类名相同时如何使用java中的jsoup找到内部元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52233857/

相关文章:

java - 在spark java api(org.apache.spark.SparkException)中使用filter(),map(),...时出错

java StreamTokenizer wordChars() 和 nextToken()

java - 在一行上打印出两个变量?

java - 使用 Jsoup 提取 HTML 数据

java - Jsoup getElementsByTag 或选择?

java - 从 Java 生成 Kotlin 接口(interface)类会生成错误

java - 将android SQLite文本内容转储到textView中

java - 如何使用 jsoup 选择一组特定的 <p> 标签

java - 使用 Jsoup 获取图片地址

java - 获取网站移动版?