<div class="xyOfqd">
<div class="hAyfc">
<div class="BgcNfc">Updated</div>
<span class="htlgb">
<div>
<span class="htlgb">July 14, 2018</span>
</div>
</span>
</div>
<div class="hAyfc">
<div class="BgcNfc">Size</div>
<span class="htlgb">
<div><span class="htlgb">3.9M</span></div>
</span>
</div>
</div>
我想要使用 java 中的 jsoup 获取上面 html 中的所有文本。
像这样 更新 2018 年 7 月 14 日 尺寸 3.9M
更新和大小是恒定的,但日期和 3.9M 是动态值。
基本上,我正在尝试从 Google Play 商店中删除这些值。
最佳答案
您这里有两个问题:
- 查找同名元素的 CSS 选择器。这是更容易的部分,因为它们都有不同的选择器。如果您使用浏览器的开发者工具,您将看到
update
的选择器为div.hAyfc:nth-child(1) > div:nth-child(1)
并且size
的选择器为div.hAyfc:nth-child(2) > div:nth-child(1)
。 - 获取动态值 - 嗯,Jsoup 无法获取动态值。您可以尝试找到获取这些值的
ajax
调用,并尝试使用 Jsoup 执行相同的操作,或者使用其他工具,例如 PhantomJS
关于java - 当所有div类名和span类名相同时如何使用java中的jsoup找到内部元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52233857/