我正在尝试使用 JSoup 从页面上抓取一些信息,这些信息可以通过一组特定顺序的标签来识别。它们的顺序如下:
<span class="sold" >Sold</span></td>
<td class='prc'>
<div class="g-b bidsold" itemprop="price">
AU $1.00</div>
我希望获取页面上 AU $1.00 字段位置的每个值,但它们只能由出现几个标签的 span class="sold"
选择器识别预先。
我尝试过类似 select("span.sold:lt(4) + [itemprop=price]")
的方法,但感觉自己在黑暗中挣扎!
最佳答案
下面的代码应该可以解决问题!
Document doc = Jsoup.connect(/*URL of your HTML document*/").get();
Element part = doc.body();
Elements parts = part.getElementsByTag("div");
String attValue;
String requiredContent;
for(Element ent : parts)
{
if(ent.hasAttr("class"))
{
attValue = ent.attr("class");
if(attValue.equals("g-b bidsold"))
{
System.out.println("\n");
requiredContent=ent.text();
System.out.println(requiredContent);
}
}
}
只需确保迭代并在数组中获取输出。
关于java - 使用 JSoup 选择一组标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14853238/