java - 使用 JSoup 选择一组标签

标签 java jsoup

我正在尝试使用 JSoup 从页面上抓取一些信息,这些信息可以通过一组特定顺序的标签来识别。它们的顺序如下:

 <span class="sold" >Sold</span></td>
    <td class='prc'>
        <div  class="g-b bidsold" itemprop="price">
                AU $1.00</div>              

我希望获取页面上 AU $1.00 字段位置的每个值,但它们只能由出现几个标签的 span class="sold" 选择器识别预先。

我尝试过类似 select("span.sold:lt(4) + [itemprop=price]") 的方法,但感觉自己在黑暗中挣扎!

最佳答案

下面的代码应该可以解决问题!

Document doc = Jsoup.connect(/*URL of your HTML document*/").get();
Element part = doc.body();
Elements parts = part.getElementsByTag("div");
String attValue;
String requiredContent;
for(Element ent : parts)
{
    if(ent.hasAttr("class"))
    {
        attValue = ent.attr("class");
        if(attValue.equals("g-b bidsold"))
        {
            System.out.println("\n");
            requiredContent=ent.text();
            System.out.println(requiredContent);
        }
    }
}

只需确保迭代并在数组中获取输出。

关于java - 使用 JSoup 选择一组标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14853238/

相关文章:

java - Jsoup 获取元素内的元素

java - 什么是正确的 CSS 选择器来获得我需要的东西?

java - 模拟 : mock method call with parameters by reflection

java - 为什么 Double.NaN==Double.NaN 返回 false?

java - Guava 缓存作为 Spring ap 中基于时间的清理存储

java - 输出 JSoup,元素周围不添加空格和换行符

java - 为什么用Jsoup解析后内容不一样

java - 为什么 fn 是 :escapeXml() adding square brackets to String

java - 如何避免用户代码需要了解和实例化策略模式中的具体策略

java - 将java jsoup网络爬虫伪装成google bot来下载网页