java - jsoup 从 <a> 标签内的标签获取文本

标签 java html parsing jsoup

我想打印<span>里面的文字<a> 里面的标签标签。 我想打印<span class="rep-score">37</span>里面的37

<a href="//stackoverflow.com"
       class="site-link js-gps-track"
       data-id="1"
       data-gps-track="
            site.switch({ target_site:1, item_type:3 }),
        site_switcher.click({ item_type:1 })">
        <div class="site-icon favicon favicon-stackoverflow" title="Stack Overflow"></div>
        Stack Overflow
            <span class="rep-score">37</span>
</a>

下面是我为此编写的代码,但没有打印任何内容。
有人可以解释一下为什么它不起作用吗?

import java.io.IOException;  
import org.jsoup.Jsoup;
import org.jsoup.nodes.Element;  
import org.jsoup.select.Elements;
import org.jsoup.*;  
import org.jsoup.nodes.*; 
import java.io.*; 

import org.jsoup.nodes.Document; 
class Repoo
{ 
    static int count=0;
    // String html;
    public static void main(String s[])throws IOException
    {
        try{
    // Document doc=Jsoup.connect("http://www.javatpoint.com/java-tutorial").get();
    // Document doc=Jsoup.connect("http://stackoverflow.com/").get();
    Document doc = Jsoup
    .connect("http://www.stackoverflow.com")
    .userAgent("Google Chrome/48.0.2564.116 m")
    .get();

    // System.out.println("doc");
    // Elements link=(Elements)doc.select("span[class]");
    // Elements select=doc.select(".site-icon favicon favicon-stackoverflow");
    Elements select=doc.select("a.site-link js-gps-track > span.rep-score");

    // Elements link=(Elements)doc.select("div");

    // Elements link = doc.select("span").first();
    // Elements link = (Elements)doc.select("span");
     // Elements link = (Elements)doc.select("a[href]");

for(Element el: select)
{
    // System.out.print("-");
    // String repo=el.attr("class");
    System.out.println(el.text());
    // System.out.println(el.ownText());




//  if(repo.equals("rep-score"))
//  {
//   System.out.println(el.attr("class"));  
//  System.out.println(el.text());
// }
    // System.out.println(el.attr("id"));
    // count++;

    // String str=el.attr("href");
    // System.out.println(str);

}
// System.out.println("<"+count+">");
}catch(IOException e){System.out.println(e);}
}
}

最佳答案

您的代码没有发送登录 Stack Overflow 所需的任何凭据,因此您收到的是未注册用户的响应页面,其中不包含任何 <span class="rep-score">37</span>标签。

你可以试试

顺便说一句,如果您想选择 <a ..>对于很少的类,只需将它们与 a.class1.class2 结合起来即可,不是a.class1 class2因为这样的选择器会尝试查找 a.class1然后<class2 ..>标签在其中。

因此,如果您能够通过 jsoup 登录并获取 doc其中确实包含 span你应该能够选择它

Elements select=doc.select("a.site-link.js-gps-track > span.rep-score");
//                                     ^-we combine few classes with `.`

关于java - jsoup 从 <a> 标签内的标签获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35829874/

相关文章:

java - 通过 applet 绘制方法使用 swing 组件

java - Android JSON only OBJECT Fetching with Iteration

android - 使用动态数组和对象处理 gson

java - 在没有 FileReference 的 Flex 中上传

JavaFX "y"在 Canvas 上的位置

html - Visual Studio 2010 不链接 CSS 文件

css - 如何根据浏览器大小创建 DIV?

javascript - 如何通过 Javascript 处理 "create"HTML 元素?

regex - 什么是上下文无关语法?

java - 使用流修改 map