java - 解析 HTML - 仅获取表行的子集

标签 java html parsing jsoup

我有一个问题 - 我需要从网页上的 HTML 表中获取几行。我有一个方法可以将随机网站的内容作为字符串检索,但现在我需要解析它。我尝试使用这样的方法来做到这一点:

示例 HTML:

<table>
 <tr class="test">
        <td>1</td>
        <td>2</td>  
        <td>3</td>
        <td>4</td>
 </tr>
 <tr class="test2>
        <td>5</td>
        <td>6</td>  
        <td>7</td>
        <td>8</td>
   </tr>
 <tr class="test3>
        <td>9</td>
        <td>10</td>  
        <td>11</td>
        <td>12</td>
   </tr> 

对于这个 HTML 示例,我只需要值,例如:5、6、7、8。所以我有这个使用 JSoup 定义的方法:

String url = "a.html";
Document doc = Jsoup.connect(url).get();
Elements div = doc.select("table.domains-market-table.tbody.tr");

Element masthead = doc.select("table.domains-market-table").last();

但这会获取整个 div 的内容,而我想获取每个元素。谁能帮我解决这个问题吗?谢谢。

最佳答案

使用nth-of-type(n)选择器怎么样?

也许是这样的:

Elements div = doc.select("table.domains-market-table tbody tr:nth-of-type(2)");

http://www.w3schools.com/cssref/sel_nth-of-type.asp

http://jsoup.org/apidocs/org/jsoup/select/Selector.html

关于java - 解析 HTML - 仅获取表行的子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15144886/

相关文章:

c - 为什么 scanf 忽略最后一个值?

java - 使用 exp4j 并得到一个奇怪的结果

java - 如何查找字符串是否包含数字后跟特定字符串

java - for 循环中遗漏了一个数字? ( java )

java - Eclipse 中 C 代码的语法树

javascript - 发布表单时是否会提交禁用的文本字段?

javascript - 单击按钮时更改 img

java:如何使用 .txt 中的数据创建多个数组

java - 如何在 OSX 上用 Java 进行全屏显示

php - 从数据库中获取同一页面中的结果