java - 解析 HTML - 仅获取表行的子集

我有一个问题 - 我需要从网页上的 HTML 表中获取几行。我有一个方法可以将随机网站的内容作为字符串检索，但现在我需要解析它。我尝试使用这样的方法来做到这一点:

示例 HTML:

<table>
 <tr class="test">
        <td>1</td>
        <td>2</td>  
        <td>3</td>
        <td>4</td>
 </tr>
 <tr class="test2>
        <td>5</td>
        <td>6</td>  
        <td>7</td>
        <td>8</td>
   </tr>
 <tr class="test3>
        <td>9</td>
        <td>10</td>  
        <td>11</td>
        <td>12</td>
   </tr>

对于这个 HTML 示例，我只需要值，例如:5、6、7、8。所以我有这个使用 JSoup 定义的方法:

String url = "a.html";
Document doc = Jsoup.connect(url).get();
Elements div = doc.select("table.domains-market-table.tbody.tr");

Element masthead = doc.select("table.domains-market-table").last();

但这会获取整个 div 的内容，而我想获取每个元素。谁能帮我解决这个问题吗？谢谢。

最佳答案

使用nth-of-type(n)选择器怎么样？

也许是这样的:

Elements div = doc.select("table.domains-market-table tbody tr:nth-of-type(2)");

http://www.w3schools.com/cssref/sel_nth-of-type.asp

http://jsoup.org/apidocs/org/jsoup/select/Selector.html

关于java - 解析 HTML - 仅获取表行的子集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15144886/

上一篇：java - 基数排序和计数排序

下一篇：java - StAX 找到相应的结束标签吗？

相关文章：

c - 为什么 scanf 忽略最后一个值？

java - 使用 exp4j 并得到一个奇怪的结果

java - 如何查找字符串是否包含数字后跟特定字符串

java - for 循环中遗漏了一个数字？ ( java )

java - Eclipse 中 C 代码的语法树

javascript - 发布表单时是否会提交禁用的文本字段？

javascript - 单击按钮时更改 img

java:如何使用 .txt 中的数据创建多个数组

java - 如何在 OSX 上用 Java 进行全屏显示

php - 从数据库中获取同一页面中的结果