java - 从 html 页面中提取元素的最佳方法？

用 Java 从 HTML 页面中提取元素的首选方法是什么？

我的 HTML 包含以下许多行:

<tr class="item-odd">
       <td class="data"><a href="http://.....">TITLE</a></td>
       <td><div class="cost">$1.99</div></td>
</tr>

该类交替使用 item-odd 和 item-even。

我需要提取:

正则表达式是正确的选择吗？

最佳答案

我会使用像 HTML Parser 这样的库为了这份工作。看看 samples和/或 javadoc .也看看 previous questions在这里。

HTML Parser非常易于使用，应该可以胜任。对于替代方案，请查看此 previous answer .

关于java - 从 html 页面中提取元素的最佳方法？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2016959/