用 Java 从 HTML 页面中提取元素的首选方法是什么?
我的 HTML 包含以下许多行:
<tr class="item-odd">
<td class="data"><a href="http://.....">TITLE</a></td>
<td><div class="cost">$1.99</div></td>
</tr>
该类交替使用 item-odd
和 item-even。
我需要提取:
- 网址
- 职位
- 价格
正则表达式是正确的选择吗?
最佳答案
我会使用像 HTML Parser 这样的库为了这份工作。看看 samples和/或 javadoc .也看看 previous questions在这里。
HTML Parser非常易于使用,应该可以胜任。对于替代方案,请查看此 previous answer .
关于java - 从 html 页面中提取元素的最佳方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2016959/