<分区>
我正在寻找一个好的 Java api 来进行网络抓取。我试过 WEB-Harvest api http://web-harvest.sourceforge.net/usage.php但我认为它有点笨拙。 还有其他建议吗?
<分区>
我正在寻找一个好的 Java api 来进行网络抓取。我试过 WEB-Harvest api http://web-harvest.sourceforge.net/usage.php但我认为它有点笨拙。 还有其他建议吗?
最佳答案
我在生产环境中使用 httpunit 来完成这项任务。
关于用于网络抓取或网络挖掘的 Java API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5250410/