我正在学习 nuch 并尝试按照这个 tutorial 来爬行。 .我正在使用 bash shell 的 ubuntu 机器上工作。但是当我运行脚本时,执行发生了,但之后没有任何反应,
InjectorJob: starting at 2014-03-23 09:28:50
InjectorJob: Injecting urlDir: urls/seed.txt
我已经等了几个小时了,我尝试使用 sudo
运行相同的操作。也会出现同样的问题。我也尝试过使用教程中给出的默认网址。可能的错误是什么?
最佳答案
缺少的是我没有在 nutch-site.xml 中添加代理和端口详细信息,因为我是通过代理访问的。为 Ant 或 JVM 设置相同的内容是不够的
关于java - 注入(inject)器作业后 Nutch 2.2.1 不继续,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22586950/