java - 注入(inject)器作业后 Nutch 2.2.1 不继续

标签 java apache nutch

我正在学习 nuch 并尝试按照这个 tutorial 来爬行。 .我正在使用 bash shell 的 ubuntu 机器上工作。但是当我运行脚本时,执行发生了,但之后没有任何反应,

InjectorJob: starting at 2014-03-23 09:28:50
InjectorJob: Injecting urlDir: urls/seed.txt

我已经等了几个小时了,我尝试使用 sudo 运行相同的操作。也会出现同样的问题。我也尝试过使用教程中给出的默认网址。可能的错误是什么?

最佳答案

缺少的是我没有在 nutch-site.xml 中添加代理和端口详细信息,因为我是通过代理访问的。为 Ant 或 JVM 设置相同的内容是不够的

关于java - 注入(inject)器作业后 Nutch 2.2.1 不继续,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22586950/

相关文章:

java - JPA2/Hibernate 通过使用引用表/对象中的字段进行排序

apache - AWS ALB 重定向到 https

mysql - Wordpress MU+MAMP 建立数据库连接时出错

java - 使用 Appengine 进行被动 FTP

java - If和Else If之间的区别?

java - 以 HTML 格式导出 JasperReports

android - 如何通过 HTTPPost 发送图片?

linux - 无法使用nutch解析flv和epub文件内容

hadoop - 在hadoop上运行nutch时出现EOFException

java - 如何修改Solr给出的搜索结果页面?