hadoop - 可以找到或加载主类 org.apache.nutch.crawl.InjectorJob

标签 hadoop solr nutch

我将 Linux 与 Hadoop、Cloudera 和 HBase 结合使用。

你能告诉我如何纠正这个错误吗？

错误:无法找到或加载主类 org.apache.nutch.crawl.InjectorJob

以下命令给了我错误:

src/bin/nutch inject crawl/crawldb dmoz/

如果您需要任何其他信息，请找我。

最佳答案

我认为您可能错过了一两步。请确认:

您是否安装了 Apache ANT 然后导航到 nutch 文件夹并输入“ant”？
您是否设置了环境变量:
- NUTCH_JAVA_HOME:要使用的 java 实现。覆盖 JAVA_HOME。
- NUTCH_HEAPSIZE:要使用的最大堆大小，以 MB 为单位。默认值为 1000。
- NUTCH_OPTS:额外的 Java 运行时选项。多个选项必须用空格分隔。
- NUTCH_LOG_DIR:日志目录(默认:$NUTCH_HOME/logs)
- NUTCH_LOGFILE:日志文件(默认:hadoop.log)
- NUTCH_CONF_DIR:配置文件的路径 (默认值:$NUTCH_HOME/conf)。多个路径必须用冒号“:”分隔。
- JAVA_HOME
- NUTCH_JAVA_HOME
- NUTCH_HOME

如果您使用“ant”安装，那么您将在 /nutch 中获得一个名为/nutch/runtime/local 的新文件夹，这是您必须实际运行 nutch 的地方。

提示:尝试阅读 this page .

关于hadoop - 可以找到或加载主类 org.apache.nutch.crawl.InjectorJob，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28938612/

上一篇：hadoop - YARN : Application failed 2 times due to AM Container 上的 Spark 1.3.0

下一篇：hadoop - Hive 模拟不与自定义身份验证器提供程序一起使用

相关文章：

hadoop - 无法通过HBase启动Apache Phoenix

hadoop - 如何直接将 mapper-reducer 的输出发送到另一个 mapper-reducer 而无需将输出保存到 hdfs

java - 如何在我的服务器上使用 Lucene

django - 向Solr添加文档失败: [Reason: Error 404 Not Found]

hadoop - Mapreduce 中可以用combiner 代替reduce 吗？

sql - 使用描述创建 Hive 表

java - solr - 上传具有与 solr 给出的标准标签不同的标签的 xml

hadoop - Hadoop在减少步骤java.lang.NullPointerException时崩溃

java - 如何使用hadoop配置Nut 1.4？

configuration-files - 坚果爬虫 : Configure to accept only pages in English

©2024 IT工具网联系我们