java - 如何在 Windows 上的 eclipse 中运行 nutch 1.9?

标签 java eclipse hadoop nutch

我想在 Windows 上的 Eclipse 中运行 Nutch 1.9。我遵循了 http://wiki.apache.org/nutch/RunNutchInEclipse 中的教程并在 Eclipse 中打开项目。

但是当我运行 Nutch 时,出现以下错误:

2014-09-19 17:45:48,039 INFO  crawl.Injector (Injector.java:inject(283)) - Injector: starting at 2014-09-19 17:45:48
2014-09-19 17:45:48,043 INFO  crawl.Injector (Injector.java:inject(284)) - Injector: crawlDb: K:/kumar/Nutch/apache-nutch-1.9/crawlresult
2014-09-19 17:45:48,043 INFO  crawl.Injector (Injector.java:inject(285)) - Injector: urlDir: K:/kumar/Nutch/apache-nutch-1.9/urls
2014-09-19 17:45:48,043 INFO  crawl.Injector (Injector.java:inject(294)) - Injector: Converting injected urls to crawl db entries.
2014-09-19 17:45:48,207 INFO  jvm.JvmMetrics (JvmMetrics.java:init(71)) - Initializing JVM Metrics with processName=JobTracker, sessionId=
2014-09-19 17:45:48,252 WARN  mapred.JobClient (JobClient.java:configureCommandLineOptions(661)) - No job jar file set.  User classes may not be found. See JobConf(Class) or JobConf#setJar(String).
2014-09-19 17:45:48,268 INFO  mapred.FileInputFormat (FileInputFormat.java:listStatus(192)) - Total input paths to process : 1
2014-09-19 17:45:48,485 INFO  mapred.JobClient (JobClient.java:monitorAndPrintJob(1275)) - Running job: job_local_0001
2014-09-19 17:45:48,487 INFO  mapred.FileInputFormat (FileInputFormat.java:listStatus(192)) - Total input paths to process : 1
2014-09-19 17:45:48,526 INFO  mapred.MapTask (MapTask.java:runOldMapper(347)) - numReduceTasks: 0
2014-09-19 17:45:48,565 INFO  plugin.PluginRepository (PluginManifestParser.java:parsePluginFolder(87)) - Plugins: looking in: K:\Nutch\apache-nutch-1.9\plugins
2014-09-19 17:45:48,566 WARN  plugin.PluginRepository (PluginManifestParser.java:parsePluginFolder(101)) - java.io.FileNotFoundException: K:\Nutch\apache-nutch-1.9\plugins\creativecommons\plugin.xml (The system cannot find the file specified)

似乎是 Hadoop 导致了错误。我不知道如何解决这个问题。我知道 Nutch 需要 Unix 环境。但是,我想在 Windows 上的 Eclipse 中运行 Nutch。

谁能帮我解决这个问题?

最佳答案

下载 cygwin,然后将其添加到环境变量的路径中。我认为你的问题是由 Windows 无法调用 unix native 命令这一事实引起的。这就是我所做的,但是一旦我解决了那个问题,我就遇到了其他问题。

关于java - 如何在 Windows 上的 eclipse 中运行 nutch 1.9?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25933941/

相关文章:

java - 表不是由 Hibernate 创建的

java - 导出项目 eclipse java 时制作多个可运行文件

android - 如何处理 Eclipse 一直卡在我的工作区上的问题?

java - Servlet 在 Eclipse 中运行时显示 404 错误

hadoop - 使我下面的 Pig 代码变得简单的建议

hadoop - 如何在hadoop中显示确切的工作详细信息?

python - 在 pig 中注册 python UDF 时遇到 IOException。文件 helloworld.py 不存在

java - 使用适配器应对两种不同情况

java - 使用线程进行堆排序

java - 将 AppCompactActivity 中的布局元素设置为 fragment