hadoop - 在运行Hadoop示例时不是有效的jar

标签 hadoop mapreduce hadoop-streaming mrjob

我最近正在学习Hadoop。我在virtualbox上使用沙箱。我下载了带有mrjob框架的python脚本并运行以下命令,

python RatingsBreakdown.py -r hadoop --hadoop-streaming-jar /usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming-jar u.data

然后得到这个
Running step 1 of 1...
Not a valid JAR: /usr/hdp/2.6.3.0-235/hadoop-mapreduce/hadoop-streaming-jar

最佳答案

lib/hadoop-mapreduce/hadoop-streaming.jar  

这是我电脑上的 jar ,
一个有效的jar以.jar结尾,您的命令有一些错误。
您可以打开文件夹进行观察(使用cd foldername)文件名,或尝试使用tab完成文件名。这样可以减少错误。

关于hadoop - 在运行Hadoop示例时不是有效的jar,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48486153/

相关文章:

hadoop - Distcp - 容器运行超出物理内存限制

hadoop - Spark 优化

hadoop - Hadoop如何将程序和数据放在一起?

java - 如何在Spring-xd中上传模块?

hadoop - 在hadoop流中,我可以将文件写入到reducer的本地光盘中吗?

hadoop - 对HDFS、HBase和Hive的一些疑惑

hadoop - pig :在一类中包含多个UDF

Hadoop YARN - 如何限制请求的内存?

java - Hadoop在Maper或Reducer端使用java连接两个不同的数据集

R Hadoop映射器错误下标越界