我最近正在学习Hadoop。我在virtualbox上使用沙箱。我下载了带有mrjob框架的python脚本并运行以下命令,
python RatingsBreakdown.py -r hadoop --hadoop-streaming-jar /usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming-jar u.data
然后得到这个
Running step 1 of 1...
Not a valid JAR: /usr/hdp/2.6.3.0-235/hadoop-mapreduce/hadoop-streaming-jar
最佳答案
lib/hadoop-mapreduce/hadoop-streaming.jar
这是我电脑上的 jar ,
一个有效的jar以
.jar
结尾,您的命令有一些错误。您可以打开文件夹进行观察(使用
cd foldername)
文件名,或尝试使用tab
完成文件名。这样可以减少错误。
关于hadoop - 在运行Hadoop示例时不是有效的jar,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48486153/