hadoop teragen 不将文件存储在我指定的目录中

标签 hadoop hadoop-yarn

我做了以下事情:

hadoop jar /home/yarn/hadoop-2.4.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar teragen 10 /home/yarn/terasort-input

teragen 执行后给我看似正常的终端输出,但指定目录中没有任何内容?我做错了什么或我应该检查哪里?

最佳答案

我想通了。

输出文件存储在HDFS,我需要做

hadoop fs -ls

例如:

hadoop jar hadoop-mapreduce-examples-2.4.1.jar teragen 10 terainput

terainput 文件夹中生成以下文件,总大小为 10 x 100 字节。

yarn@master:~$ hadoop fs -ls terainput
Found 7 items
-rw-r--r--   2 yarn supergroup          0 2015-09-29 05:14 terainput/_SUCCESS
-rw-r--r--   2 yarn supergroup        200 2015-09-29 05:14 terainput/part-m-00000
-rw-r--r--   2 yarn supergroup        200 2015-09-29 05:14 terainput/part-m-00001
-rw-r--r--   2 yarn supergroup        100 2015-09-29 05:14 terainput/part-m-00002
-rw-r--r--   2 yarn supergroup        200 2015-09-29 05:13 terainput/part-m-00003
-rw-r--r--   2 yarn supergroup        200 2015-09-29 05:14 terainput/part-m-00004
-rw-r--r--   2 yarn supergroup        100 2015-09-29 05:14 terainput/part-m-00005

关于hadoop teragen 不将文件存储在我指定的目录中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32822980/

相关文章:

hadoop - 同步 Ambari 集群配置

java - MapReduce 作业 : weird output?

c++ - YARN下的C/C++程序

hadoop - 如何从每个节点访问 hadoop-yarn 应用程序上的 hdfs?

hadoop - 如何杀死所有处于 "ACCEPTED"状态的 yarn 应用程序

regex - 在Pig中使用正则表达式解析日志文件

hadoop - 配置单元 : The application won't work without a running HiveServer2

python - 如何在MRjob中获取输入文件的名称

hadoop - 作业从 RUNNING 跳转到 PREP 状态

java - 如何将 SparkContext 连接到 yarn 上的 CDH 6