hadoop - 无法使用 YARN 运行 MapReduce 作业

标签 hadoop mapreduce hadoop-yarn

我正在迈出掌握 Hadoop 的第一步。我已经在分布式模式下设置了 CDH4.5(在两个虚拟机上)。我在使用 YARN 运行 MapReduce 作业时遇到问题。我可以成功启动 DistributedShell 应用程序(来自 CDH 示例),但是一旦我运行 MapReduce 作业,它就会永远卡在那里。

这就是我要发布的内容:

sudo -uhdfs yarn jar /usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 1 1

这些是资源管理器的最后一行日志:

13/12/10 23:30:02 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1386714123362_0001
13/12/10 23:30:02 INFO client.YarnClientImpl: Submitted application application_1386714123362_0001 to ResourceManager at master/192.168.122.175:8032
13/12/10 23:30:02 INFO mapreduce.Job: The url to track the job: http://master:8088/proxy/application_1386714123362_0001/
13/12/10 23:30:02 INFO mapreduce.Job: Running job: job_1386714123362_0001

一旦我运行作业,节点管理器的日志就不会收到任何新消息。

这是我在资源管理器的网页上看到的关于工作的内容:

State - ACCEPTED
FinalStatus - UNDEFINED
Progress - (progress bar in 0%) 
Tracking UI - UNASSIGNED

Apps Submitted - 1
Apps Pending - 1 
Apps Running - 0

最佳答案

我在 http://hadoop.apache.org/docs/r2.0.6-alpha/hadoop-project-dist/hadoop-common/releasenotes.html 找到了这个:

YARN-300。由 shenhong 报告并由 Sandy Ryza(资源管理器,调度程序)修复的主要错误 在 YARN-271 之后,公平调度器可以无限循环并且不调度任何应用程序。 yarn-271之后,当yarn.scheduler.fair.max.assign<=0时,当一个节点被预留时,fairScheduler会死循环,不调度任何应用。

尝试使用新版本,即上面的 2.0

关于hadoop - 无法使用 YARN 运行 MapReduce 作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20506992/

相关文章:

java - 具有多种 key 类型的Hadoop MapReduce映射器和精简器

hadoop - 如果 Reducer 的数量多于 Datanode 会发生什么

hadoop - 有人有配置单元错误代码列表吗?

hadoop - 拆分 BZip2 不起作用

java - 从 MapReduce 获取特定数据

hadoop - 以安全模式启动的节点

apache-spark - 随着表的增长,写入分区的 Hive 表需要更长的时间

bin/hadoop tasktracker 命令中的 Hadoop/cygwin 失败

c - 如何将输入文件划分为 MapReduce 的碎片/文件

hadoop - HDP 从 HDP 当前版本升级到 2.6.4 失败 - 2.6.0.3