hadoop - yarn hadoop 2.4.0 : info message: ipc. 客户端重试连接到服务器

标签 hadoop mapreduce ipc hadoop-yarn

我已经寻找了两天的解决方案。但没有任何效果。

首先,我对整个 hadoop/yarn/hdfs 主题很陌生,想要配置一个小型集群。

每次我从mapreduce-examples.jar运行示例时,上面的消息都不会出现 有时 teragen 有效,有时无效。 在某些情况下,整个作业失败,而在其他情况下,作业成功完成。有时作业会失败,而不打印上面的消息。

14/06/08 15:42:46 INFO ipc.Client: Retrying connect to server: FQDN-HOSTNAME/XXX.XX.XX.XXX:53022. Already tried 2 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=3, sleepTime=1000 MILLISECONDS)

此消息已打印 30 次。每次启 Action 业时,端口(在代码示例中:53022)也会发生变化。 如果作业成功完成,这是打印

14/06/08 15:34:20 INFO mapred.ClientServiceDelegate: Application state is completed. FinalApplicationStatus=SUCCEEDED. Redirecting to job history server
14/06/08 15:34:20 INFO mapreduce.Job: Job job_1402234146062_0002 running in uber mode : false
14/06/08 15:34:20 INFO mapreduce.Job:  map 100% reduce 100%
14/06/08 15:34:20 INFO mapreduce.Job: Job job_1402234146062_0002 completed successfully

如果失败,则会显示此内容。

INFO mapreduce.Job: Job job_1402234146062_0005 failed with state FAILED due to: Task failed task_1402234146062_0005_m_000002
Job failed as tasks failed. failedMaps:1 failedReduces:0

在这种情况下,某些任务失败。但在nodemanager、datanode、resourcemanager...的日志文件中找不到原因或消息。

INFO mapreduce.Job: Task Id : attempt_1402234146062_0006_m_000002_1, Status : FAILED

有关我的配置的其他信息: 使用的操作系统:centOS 6.5 Java版本:OpenJDK运行时环境(rhel-2.4.7.1.el6_5-x86_64 u55-b13) OpenJDK 64 位服务器虚拟机(内部版本 24.51-b03,混合模式)

yarn 站点.xml

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.nodemanager.address</name>
                <value>FQDN-HOSTNAME:8050</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                  <name>yarn.nodemanager.localizer.address</name>
                  <value>FQDN-HOSTNAME:8040</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
                  <name>yarn.resourcemanager.resource-tracker.address</name>
                  <value>FQDN-HOSTNAME:8025</value>
        </property>
        <property>
                  <name>yarn.resourcemanager.scheduler.address</name>
                  <value>FQDN-HOSTNAME:8030</value>
        </property>
        <property>
                  <name>yarn.resourcemanager.address</name>
                  <value>FQDN-HOSTNAME:8032</value>
        </property>
</configuration>

hdfs-site.xml

    <configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property>
        <property>
                   <name>dfs.permissions </name>
                   <value>false </value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:///var/data/hadoop/hdfs/nn</value>
        </property>
        <property>
                <name>fs.checkpoint.dir</name>
                <value>file:///var/data/hadoop/hdfs/snn</value>
        </property>
        <property>
                <name>fs.checkpoint.edits.dir</name>
                <value>file:///var/data/hadoop/hdfs/snn</value>
                <name>fs.checkpoint.edits.dir</name>
                <value>file:///var/data/hadoop/hdfs/snn</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:///var/data/hadoop/hdfs/dn</value>
        </property>
</configuration>

mapred-site.xml

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <property>
                <name>mapreduce.cluster.temp.dir</name>
                <value>/mapred/tempDir</value>
        </property>
        <property>
                <name>mapreduce.cluster.local.dir</name>
                <value>/mapred/localDir</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>FQDN-HOSTNAME:10020</value>
        </property>
</configuration>

希望有人能帮助我。 :) 谢谢你, 诺曼

最佳答案

作业有时会成功完成,因为当您有一个 reducer 并且该减速任务偶然被发送到工作节点管理器时,它就会成为成功的作业。

您必须确保 FQDN-HOSTNAMEslaves 文件中以完全相同的方式写入。如果我没记错的话,我的解决方案是删除 /etc/hosts 中主机名映射的条目,即像这样注释掉:

#127.0.0.1    FQDN-HOSTNAME

关于hadoop - yarn hadoop 2.4.0 : info message: ipc. 客户端重试连接到服务器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24107091/

相关文章:

java - hadoop版本与Java版本的最佳匹配是什么

java - 如何使用 java 读取 spark 中的 xls 和 xlsx 文件?

hadoop - mapreduce 的哪个部分/类是停止 reduce 任务的逻辑实现

c - 从 C system() 函数返回字符串

c - 如何知道 vfork 函数中的父进程或子进程

c - 基本的unix服务器-客户端IPC(消息队列)问题

hadoop - Pig DUMP 被困在 GROUP 中

hadoop - Azkaban Gradle的构建失败TestTimedOutException

hadoop - elasticsearch只插入了10个文档

java - 在带有HBase的hadoop中使用外部jar