hadoop - yarn hadoop 2.4.0 : info message: ipc. 客户端重试连接到服务器

我已经寻找了两天的解决方案。但没有任何效果。

首先，我对整个 hadoop/yarn/hdfs 主题很陌生，想要配置一个小型集群。

每次我从mapreduce-examples.jar运行示例时，上面的消息都不会出现有时 teragen 有效，有时无效。在某些情况下，整个作业失败，而在其他情况下，作业成功完成。有时作业会失败，而不打印上面的消息。

14/06/08 15:42:46 INFO ipc.Client: Retrying connect to server: FQDN-HOSTNAME/XXX.XX.XX.XXX:53022. Already tried 2 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=3, sleepTime=1000 MILLISECONDS)

此消息已打印 30 次。每次启 Action 业时，端口(在代码示例中:53022)也会发生变化。如果作业成功完成，这是打印

14/06/08 15:34:20 INFO mapred.ClientServiceDelegate: Application state is completed. FinalApplicationStatus=SUCCEEDED. Redirecting to job history server
14/06/08 15:34:20 INFO mapreduce.Job: Job job_1402234146062_0002 running in uber mode : false
14/06/08 15:34:20 INFO mapreduce.Job:  map 100% reduce 100%
14/06/08 15:34:20 INFO mapreduce.Job: Job job_1402234146062_0002 completed successfully

如果失败，则会显示此内容。

INFO mapreduce.Job: Job job_1402234146062_0005 failed with state FAILED due to: Task failed task_1402234146062_0005_m_000002
Job failed as tasks failed. failedMaps:1 failedReduces:0

在这种情况下，某些任务失败。但在nodemanager、datanode、resourcemanager...的日志文件中找不到原因或消息。

INFO mapreduce.Job: Task Id : attempt_1402234146062_0006_m_000002_1, Status : FAILED

有关我的配置的其他信息: 使用的操作系统:centOS 6.5 Java版本:OpenJDK运行时环境(rhel-2.4.7.1.el6_5-x86_64 u55-b13) OpenJDK 64 位服务器虚拟机(内部版本 24.51-b03，混合模式)

yarn 站点.xml

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.nodemanager.address</name>
                <value>FQDN-HOSTNAME:8050</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                  <name>yarn.nodemanager.localizer.address</name>
                  <value>FQDN-HOSTNAME:8040</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
                  <name>yarn.resourcemanager.resource-tracker.address</name>
                  <value>FQDN-HOSTNAME:8025</value>
        </property>
        <property>
                  <name>yarn.resourcemanager.scheduler.address</name>
                  <value>FQDN-HOSTNAME:8030</value>
        </property>
        <property>
                  <name>yarn.resourcemanager.address</name>
                  <value>FQDN-HOSTNAME:8032</value>
        </property>
</configuration>

hdfs-site.xml

    <configuration>
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property>
        <property>
                   <name>dfs.permissions </name>
                   <value>false </value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:///var/data/hadoop/hdfs/nn</value>
        </property>
        <property>
                <name>fs.checkpoint.dir</name>
                <value>file:///var/data/hadoop/hdfs/snn</value>
        </property>
        <property>
                <name>fs.checkpoint.edits.dir</name>
                <value>file:///var/data/hadoop/hdfs/snn</value>
                <name>fs.checkpoint.edits.dir</name>
                <value>file:///var/data/hadoop/hdfs/snn</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:///var/data/hadoop/hdfs/dn</value>
        </property>
</configuration>

mapred-site.xml

<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <property>
                <name>mapreduce.cluster.temp.dir</name>
                <value>/mapred/tempDir</value>
        </property>
        <property>
                <name>mapreduce.cluster.local.dir</name>
                <value>/mapred/localDir</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>FQDN-HOSTNAME:10020</value>
        </property>
</configuration>

希望有人能帮助我。 :) 谢谢你，诺曼

最佳答案

作业有时会成功完成，因为当您有一个 reducer 并且该减速任务偶然被发送到工作节点管理器时，它就会成为成功的作业。

您必须确保 FQDN-HOSTNAME 在 slaves 文件中以完全相同的方式写入。如果我没记错的话，我的解决方案是删除 /etc/hosts 中主机名映射的条目，即像这样注释掉:

#127.0.0.1    FQDN-HOSTNAME

关于hadoop - yarn hadoop 2.4.0 : info message: ipc. 客户端重试连接到服务器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24107091/

hadoop - yarn hadoop 2.4.0 : info message: ipc. 客户端重试连接到服务器

上一篇：hadoop - CDH5 上的启动/停止 hadoop hdfs/mapred 脚本在哪里

下一篇：java - 空指针异常 - Hadoop Mapreduce 作业