Hadoop 仅使用主节点处理数据

标签 hadoop mapreduce

我设置了一个 Hadoop 2.5 集群,其中有 1 个主节点(名称节点和辅助名称节点和数据节点)和 2 个从节点(数据节点)。所有机器都使用 Linux CentOS 7 - 64 位。当我运行我的 MapReduce 程序 (wordcount) 时,我只能看到主节点正在使用额外的 CPU 和 RAM。从节点没有做任何事情。

我已经检查了所有名称节点的日志,从节点上没有任何问题。资源管理器正在运行,所有从节点都可以看到资源管理器。 Datanodes 在分布式数据存储方面工作,但我看不到分布式数据处理的任何迹象。我是否必须以其他方式配置 xml 配置文件,以便在我运行 MapReduce 作业时所有机器都可以处理数据?

谢谢

最佳答案

确保您在主节点网络文件中提到了 daanodes 的 IP 地址。此外,集群中的每个节点都应该包含其他机器的 IP 地址。 除此之外,检查包含文件是否包含相关的数据节点条目。

关于Hadoop 仅使用主节点处理数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25945312/

相关文章:

hadoop - hbase importtsv未在cloudera中运行

hadoop - 从 Teradata 拉取时 LOAD HADOOP 失败

java - 如何减少Hadoop中从节点的心跳时间

hadoop - YARN接受后,MapReduce作业失败

java - InvalidInputException 将文件加载到 Hbase MapReduce 时

Hadoop 基础的 MapReduce 程序中的 java.lang.NoClassDefFoundError

sql-server - 从 SQL Server 2016 或更高版本查询 HIVE 表

hadoop - 在 hive-0.10.0 中查找 30 天前的日期

mysql - 如何将存储过程导入HDFS

hadoop - Mapreduce 示例中的 TotalOrderPartitioner