Hadoop 仅使用主节点处理数据

标签 hadoop mapreduce

我设置了一个 Hadoop 2.5 集群，其中有 1 个主节点(名称节点和辅助名称节点和数据节点)和 2 个从节点(数据节点)。所有机器都使用 Linux CentOS 7 - 64 位。当我运行我的 MapReduce 程序 (wordcount) 时，我只能看到主节点正在使用额外的 CPU 和 RAM。从节点没有做任何事情。

我已经检查了所有名称节点的日志，从节点上没有任何问题。资源管理器正在运行，所有从节点都可以看到资源管理器。 Datanodes 在分布式数据存储方面工作，但我看不到分布式数据处理的任何迹象。我是否必须以其他方式配置 xml 配置文件，以便在我运行 MapReduce 作业时所有机器都可以处理数据？

谢谢

最佳答案

确保您在主节点网络文件中提到了 daanodes 的 IP 地址。此外，集群中的每个节点都应该包含其他机器的 IP 地址。除此之外，检查包含文件是否包含相关的数据节点条目。

关于Hadoop 仅使用主节点处理数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25945312/

上一篇：hadoop - 配置 MapReduce 程序以仅在现有程序中运行 reducer

下一篇：hadoop - 在 Pig 脚本中获取意外符号

相关文章：

hadoop - hbase importtsv未在cloudera中运行

hadoop - 从 Teradata 拉取时 LOAD HADOOP 失败

java - 如何减少Hadoop中从节点的心跳时间

hadoop - YARN接受后，MapReduce作业失败

java - InvalidInputException 将文件加载到 Hbase MapReduce 时

Hadoop 基础的 MapReduce 程序中的 java.lang.NoClassDefFoundError

sql-server - 从 SQL Server 2016 或更高版本查询 HIVE 表

hadoop - 在 hive-0.10.0 中查找 30 天前的日期

mysql - 如何将存储过程导入HDFS

hadoop - Mapreduce 示例中的 TotalOrderPartitioner