hadoop - Hadoop任务未完成-如何调试?

标签 hadoop mapreduce yarn

我有一个3节点Hadoop集群。我运行了一个mapreduce作业-两个节点(名称节点和一个datanode)上的映射器正常完成-但datanode2上的映射器启动,但大约半小时后超时。由于这些事实,这很奇怪:

  • 其他两个节点上的同类映射器需要1-2分钟才能完成
  • 所有三个节点都使用相同的硬件
  • datanode2上的映射器占用CPU的接近100%,因此它们实际上正在运行。

  • 知道是什么原因或如何调试的吗?

    最佳答案

    根据Hadoop架构,您可以检查DN-2的DataNode日志,以及DN-2的CPU利用率是否为100%(请确保您的程序无法在DN-2中使用)。

    关于hadoop - Hadoop任务未完成-如何调试?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36522900/

    相关文章:

    hadoop - 如何在 Pig 中拆分具有 '\t' 和 ',' 值的文本文件

    java - word.set()方法在map reduce hadoop中抛出空指针异常

    hadoop - Apache Spark完成后将杀死所有用户进程

    hadoop - 如何清理hadoop mapreduce内存使用量?

    apache-spark - 如何使用 yarn-cluster master 获取进度条(带有阶段和任务)?

    Hadoop:映射二进制文件

    java - hive 中的python udf

    javascript - 在 Mongo 中重新加入拆分 MapReduce 数组

    java - 导致Hadoop映射中出现随机播放错误的大文件减少

    hadoop - Amazon EMR 未使用所有节点