hadoop - 每个映射器执行的任务

标签 hadoop hive mapreduce mapper tez

我有一个具有多个联接的SQL。

2017-12-28 05:15:53,140 Map 1: 15/15    Map 6: 9/9  Map 7: 29/29    Map 8: 198(+2)/200  Map 9: 1/1  Reducer 2: 1/1  Reducer 3: 0(+1)/1  Reducer 4: 0(+3)/3  Reducer 5: 0(+11)/11

上面是最近几个小时的日志行。如何检查 map 8在做什么以及为什么2个 map 绘制者花了这么长时间
map 8: 198(+2)/200

对每个映射器在tez中的操作的任何想法都将有所帮助。

最佳答案

我建议您查看DAG图形 View /顶点计数器并进行分析。您将了解到为什么顶点要花费这么长时间。

关于hadoop - 每个映射器执行的任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48001948/

相关文章:

hadoop - 如何使用Cascading的CoGroup

hadoop - Hadoop JobHistoryServer不保存特定的作业

ubuntu - hadoop示例作业因网络错误而失败

hadoop - Sqoop失败,错误消息[java.lang.ClassNotFoundException:类org.apache.oozie.action.hadoop.SqoopMain未找到]

hadoop - 连接异常 : connect error: No such file or directory when trying to connect to '50010' using importtsv on hbase

python - 连接条件期间的Pyspark内存问题

hadoop - HDInsight Azure Blob存储数据更新

hadoop - xpath udf(Hive)返回所有数组元素,我想查看单独行而不是单个行中的每个数组元素

java - 如何在 Hadoop Mapreduce 中使用 MultithreadedMapper 类?

hadoop - hive是什么,是数据库吗?