hadoop - Hive查询运行的Reducer过多

标签 hadoop mapreduce hive bigdata

最近,我们已从Hadoop 2.0.0-cdh4.2.1升级到Hadoop 2.6.0-cdh5.4.2。
现在我们正在使用Hive 1.1.0-cdh5.4.2。

当我运行一个简单的配置单元查询时,它使用了太多的 reducer ,在以前的版本中它使用了120个 reducer ,而在新版本中,它使用了1100个 reducer 。

谁能告诉我为什么会这样吗?

提前致谢。

最佳答案

reducer 的数量由配置单元决定,它取决于您分配的字节数或使用的查询类型(计数的使用方式,只需选择*)。请在这里查看更多信息。 here

关于hadoop - Hive查询运行的Reducer过多,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30709807/

相关文章:

hadoop - Hadoop 中的重复数据删除

logging - Hadoop日志-环境变量的值HADOOP_LOG_DIR?

hadoop - 如何定期在Hadoop上分析数据

hadoop - 是否有必要在 oozie 操作内容中保持一定的顺序?

regex - hive :当列值由定界符(〜)分隔时,将单个记录扩展为多个记录

hadoop - 有人可以向我解释 orcfiledump 的输出吗?

hadoop - hadoop和sqoop可以在不同机器上分开运行吗

java - Amazon Web 服务 EMR 文件系统

hadoop - hadoop作业提交者在计算拆分时是否考虑了记录边界?

hadoop - _logs/skip/与hadoop版本有关吗?