hadoop - Hive查询运行的Reducer过多

标签 hadoop mapreduce hive bigdata

最近，我们已从Hadoop 2.0.0-cdh4.2.1升级到Hadoop 2.6.0-cdh5.4.2。
现在我们正在使用Hive 1.1.0-cdh5.4.2。

当我运行一个简单的配置单元查询时，它使用了太多的 reducer ，在以前的版本中它使用了120个 reducer ，而在新版本中，它使用了1100个 reducer 。

谁能告诉我为什么会这样吗？

提前致谢。

最佳答案

reducer 的数量由配置单元决定，它取决于您分配的字节数或使用的查询类型(计数的使用方式，只需选择*)。请在这里查看更多信息。 here

关于hadoop - Hive查询运行的Reducer过多，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30709807/

上一篇：hadoop - 如何在reducer中使用相同的键输出多个值？

下一篇：azure - 使用Microsoft Hive ODBC驱动程序在Azure文档数据库和HDInsight上的Hive集成方面的问题

相关文章：

hadoop - Hadoop 中的重复数据删除

logging - Hadoop日志-环境变量的值HADOOP_LOG_DIR？

hadoop - 如何定期在Hadoop上分析数据

hadoop - 是否有必要在 oozie 操作内容中保持一定的顺序？

regex - hive :当列值由定界符(〜)分隔时，将单个记录扩展为多个记录

hadoop - 有人可以向我解释 orcfiledump 的输出吗？

hadoop - hadoop和sqoop可以在不同机器上分开运行吗

java - Amazon Web 服务 EMR 文件系统

hadoop - hadoop作业提交者在计算拆分时是否考虑了记录边界？

hadoop - _logs/skip/与hadoop版本有关吗？