hadoop - 如果我在 hive 中的所有列上使用distinct,将运行多少个reducer?

标签 hadoop hive reducers tez

我正在运行一个配置单元查询,其中对所有选定列应用了distinct,并且我注意到为运行同一查询而启动了两个reduce。谁能解释我背后的原因?

 Example query:

> SELECT distinct
       seg.col1,
       seg.col2,
       seg.col3
FROM user.ag_user seg
Where ‘2018-05-06’ between start_date and end_date limit 5;

最佳答案

它可能比x查询导致y reducers更为复杂

此答案更详细地介绍了默认情况(比我能做到的更好)

Default number of reducers

关于hadoop - 如果我在 hive 中的所有列上使用distinct,将运行多少个reducer?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50227988/

相关文章:

hadoop - 显示配置单元 View 的 SQL 定义

reactjs - 如何清理 Redux 的状态?

hadoop - Hadoop 中键的数量限制是多少?

Hadoop - 当多个进程试图同时写入同一个文件时会发生什么?

hadoop - WebHDFS OPEN 命令返回空结果

java - 在 MapReduce 中读取文件的问题

sql - 在 Hive 中加入日期范围内的表

hadoop - 将模式作为第一行插入到配置单元查询的结果中

javascript - React-redux 检查触发了哪个操作

hadoop - Hbase 与 Hive 的比较