我试图让他跟着6个 reducer 查询,但我始终只能看到启动了一个 reducer 。不确定为什么忽略task参数。请提供帮助。 (我使用的是较旧版本的Hive,因此不支持在查询中不支持)
设置mapred.reduce.tasks = 6;
从test1左外连接test2中选择concat(test1.col_0,test1.col_1),其中concat(test1.col_0,test1.col_1)= concat(test2.col_0,test2.col_1)和concat(test2.col_0,test2.col_1)一片空白;
最佳答案
重新发布评论作为答案:
您可以尝试将第一个where子句转换为ON条件吗?
select concat(test1.col_0,test1.col_1) from test1 left outer join test2 ON concat(test1.col_0,test1.col_1) = concat(test2.col_0,test2.col_1) where concat(test2.col_0,test2.col_1) IS NULL;
关于hadoop - Hive连接查询非常慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23476989/