hadoop - Hive连接查询非常慢

标签 hadoop hive hbase bigdata

我试图让他跟着6个 reducer 查询，但我始终只能看到启动了一个 reducer 。不确定为什么忽略task参数。请提供帮助。 (我使用的是较旧版本的Hive，因此不支持在查询中不支持)

设置mapred.reduce.tasks = 6;

从test1左外连接test2中选择concat(test1.col_0，test1.col_1)，其中concat(test1.col_0，test1.col_1)= concat(test2.col_0，test2.col_1)和concat(test2.col_0，test2.col_1)一片空白;

最佳答案

重新发布评论作为答案:

您可以尝试将第一个where子句转换为ON条件吗？

select concat(test1.col_0,test1.col_1) from test1 left outer join test2 ON concat(test1.col_0,test1.col_1) = concat(test2.col_0,test2.col_1) where concat(test2.col_0,test2.col_1) IS NULL;

关于hadoop - Hive连接查询非常慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23476989/

上一篇：logging - 如何在hadoop中查询日志文件

下一篇：hadoop - map 侧加入MR工作

相关文章：

hadoop - 无法访问reduce类中的reduce方法

hadoop - Hadoop-无法找到或加载主类org.apache.hadoop.hdfs.qjournal.server.JournalNode

hadoop - Hive分组并通过计算平均值来计算平均值

hbase - 如何从 HBase 获取图像

hadoop - Hbase Pig错误

algorithm - 蛮力算法可以扩展吗？

java - 如何忽略前两个字节 hdfs writeUTF 和 writeChars？

hadoop - 无法使用 java 连接到 AWS EMR 上的 hive

配置单元中的 java.sql.SQLException : org. apache.thrift.transport.TTransportException？

ubuntu - 创建表时出现 HBase 错误