mysql - 配置单元结果与MySql结果不同。 Hive上的联接查询返回意外结果或OK结果

标签 mysql hadoop hive

我在mysql上有一个联接查询(联接4个表)返回2行，而在Hive上则返回OK结果。因此，我在hive和mysql端分别检查了表。

双方每个表上的记录都匹配，但JOIN查询的结果不同。其他JOIN查询则不是这种情况。

我已经检查了所有看起来不错的表的目录。

当表中没有记录或表没有目录可用时，OK结果特别出现。但事实并非如此。

是关于 hive 的确定结果吗？

以下是结果的一部分:

Stage-Stage-6: Map: 2  Reduce: 1   Cumulative CPU: 22.22 sec   MAPRFS Read: 0 MAPRFS Write: 0 SUCCESS
Stage-Stage-7: Map: 2  Reduce: 1   Cumulative CPU: 24.94 sec   MAPRFS Read: 0 MAPRFS Write: 0 SUCCESS
Stage-Stage-8: Map: 2  Reduce: 1   Cumulative CPU: 22.25 sec   MAPRFS Read: 0 MAPRFS Write: 0 SUCCESS
Total MapReduce CPU Time Spent: 2 minutes 36 seconds 110 msec
OK
Time taken: 411.225 seconds
hive>

最佳答案

是。

根据报告的行为，我们可以推断出在MySQL上实现的内容与在Apache Hive上实现的内容之间存在差异。

至于差异是否是由于JOIN行为的差异引起的，此处没有足够的信息来确定为什么针对MySQL的查询和针对Hive的查询将返回不同的结果。

关于mysql - 配置单元结果与MySql结果不同。 Hive上的联接查询返回意外结果或OK结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39375000/

上一篇：java - 用一组要求的点进行距离计算

下一篇：hadoop - 如何在Apache Spark中为文本文件创建HDFS？

php - 我可以有一个只接受从 AJAX 调用绑定(bind)的新变量的持久 PDO 对象吗？

hadoop - 如何计算hadoop中flume的吞吐量

hadoop - 无法更改或删除影响很大的分区表 - 由 : MetaException: Timeout when executing 引起

sql - Hive row_number() 中的自定义排序通过窗口函数的顺序进行分区

php - Laravel PDO 异常

mysql - 在 MySQL 中存储货币值的最佳数据类型

hadoop - Mahout 转置矩阵

mysql - Sqoop 将数据从 MySQL 表复制到分区的 Hive 表

hadoop - Oozie s3 作为作业文件夹