sql - 从配置单元连接查询中选择非重复记录

标签 sql hadoop join hive hiveql

我有以下 Hive 查询:

select *
from A
left outer join B
on A.ID = B.ID
where B.ID IS NULL 

结果产生重复数据,但我只需要非重复记录。

经过一些研究,我尝试了以下查询:

select *
from (
    select *
    from A
    left outer join on B
    where A.ID = B.ID AND B.ID IS NULL ) join_result
group by jojn_result.ID

它显示了一个不明确的列引用 ID 错误。

我没有表A的列名。

请帮我确定解决方案。

谢谢。

最佳答案

嗯。 . . 选择怎么样:

Select A.*
from A left outer join
     B
     on A.ID = B.ID
where B.ID IS NULL;

我删除了 B 列,因为不需要它们。

关于sql - 从配置单元连接查询中选择非重复记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38386221/

相关文章:

SQL Server "cannot perform an aggregate function on an expression containing an aggregate or a subquery",但 Sybase 可以

c# - 将逗号分隔的字符串转换为 GetFiles SearchPattern

php - 具有 concats 和 Joins 的 SQL 在 MySQL 5.1 中工作正常,但在 5.5 上返回 NULL

mysql - 如何使用 mysql 创建表日志触发器?

hadoop - PIG 中的 NOT IN 子句

hadoop - 使用配置单元在 gcp 中跨项目访问存储桶

ruby-on-rails - 使用连接表创建方法 - 拥有并属于许多

mysql - 使用子查询和连接表更新临时表失败

sql - 优化 select 查询以返回前 100 条记录(添加 ORDER BY 会减慢查询速度)

hadoop - 在 Pig 的 Parquet 上使用 hive 表