hadoop - 如何使用配置单元获取表a中不在表b中的所有元素?

标签 hadoop hive

如何在Hive中获取A表中B表中没有的所有条目?

table A = jobs  (id, duration)
table B = other_jobs (id, duration)

我想要 A 中没有出现在 B 中的所有工作,每个工作都有一个唯一的 ID 像这样的图片说明: http://codinghorror.typepad.com/.a/6a0120a85dcdae970b012877702754970c-pi

谢谢!

最佳答案

答案是:

SELECT jobs.* 
FROM jobs 
LEFT OUTER JOIN other_jobs 
ON (jobs.id = other_jobs.id) 
WHERE other_jobs.id IS NULL;

关于hadoop - 如何使用配置单元获取表a中不在表b中的所有元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17454607/

相关文章:

shell 脚本 "syntax error: ` 意外完成。”

hadoop - 在EC2上安装hadoop

sql - 配置单元查询 : Selecting column over a partition based on a median of a different column

arrays - 如何使用 json 对象数组创建外部配置单元表

hadoop - 缺少 Hive 执行 Jar :/usr/local/hadoop/hive/lib/hive-exec-*. jar

hadoop - tsv格式文件的读取配置单元中的架构

java - 对值进行两次迭代 (MapReduce)

hadoop - 是否有像 Hadoop 这样的分布式存储,但具有 ZFS 的优势?

Hadoop 使用文件夹结构作为输入

apache-spark - 无法使用来自 Spark SQL 的现有 Hive 永久 UDF