我有以下要求 -
我在一个文件 A 中有以下记录 -
content X Y
c1 A1 A2
c2 null/empty A2
c3 A1 null/empty
c4 B1 null/empty
c5 null/empty B2
c6 B1 B2
c7 D1 D2
c8 F1 null/empty
c9 G1 null/empty
我还有另一个小文件 B,其内容为 -
X Y
A1 A2
B1 B2
现在我需要进行一组 A-B 连接,以便得到以下结果 -
content X Y
c7 D1 D2
c8 F1 null/empty
c9 G1 null/empty
我目前正在使用复制连接,因为我的 B 文件可以容纳在内存中。但是我不知道如何执行其中一个/或/或两者都加入这里。我对数据库查询不太满意。
问候, 阿迪亚
最佳答案
我认为 substract 可以在这里提供帮助:尝试一下!
https://www.tutorialspoint.com/apache_pig/apache_pig_subtract.htm https://pig.apache.org/docs/r0.12.0/func.html#subtract
关于mysql - pig 用 OR 在多个字段上复制连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42724323/