hadoop - 如何在 Pig Latin 中的两列上进行外部连接

标签 hadoop apache-pig

我像这样对 Pig 中的单个列进行外连接

result = JOIN A by id LEFT OUTER, B by id;

我如何加入两列,比如 -

WHERE A.id=B.id AND A.name=B.name

什么是 pig 当量?我在 pig 手册中找不到任何示例...有帮助吗?

最佳答案

上面的答案其实是INNER join,正确的pig语句应该是:

 join a by (id, name) LEFT OUTER, b by (id, name) 

关于hadoop - 如何在 Pig Latin 中的两列上进行外部连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8038802/

相关文章:

hadoop - 将带有 .tsv 文件的 HDFS 目录映射到 Hive

hadoop - hadoop编码标准

hadoop - 我试图为hadoop-1.1.2运行map reduce示例程序。但我有以下错误

hadoop - 如果文件具有不同的列数,如何将数据加载到同一个 Hive 表

java - 为 Pig 设置 eclipse

apache-pig - pig -如何在JOIN之后引用FOREACH中的列?

hadoop - 宏在foreach中不起作用?

hadoop - PIG脚本如何

linux - 稳定排序一个巨大的文件

hadoop - master.HMaster : Failed to become active master SIMPLE authentication is not enabled. 可用:[TOKEN]