hadoop - hadoop pig:在条件上加入(例如tab1.COL1 LIKE(％tab2.col2％))

如何在PIG中的条件下实现联接？
SQL等效示例:

       select * from tab1, tab2 where instr(t1.col1,t2.col1 ) > 1 ;
       select * from tab1, tab2 where f(t1.col1) =f(t2.col1)  ;

非常感谢你。
菲利波

最佳答案

截至目前，pig仅支持内部联接，外部联接和完全联接。第二个Join示例可以在Pig中实现，而不是另一个。下面是一个例子。

tab1 = LOAD 'file1' using PigStorage('|') using (col1:chararray,col2:chararray);
tab2 = LOAD 'file2' using PigStorage('|') using (col1:chararray,col2:chararray);
result = JOIN tab1 by col1, tab2 by col1;

关于hadoop - hadoop pig:在条件上加入(例如tab1.COL1 LIKE(％tab2.col2％))，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37491392/

上一篇：docker - 备份友好的 Docker 卷

下一篇：docker - 从Docker拉出时的问题

相关文章：

java - Hadoop获取文件未找到异常

php - JOIN 3 个表中的行 WHERE table.column1 = tableS.column1 = tableT.column1

apache-pig - 使用PigLatin删除重复项

Hadoop、Hive、Pig、HBase、Cassandra——什么时候用什么？

没有 HDFS 存储的 Hadoop Namenode

hadoop - 用于查询 HDFS 上的数据的纯 spark 与 spark SQL

mysql - 3 个表的多对多查询

mysql - 从表中查看历史记录并根据Mysql中的记录标记记录

hadoop - Jython 在 Pig 的 UDF 上下文中的局限性

hadoop - Pig 中的条件和