hadoop - hadoop pig:在条件上加入(例如tab1.COL1 LIKE(%tab2.col2%))

标签 hadoop join apache-pig

如何在PIG中的条件下实现联接?
SQL等效示例:

       select * from tab1, tab2 where instr(t1.col1,t2.col1 ) > 1 ;
       select * from tab1, tab2 where f(t1.col1) =f(t2.col1)  ;

非常感谢你。
菲利波

最佳答案

截至目前,pig仅支持内部联接,外部联接和完全联接。第二个Join示例可以在Pig中实现,而不是另一个。下面是一个例子。

tab1 = LOAD 'file1' using PigStorage('|') using (col1:chararray,col2:chararray);
tab2 = LOAD 'file2' using PigStorage('|') using (col1:chararray,col2:chararray);
result = JOIN tab1 by col1, tab2 by col1;

关于hadoop - hadoop pig:在条件上加入(例如tab1.COL1 LIKE(%tab2.col2%)),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37491392/

相关文章:

java - Hadoop获取文件未找到异常

php - JOIN 3 个表中的行 WHERE table.column1 = tableS.column1 = tableT.column1

apache-pig - 使用PigLatin删除重复项

Hadoop、Hive、Pig、HBase、Cassandra——什么时候用什么?

没有 HDFS 存储的 Hadoop Namenode

hadoop - 用于查询 HDFS 上的数据的纯 spark 与 spark SQL

mysql - 3 个表的多对多查询

mysql - 从表中查看历史记录并根据Mysql中的记录标记记录

hadoop - Jython 在 Pig 的 UDF 上下文中的局限性

hadoop - Pig 中的条件和