hadoop - 从 PIG JOIN 的其他关系中选择一个关系所有字段和一个或两个,如何?

标签 hadoop apache-pig

A = load '$input1' using pigStorage() AS (a,b,c,d,e)
B = load '$input2' using pigStorage() AS (a,b1,c1,d1,e1)
C = JOIN A by a, B by a; 
D = do something;

'D' 应该是格式 (a,b,c,d,e,b1)

如何实现?

最佳答案

D = FOREACH C GENERATE A::a .. A::e, B::b AS b1;

关于hadoop - 从 PIG JOIN 的其他关系中选择一个关系所有字段和一个或两个,如何?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22224648/

相关文章:

apache-pig - 如何在 Pig 中指定任务超时?

substring - pig IF 条件

apache-pig - 'group as' 在 Pig 中是如何工作的?

hadoop - PIG UDF 处理拆分成不同映射器的多行元组

azure - 在Azure中通过.NET应用程序流式传输

hadoop - 尝试在显式传递中使用滞后函数时出错 [Hive] [SAS over Hadoop]

Hadoop namenode 为什么总是需要格式化?

java - Spark 1.5.2 和 SLF4J StaticLoggerBinder

hadoop - Cascalog first-n - 无法连接谓词

hadoop - pig SUM FOREACH GROUP ClassCastException : java. lang.String 无法转换为 java.lang.Number