如果假设我有一个员工关系,其架构如名称,年龄,位置,薪水,部门..现在我想根据列的不同值拆分此关系。
就像在纽约工作的所有员工都处于一种关系中一样,在伦敦工作的所有员工都将处于一种关系中,依此类推。
最佳答案
使用SPLIT。假设您的文件是Employee.txt,并且字段以制表符分隔。
A = LOAD 'Employee.txt' USING PigStorage('\t') AS (name:chararray, age:int, location:chararray, salary:double, department:chararray);
SPLIT A INTO X IF location == 'New York', Y IF location == 'London';
DUMP X;
DUMP Y;
关于hadoop - 如何根据 pig 中列的不同值拆分关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39173473/