hadoop - 如何根据 pig 中列的不同值拆分关系

标签 hadoop relational-database apache-pig bigdata

如果假设我有一个员工关系,其架构如名称,年龄,位置,薪水,部门..现在我想根据列的不同值拆分此关系。

就像在纽约工作的所有员工都处于一种关系中一样,在伦敦工作的所有员工都将处于一种关系中,依此类推。

最佳答案

使用SPLIT。假设您的文件是Employee.txt,并且字段以制表符分隔。

A = LOAD 'Employee.txt' USING PigStorage('\t') AS (name:chararray, age:int, location:chararray, salary:double, department:chararray);
SPLIT A INTO X IF location == 'New York', Y IF location == 'London';
DUMP X;
DUMP Y;

关于hadoop - 如何根据 pig 中列的不同值拆分关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39173473/

相关文章:

mysql - 有没有一种工具可以直观地映射MySQL中的表关系?

sql - SQL 中 IN 和 EXISTS 的使用

python - 在 CPython 中嵌入 Pig

hadoop - 运行 oozie fork 时出现 LeaseExpiredException

file - 检查RC文件的内容

apache - 下一代MapReduce的架构和设计文档

hadoop - 在启用 kerberos 的 CDH 集群中添加 Hbase 服务

java - 使用 Hadoop MapReduce 将序列号添加到文本文件中的每条记录

inheritance - 类图转换为关系模型;继承和匹配表

apache-pig - Pig - 如何将日期时间转换为字符数组