hadoop - 如何根据 pig 中列的不同值拆分关系

标签 hadoop relational-database apache-pig bigdata

如果假设我有一个员工关系，其架构如名称，年龄，位置，薪水，部门..现在我想根据列的不同值拆分此关系。

就像在纽约工作的所有员工都处于一种关系中一样，在伦敦工作的所有员工都将处于一种关系中，依此类推。

最佳答案

使用SPLIT。假设您的文件是Employee.txt，并且字段以制表符分隔。

A = LOAD 'Employee.txt' USING PigStorage('\t') AS (name:chararray, age:int, location:chararray, salary:double, department:chararray);
SPLIT A INTO X IF location == 'New York', Y IF location == 'London';
DUMP X;
DUMP Y;

关于hadoop - 如何根据 pig 中列的不同值拆分关系，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39173473/

上一篇：hadoop - hive map 减少不起作用

下一篇：sql-server - 如何在hadoop环境中创建的表中插入多个记录

相关文章：

mysql - 有没有一种工具可以直观地映射MySQL中的表关系？

sql - SQL 中 IN 和 EXISTS 的使用

python - 在 CPython 中嵌入 Pig

hadoop - 运行 oozie fork 时出现 LeaseExpiredException

file - 检查RC文件的内容

apache - 下一代MapReduce的架构和设计文档

hadoop - 在启用 kerberos 的 CDH 集群中添加 Hbase 服务

java - 使用 Hadoop MapReduce 将序列号添加到文本文件中的每条记录

inheritance - 类图转换为关系模型；继承和匹配表

apache-pig - Pig - 如何将日期时间转换为字符数组