hadoop - 在PIG袋和元组中解析

标签 hadoop apache-pig

pig 码

describe b ;   

b: {key: int,columns: {T: (alpha: chararray)}}

dump b ;

(3032,{({(name),(john),(1405416697822000)})})

(3031,{({(address),(bangalore),(1405416684062000)}),({(name),(Michael),(1405416690767000)})})

现在,我想处理这些数据并以如下形式输出:
        name       address

3031    John       <null>

3032    Michael    bangalore

请指导如何进行?我是PIG的新手。

提前致谢!!!!

最佳答案

您可以在包含列的元组上使用BagToString,并使用正则表达式找出它是名称还是地址

关于hadoop - 在PIG袋和元组中解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24755155/

相关文章:

hadoop - 使用 Apache Pig Latin 对数据进行条件求和

hadoop - 运行 Hadoop 应用程序

java - 安装Github Project Cascading/vagrant-cascading-hadoop-cluster 出错

eclipse - 如何为 Eclipse 安装 Pig 插件

hadoop - 使用 Piglatin 加载文本文件时跳过标题

hadoop - 如何使用 PIG 包含外部 jar 文件

apache-pig - pig : Receiving error while grouping

hadoop - 如何增加AWS的超时

hadoop - 如何从 `yarn application -list` 访问 Tracking-URL?

hadoop - hive 无法创建 map /减少工作