pig 码
describe b ;
b: {key: int,columns: {T: (alpha: chararray)}}
dump b ;
(3032,{({(name),(john),(1405416697822000)})})
(3031,{({(address),(bangalore),(1405416684062000)}),({(name),(Michael),(1405416690767000)})})
现在,我想处理这些数据并以如下形式输出:
name address
3031 John <null>
3032 Michael bangalore
请指导如何进行?我是PIG的新手。
提前致谢!!!!
最佳答案
您可以在包含列的元组上使用BagToString,并使用正则表达式找出它是名称还是地址
关于hadoop - 在PIG袋和元组中解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24755155/