我有这个文件,其中包含 Hadoop 中的数据列表。我构建了一个简单的 Pig 脚本,它通过 id number 等分析文件...
我要寻找的最后一步是:我想为每个唯一的 id 号码 创建(存储)一个文件。所以这应该取决于一个组步骤......但是,我还不知道这是否可能(也许有一个自定义商店模块?)。
有什么想法吗?
谢谢
丹妮尔
最佳答案
同时牢记虚弱所说的话,MultiStorage , 在 PiggyBank 中,似乎就是您要找的东西。
关于hadoop - 使用 Hadoop Pig 生成多个输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5272552/