我有一个包含如下记录的输入文件:
Movie1 Actor 1, Actor 2, Actor 3, ......, Actor n
Movie2 Actor 1, Actor 2,.......Actor n
我想将这些数据加载到 Pig 中的一个包中
movies = LOAD 'movies.imdb' AS (......);
我不确定如何填写我的“AS”字段,因为我的输入文件中的记录可能有可变数量的字段。
最佳答案
你可以这样做:
movies = LOAD 'movies.imdb' USING PigStorage(',');
如果记录没有固定字段,将无法使用AS
关于hadoop - 如何在 Pig 中加载具有可变数量字段的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15367580/