hadoop - 如何在 Pig 中加载具有可变数量字段的文件

标签 hadoop apache-pig

我有一个包含如下记录的输入文件:

Movie1     Actor 1, Actor 2, Actor 3, ......, Actor n
Movie2     Actor 1, Actor 2,.......Actor n

我想将这些数据加载到 Pig 中的一个包中

 movies = LOAD 'movies.imdb' AS (......);

我不确定如何填写我的“AS”字段,因为我的输入文件中的记录可能有可变数量的字段。

最佳答案

你可以这样做:

movies = LOAD 'movies.imdb' USING PigStorage(',');

如果记录没有固定字段,将无法使用AS

关于hadoop - 如何在 Pig 中加载具有可变数量字段的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15367580/

相关文章:

hadoop - Hadoop completebulkload提供RetriesExhaustedException

java - Configuration.set 可以在 Mapper 中使用吗?

hadoop - Pig 中的条件和

mysql - 组连接等同于 pig ?

mongodb - 从PIG写入MongoDB-错误2116-未找到mongodb模式

hadoop - 从Pig生成的CurrentTime()在Hive Datetime列中显示为NULL

linux - 自动从本地拷贝文件到Hadoop

hadoop - 运行Pig时出现错误:无法找到pig-core-h2.jar。做 'ant -Dhadoopversion=23 jar',然后再试一次

hadoop - 如果没有 hive-site.xml 文件,配置单元如何运行?

hadoop - Apache PIG-将毫秒转换为TimeStamp Unix