hadoop - 如何从 .t​​sv 文件加载 Pig 中的数据?

标签 hadoop apache-pig

我有一个 .TSV 文件,其中包含 HDFS 中的数据,但我无法将其加载到 Pig 中。 我使用的命令是“

A = load 'file_location' as (name:chararray, age:int, gpa:float);
B = foreach A generate (name, age);
DUMP B;

Error returned : Unable to find operator for alias A

最佳答案

如果您不指定分隔符 PIG 使用默认的“,”作为加载文件的分隔符。因此您的加载语句失败。您必须明确指定分隔符“\t”。

A = LOAD 'file_location' USING PigStorage('\t') AS (name:chararray, age:int, gpa:float);

关于hadoop - 如何从 .t​​sv 文件加载 Pig 中的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44287081/

相关文章:

ubuntu - pig 命令错误

hadoop - 从 groovy 脚本执行 Hadoop 文件系统命令时没有错误但行为奇怪

hadoop - 当 reducer 数量较少时,键是否唯一

hadoop - 计算 pig 列中单词的出现次数

hadoop - 在 pig 中使用加载数据流步骤与使用(使用 PigStorage)和不使用它有什么区别?

java - Windows 中的 Hadoop 错误

java - 如何从另一个 hadoop 作业提交 hadoop 作业

hadoop - 如何在 pig latin 中选择具有最小值的记录

mapreduce - 通过 Pig 提交 map/reduce 作业时捆绑 jars?

hadoop - Pig "Max"命令用于 pig-0.12.1 和 pig-0.13.0 与 Hadoop-2.4.0