hadoop - 无法计算 MAX

标签 hadoop apache-pig

设置数据

mkdir data
echo -e "1\n2\n3\n4\n8\n4\n3\n6" > data/data.txt

以本地模式启动 Pig

pig -x local

脚本

a = load 'data' Using PigStorage() As (value:int);
b = foreach a generate MAX(value);
dump b;

错误 org.apache.pig.tools.grunt.Grunt - 错误 1045:无法推断 org.apache.pig.builtin.MAX 的匹配函数,因为有多个或没有一个适合。请使用显式强制转换。

最佳答案

刚刚找到答案,在调用函数之前只需要使用 GROUP ALL ...有点感觉错误消息可能更清晰一点...

a = load 'data' Using PigStorage() As (value:int);
b = GROUP a ALL;
c = foreach b generate MAX(a.value);
dump c;

> 8

关于hadoop - 无法计算 MAX,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11900035/

相关文章:

hadoop - 使用列表数据类型将数据从Pig插入Cassandra失败

hadoop - Pig 命令问题 'Failed to read data from "/pigdata/student"'

在 Pig 中旋转

hadoop - 使用 PIG 将文件加载到 Hbase

Hadoop 作业在本地模式下运行。但是 Oozie 作业以分布式模式运行

java - Hadoop-MapReduce不减少

python - 使用 python 将 syslog 输出处理为 csv

hadoop - 根据APACHE PIG中的条件加载数据

hadoop - 从映射器写入单个文件

hadoop - Hive始终以本地模式运行