hadoop - PIG中的输出格式有问题

标签 hadoop apache-pig

这是我在PIG中编写的代码。
我想像这样打印输出:

John, 3.850000023841858
Mary, 3.925000011920929

而不是低于输出
DUMP C;
    ({(John),(John),(John),(John)},3.850000023841858)
    ({(Mary),(Mary),(Mary),(Mary)},3.925000011920929)

A =加载'student.txt'AS(name:chararray,term:chararray,gpa:float);
DUMP A;
(John,fl,3.9F)
(John,wt,3.7F)
(John,sp,4.0F)
(John,sm,3.8F)
(Mary,fl,3.8F)
(Mary,wt,3.9F)
(Mary,sp,4.0F)
(Mary,sm,4.0F)

B = GROUP A BY name;

DUMP B;
(John,{(John,fl,3.9F),(John,wt,3.7F),(John,sp,4.0F),(John,sm,3.8F)})
(Mary,{(Mary,fl,3.8F),(Mary,wt,3.9F),(Mary,sp,4.0F),(Mary,sm,4.0F)})

C = FOREACH B GENERATE A.name, AVG(A.gpa);

DUMP C;
({(John),(John),(John),(John)},3.850000023841858)
({(Mary),(Mary),(Mary),(Mary)},3.925000011920929)

最佳答案

代替A.name使用group

C = FOREACH B GENERATE group, AVG(A.gpa);

关于hadoop - PIG中的输出格式有问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45535932/

相关文章:

hadoop - 使用 Hive 从文件中收集数据

hadoop - 在 hadoop 中查看 gzip 文件内容

hadoop - hadoop中的hdfs如何利用数据节点中 block 的空闲空间?

hadoop - 如何在 PigLatin 的 SUM 中计算乘法

python - 如何对大型数据集进行分组

java - MapReduce 中的全局变量或属性?

hadoop - Hive 上的自定义 Map Reduce 程序,规则是什么?输入和输出如何?

hadoop - 如何从 HBase 表中获取值?

hadoop - 对 PIG Latin 中的记录进行分组和计数

xpath - 如何在 Pig 中使用 Xpath 提取 xml 属性?