apache-pig - Pig 脚本 - 最小值、平均值、最大值

标签 apache-pig

假设我将这些放在一个文件中......

    1
    2
    3

使用 Pig 脚本,我怎样才能得到这个(每行的数字、最小值、平均值、最大值)?

    1,1,2,3
    2,1,2,3
    3,1,2,3

请告诉我 Pig 脚本。我可以使用 Pig 内置函数获取 MIN、AVG、MAX,但无法在每一行中获取全部内容。

谢谢 娜迦

最佳答案

使用TOBAG内置 UDF 将您的字段放入包中,然后您可以在该包上使用 MINAVGMAX 函数。您在单个记录上使用所有三个汇总函数应该不会有任何问题。

关于apache-pig - Pig 脚本 - 最小值、平均值、最大值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20895899/

相关文章:

mysql - 无法运行 PIG

hadoop - apache pig 中的 "substr"语句

java - 为什么很多项目只提供源码不提供jar包下载?

hadoop - 使用 cassandra 和 pig 进行数据清理

hadoop - 如何为制表符分隔的数据编写PIG UDF并在左侧添加时间戳?

hadoop - 如何使用 Pig Latin 从 AWS S3 加载数据

hadoop - 使用 Pig 在 HBase 中为列族添加可变数量的列

hadoop - Pig Latin 语法错误

hadoop - 如何使用水槽从大型机文件中提取数据到hadoop HDFS

amazon-s3 - 无法从 S3 加载数据