hadoop - 配置单元中的 percentile_approx 返回零

标签 hadoop hive

我一直在尝试检查一组用户的 percentile_approx。这背后的意图是获取数据集中前 25% 的客户。因此,为了检查这一点,我运行了以下 HIVE 查询。

select percentile_approx(amount, 0.75)
from sales

但是,此查询返回的值为 0.0。我不确定是什么问题。当我对少量记录的样本运行此查询时,结果符合预期。

任何人都可以阐明这一点吗?

注意 - 我试图在包含超过 330 万条记录的数据集中查找百分位数。

最佳答案

select percentile_approx(cast(amount as double), ARRAY(0.75))
from sales

试试这个方法

关于hadoop - 配置单元中的 percentile_approx 返回零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29389429/

相关文章:

Hadoop总订单分区器

scala - Hadoop FileUtils 无法从 Scala 在本地(Unix)文件系统上写入文件

hadoop - 在将数据放入数据节点之前,Hadoop 是否有多个本地临时文件位置?

sql - hive 中是否有等效的 sql WITH 子句?

hadoop - beeline 和 spark-shell 可以为同一个 apache spark 显示不同的数据库吗?

hadoop - Windows 上的 Spark - winutils 到底是什么,我们为什么需要它?

python - 如何将 pyspark 数据帧写入 HDFS,然后如何将其读回数据帧?

apache-spark - 读取大量数据集时 Spark 2.1 挂起

hadoop - RuntimeException MetaException(消息 :org. apache.hadoop.hive.serde2.SerDeException org.apache.hadoop.hive.hbase.HBaseSerDe

hadoop - 有Spark、hadoop、hive的兼容映射吗