hadoop - 配置单元中的 percentile_approx 返回零

我一直在尝试检查一组用户的 percentile_approx。这背后的意图是获取数据集中前 25% 的客户。因此，为了检查这一点，我运行了以下 HIVE 查询。

select percentile_approx(amount, 0.75)
from sales

但是，此查询返回的值为 0.0。我不确定是什么问题。当我对少量记录的样本运行此查询时，结果符合预期。

任何人都可以阐明这一点吗？

注意 - 我试图在包含超过 330 万条记录的数据集中查找百分位数。

最佳答案

select percentile_approx(cast(amount as double), ARRAY(0.75))
from sales

试试这个方法

关于hadoop - 配置单元中的 percentile_approx 返回零，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29389429/

相关文章：

Hadoop总订单分区器